m.lom599程序设计丛书

Spark机器学习(第2版) [预售]

[印]拉结帝普•杜瓦 , [印]曼普利特•辛格•古特拉 , [南非]尼克•彭特里思 (作者) 蔡立宇 , 黄章帅 , 周济民 (译者)
• Spark项目管理委员会成员作品
• 注重技术实践,通过大量实例演示如何创建有用的机器学习系统
本书结合案例研究讲解Spark 在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、降维等经典机器学习算法及其实际应用。第2版新增了有关机器学习数学基础以及Spark ML Pipeline API 的章节,内容更加系统、全面、与时俱进。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

2018最受欢迎电子书 榜单出炉

技术类top20!/ 非技术类top20!

电子书
¥49.99
格式
mobi   pdf

纸质书
¥84.15 ¥99.00

出版信息

  • 书  名Spark机器学习(第2版)
  • 系列书名m.lom599程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 温雪
  • 书  号978-7-115-49783-3
  • 定  价99.00 元
  • 页  数375
  • 印刷方式单色
  • 开  本16开
  • 出版状态正在印刷
  • 原书名Machine Learning with Spark,2E
  • 原书号9781785889936

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

Apache Spark是分布式计算框架,专为满足低延迟任务和内存数据存储的需求而优化。现有的并行计算框架,鲜有能在兼顾速度、可扩展性、内存处理和容错性的同时,还提供灵活、表达力丰富的API的。Apache Spark就是这样一个难得的框架。

本书简要介绍了Spark基础知识,重在通过详细的例子和现实应用来讲解常见机器学习模型,并涉及大规模文本数据的处理、Spark Streaming下的在线机器学习和模型评估方法,以及使用Spark ML Pipeline API创建和调试机器学习流程等。第2版经过全面修订,新增有关机器学习数学基础以及Spark ML Pipeline API的章节,内容更加系统、全面、与时俱进,适合所有欲借助Spark来实现常见机器学习应用的开发者。

• Spark以及机器学习基础知识介绍。
• 获取公开的机器学习数据集,使用Spark对数据进行载入、处理、清理和转换。
• 借助Spark机器学习库,利用协同过滤、分类、回归、聚类和降维等常见的机器学习模型来编写程序。
• 了解大规模文本数据的处理方法,包括特征提取和将文本数据作为机器学习模型的输入。
• 探索在线学习方法,利用Spark Streaming进行在线学习和模型评估。
• 使用Spark ML Pipeline API创建和调试机器学习流程。

目录

版权声明 阅读
前言 阅读
第 1 章 Spark的环境搭建与运行 阅读
第 2 章 机器学习的数学基础
第 3 章 机器学习系统设计
第 4 章 Spark上数据的获取、处理与准备
第 5 章 Spark构建推荐引擎
第 6 章 Spark构建分类模型
第 7 章 Spark构建回归模型
第 8 章 Spark构建聚类模型
第 9 章 Spark应用于数据降维
第 10 章 Spark高级文本处理技术
第 11 章 Spark Streaming实时机器学习
第 12 章 Spark ML Pipeline API

作者介绍

拉结帝普•杜瓦(Rajdeep Dua)

Salesforce公司工程主管,致力于打造云计算和人工智能团队。曾参与Google的大数据分析工具BigQuery的宣传团队。在云计算、大数据分析和机器学习领域有近20年的经验。


曼普利特•辛格•古特拉(Manpreet Singh Ghotra)

Salesforce公司软件工程主管,拥有十余年软件开发经验,目前致力于开发基于Apache Spark的机器学习平台。


尼克•彭特里思(Nick Pentreath)

IBM开源数据及人工智能技术中心首席工程师,大数据及机器学习公司Graphflow联合创始人,Spark项目管理委员会成员。


【译者简介】

蔡立宇

曾从事自然语言处理和图数据分析相关工作,现提供数据分析相关的独立咨询和开发服务。坐标深圳。

大家也喜欢

  • Python深度学习

    [美] 弗朗索瓦•肖莱   张亮(hysic)   译

    本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔...

  • Spark高级数据分析(第2版)

    [美] 桑迪·里扎   [美] 于里·莱瑟森   [英] 肖恩·欧文   [美] 乔希·威尔斯   龚少成   邱鑫   译

    本书是使用Spark进行大规模数据分析的实战宝典,由知名数据科学家撰写。本书在第1版的基础上,针对Spark近...

  • 机器学习与优化

    [意] 罗伯托·巴蒂蒂   [意] 毛罗·布鲁纳托   王彧弋   译

    本书是机器学习实战领域的一本佳作,从机器学习的基本概念讲起,旨在将初学者引入机器学习的大门,并走上实践的道路。...

  • Java机器学习

    Boštjan Kaluža   武传海   译

    本书介绍如何使用Java创建并实现机器学习算法,既有基础知识,又提供实战案例。主要内容包括:机器学习基本概念、...

  • Spark最佳实践

    本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍...

  • 申请翻译
    chenfenghui  发表于 2017-10-10 18:06:01
  • 这本书会有电子版吗?
    坦克  发表于 2018-11-05 10:52:32
    • 您好,本书有电子版,感谢关注~

      温雪  发表于 2018-11-05 10:55:34