我爱电子书-《Mahout实战》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 计算机基础互联网人工智能

简介

Mahout实战豆 8.0分

资源最后更新于 2020-03-29 05:01:22

作者：〔美〕 Sean Owen〔美〕Robin Anil〔美〕Ted Dunning〔美〕Ellen Friedman

译者：王斌韩冀中万吉

出版社：出版社人民邮电出版社

出版日期：2014-03

ISBN：9787115347220

文件格式： pdf

标签：网络计算机数据挖掘

简介· · · · · ·

通过收集数据来学习和演进的计算机系统威力无穷。Mahout作为Apache的开源机器学习项目，把推荐系统、分类和聚类等领域的核心算法浓缩到了可扩展的现成的库中。使用Mahout，你可以立即在自己的项目中应用亚马逊、Netflix及其他互联网公司所采用的机器学习技术。本书出自Mahout核心成员之手，得到Apache官方推荐，权威性毋庸置疑。作者凭借多年实战经验，为读者展现了丰富的应用案例，并细致地介绍了Mahout的解决之道。本书还重点讨论了可扩展性问题，介绍了如何利用Apache Hadoop框架应对大数据的挑战。Sean Owen，现为大数据公司Cloudera数据产品总监，Myrrix创始人，曾任Apache Mahout项目管理委员会委员、谷歌高级软件工程师，是Mobile Web和Taste框架（现属于Mahout项目）的主力开发者。Owen拥有哈佛大学计算机科学专业学士学位。Robin Anil，谷歌公司负责地图与广告方向的软件工程师，Apache Mahout项目管理委员会委员，为Mahout开发了贝叶斯分类器和频繁模式挖掘实现，曾经在雅虎公司任高级软件工程师。Ted Dunning，MapR Technologies公司首席应用架构师，Apache Mahout和Zookeeper项目管理委员会成员，为Mahout聚类、分类、矩阵分解算法做出了贡献，曾任DeepDyve公司CTO及多家公司首席科学家。Ellen Friedman，Apache Mahout项目代码提交者，生物化学博士学位，经验丰富的科技作家，作品涵盖计算机、分子生物学、医学和地球科学。

直接下载

简介

Mahout实战 豆 8.0分

简介· · · · · ·

目录

前言

致谢

关于本书

路线图

代码约定及下载

多媒体资料

作者在线

16个语音讲解

关于封面

第1章 初识Mahout

1.1 Mahout的故事

1.2 Mahout的机器学习主题

1.2.1 推荐引擎

1.2.2 聚类

1.2.3 分类

1.3 利用Mahout和Hadoop处理大规模数据

1.4 安装Mahout

1.4.1 Java和IDE

1.4.2 安装Maven

1.4.3 安装Mahout

1.4.4 安装Hadoop

1.5 小结

第一部分 推荐

第2章 推荐系统

2.1 推荐的定义

2.2 运行第一个推荐引擎

2.2.1 创建输入

2.2.2 创建一个推荐程序

2.2.3 分析输出

2.3 评估一个推荐程序

2.3.1 训练数据与评分

2.3.2 运行RecommenderEvaluator

2.3.3 评估结果

2.4 评估查准率与查全率

2.4.1 运行RecommenderIRStatsEvaluator

2.4.2 查准率和查全率的问题

2.5 评估GroupLens数据集

2.5.1 提取推荐程序的输入

2.5.2 体验其他推荐程序

2.6 小结

第3章 推荐数据的表示

3.1 偏好数据的表示

3.1.1 Preference对象

3.1.2 PreferenceArray及其实现

3.1.3 改善聚合的性能

3.1.4 FastByIDMap和FastIDSet

3.2 内存级DataModel

3.2.1 GenericDataModel

3.2.2 基于文件的数据

3.2.3 可刷新组件

3.2.4 更新文件

3.2.5 基于数据库的数据

3.2.6 JDBC和MySQL

3.2.7 通过JNDI进行配置

3.2.8 利用程序进行配置

3.3 无偏好值的处理

3.3.1 何时忽略值

3.3.2 无偏好值时的内存级表示

3.3.3 选择兼容的实现

3.4 小结

第4章 进行推荐

4.1 理解基于用户的推荐

4.1.1 推荐何时会出错

4.1.2 推荐何时是正确的

4.2 探索基于用户的推荐程序

4.2.1 算法

4.2.2 基于GenericUserBasedRecommender实现算法

4.2.3 尝试GroupLens数据集

4.2.4 探究用户邻域

4.2.5 固定大小的邻域

4.2.6 基于阈值的邻域

4.3 探索相似性度量

4.3.1 基于皮尔逊相关系数的相似度

4.3.2 皮尔逊相关系数存在的问题

4.3.3 引入权重

4.3.4 基于欧氏距离定义相似度

Mahout实战豆 8.0分

第1章　初识Mahout

1.1　Mahout的故事

1.2　Mahout的机器学习主题

1.2.1　推荐引擎

1.2.2　聚类

1.2.3　分类

1.3　利用Mahout和Hadoop处理大规模数据

1.4　安装Mahout

1.4.1　Java和IDE

1.4.2　安装Maven

1.4.3　安装Mahout

1.4.4　安装Hadoop

1.5　小结

第一部分　推荐

第2章　推荐系统

2.1　推荐的定义

2.2　运行第一个推荐引擎

2.2.1　创建输入

2.2.2　创建一个推荐程序

2.2.3　分析输出

2.3　评估一个推荐程序

2.3.1　训练数据与评分

2.3.2　运行RecommenderEvaluator

2.3.3　评估结果

2.4　评估查准率与查全率

2.4.1　运行RecommenderIRStatsEvaluator

2.4.2　查准率和查全率的问题

2.5　评估GroupLens数据集

2.5.1　提取推荐程序的输入

2.5.2　体验其他推荐程序

2.6　小结

第3章　推荐数据的表示

3.1　偏好数据的表示

3.1.1　Preference对象

3.1.2　PreferenceArray及其实现

3.1.3　改善聚合的性能

3.1.4　FastByIDMap和FastIDSet

3.2　内存级DataModel

3.2.1　GenericDataModel

3.2.2　基于文件的数据

3.2.3　可刷新组件

3.2.4　更新文件

3.2.5　基于数据库的数据

3.2.6　JDBC和MySQL

3.2.7　通过JNDI进行配置

3.2.8　利用程序进行配置

3.3　无偏好值的处理

3.3.1　何时忽略值

3.3.2　无偏好值时的内存级表示

3.3.3　选择兼容的实现

3.4　小结

第4章　进行推荐

4.1　理解基于用户的推荐

4.1.1　推荐何时会出错

4.1.2　推荐何时是正确的

4.2　探索基于用户的推荐程序

4.2.1　算法

4.2.2　基于GenericUserBasedRecommender实现算法

4.2.3　尝试GroupLens数据集

4.2.4　探究用户邻域

4.2.5　固定大小的邻域

4.2.6　基于阈值的邻域

4.3　探索相似性度量

4.3.1　基于皮尔逊相关系数的相似度

4.3.2　皮尔逊相关系数存在的问题

4.3.3　引入权重

4.3.4　基于欧氏距离定义相似度

4.3.5　采用余弦相似性度量

4.3.6　采用斯皮尔曼相关系数基于相对排名定义相似度

4.3.7　忽略偏好值基于谷本系数计算相似度

4.3.8　基于对数似然比更好地计算相似度

4.3.9　推测偏好值

4.4　基于物品的推荐

4.4.1　算法

4.4.2　探究基于物品的推荐程序

4.5　Slope-one推荐算法

4.5.1　算法

4.5.2　slope-one实践

4.5.3　DiffStorage和内存考虑