我爱电子书-《Storm分布式实时计算模式: 大数据技术丛书》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 计算机基础人工智能设计职场办公

简介

Storm分布式实时计算模式: 大数据技术丛书豆 6.9分

资源最后更新于 2020-03-29 03:24:55

作者：〔美〕吉奥兹（P. Taylor Goetz）〔美〕奥尼尔（Brian O'Neill）

译者：董昭

出版社：出版社机械工业出版社

出版日期：2015-01

ISBN：9787111484387

文件格式： pdf

标签：计算机限时特价数据大数据技术丛书数据处理软件

简介· · · · · ·

本书由Apache Storm项目核心贡献者亲笔撰写，融合了作者丰富的Storm实战经验，通过大量示例，全面而系统地讲解使用Storm进行分布式实时计算的核心概念及应用，并针对不同的应用场景，给出多种基于Storm的设计模式，为读者快速掌握Storm分布式实时计算提供系统实践指南。全书分为10章：第1章介绍使用Storm建立一个分布式流式计算应用所涉及的核心概念，包括Storm的数据结构、开发环境的搭建，以及Storm程序的开发和调试技术等；第2章详细讲解Storm集群环境的安装和搭建，以及如何将topology部署到分布式环境中；第3章通过传感器数据实例详细介绍Trident topology；第4章讲解如何使用Storm和Trident进行实时趋势分析；第5章介绍如何使用storm进行图形分析，将数据持久化存储在图形数据库中，通过查询数据来发现其中潜在的联系；第6章讲解如何在Storm上使用递归实现一个典型的人工智能算法；第7章演示集成Storm和非事务型系统的复杂性，通过集成Storm和开源探索性分析架构 Druid实现一个可配置的实时系统来分析金融事件。第8章探讨Lambda体系结构的实现方法，讲解如何将批处理机制和实时处理引擎结合起来构建一个可纠错的分析系统；第9章讲解如何将Pig脚本转化为topology，并且使用Storm-YARN部署topology，从而将批处理系统转化为实时系统；第10章介绍如何在云服务提供商提供的主机环境下部署和运行Storm。作者：吉奥兹（P. Taylor Goetz），是Apache Storm项目核心贡献者以及发布经理，自2011年10月Storm项目首次开源至今都参与其中，具有长期的Storm使用和开发经验。作为Storm用户社区中的活跃贡献者，Taylor领导了一系列开源项目，旨在使企业能够将Storm集成到不同的基础设施上。奥尼尔（Brian O'Neill），现就职于Health Market Science(HMS)公司，任首席技术官，重点进行数据管理和医疗领域数据分析。他已经担任技术主管超过15年，被公认为大数据领域的权威。作为系统架构师，他有着应对各种不同场景的经验，从初创公司到财富500强公司。他信奉开源精神，对多个项目做出了贡献。他领导的项目，扩展了Cassandra数据库，并且将索引引擎、分布式处理框架、分析引擎集成到了该数据库中。他荣获了2013年InfoWorld技术领导力奖项。译者：董昭，腾讯安全平台部应用运维安全工程师，负责腾讯Web业务的漏洞防护等相关工作，研究兴趣为Web安全、网络安全、Linux后台开发、大数据等。

直接下载

简介

Storm分布式实时计算模式: 大数据技术丛书 豆 6.9分

简介· · · · · ·

目录

译者序

前言

作者简介

第1章 分布式单词计数

1.1 Storm topology的组成部分——stream、spout和bolt

1.1.1 stream

1.1.2 spout

1.1.3 bolt

1.2 单词计数topology的数据流

1.2.1 语句生成spout

1.2.2 语句分割bolt

1.2.3 单词计数bolt

1.2.4 上报bolt

1.3 实现单词计数topology

1.3.1 配置开发环境

1.3.2 实现SentenceSpout

1.3.3 实现语句分割bolt

1.3.4 实现单词计数bolt

1.3.5 实现上报bolt

1.3.6 实现单词计数topology

1.4 Storm的并发机制

1.4.1 WordCountTopology的并发机制

1.4.2 给topology增加worker

1.4.3 配置executor和task

1.5 理解数据流分组

1.6 有保障机制的数据处理

1.6.1 spout的可靠性

1.6.2 bolt的可靠性

1.6.3 可靠的单词计数

总结

第2章 配置Storm集群

2.1 Storm集群的框架

2.1.1 理解nimbus守护进程

2.1.2 supervisor守护进程的工作方式

2.1.3 Apache ZooKeeper简介

2.1.4 Storm的DRPC服务工作机制

2.1.5 Storm UI

2.2 Storm技术栈简介

2.2.1 Java和Clojure

2.2.2 Python

2.3 在Linux上安装Storm

2.3.1 安装基础操作系统

2.3.2 安装Java

2.3.3 安装ZooKeeper

2.3.4 安装Storm

2.3.5 运行Storm守护进程

2.3.6 配置Storm

2.3.7 必需的配置项

2.3.8 可选配置项

2.3.9 Storm可执行程序

2.3.10 在工作站上安装Storm可执行程序

2.3.11 守护进程命令

2.3.12 管理命令

2.3.13 本地调试/开发命令

2.4 把toplogy提交到集群中

2.5 自动化集群配置

2.6 Puppet的快速入门

2.6.1 Puppet manifest文件

2.6.2 Puppet类和模块

2.6.3 Puppet模板

2.6.4 使用Puppet Hiera来管理环境

2.6.5 介绍Hiera

总结

第3章 Trident和传感器数据

3.1 使用场景

3.2 Trident topology

3.3 Trident spout

3.4 Trident运算

3.4.1 Trident filter

3.4.2 Trident function

3.5 Trident聚合器

3.5.1 CombinerAggregator

3.5.2 ReducerAggregator

3.5.3 Aggregator

3.6 Trident状态

3.6.1 重复事务型状态

Storm分布式实时计算模式: 大数据技术丛书豆 6.9分

第1章　分布式单词计数

1.1　Storm topology的组成部分——stream、spout和bolt

1.1.1　stream

1.1.2　spout

1.1.3　bolt

1.2　单词计数topology的数据流

1.2.1　语句生成spout

1.2.2　语句分割bolt

1.2.3　单词计数bolt

1.2.4　上报bolt

1.3　实现单词计数topology

1.3.1　配置开发环境

1.3.2　实现SentenceSpout

1.3.3　实现语句分割bolt

1.3.4　实现单词计数bolt

1.3.5　实现上报bolt

1.3.6　实现单词计数topology

1.4　Storm的并发机制

1.4.1　WordCountTopology的并发机制

1.4.2　给topology增加worker

1.4.3　配置executor和task

1.5　理解数据流分组

1.6　有保障机制的数据处理

1.6.1　spout的可靠性

1.6.2　bolt的可靠性

1.6.3　可靠的单词计数

第2章　配置Storm集群

2.1　Storm集群的框架

2.1.1　理解nimbus守护进程

2.1.2　supervisor守护进程的工作方式

2.1.3　Apache ZooKeeper简介

2.1.4　Storm的DRPC服务工作机制

2.1.5　Storm UI

2.2　Storm技术栈简介

2.2.1　Java和Clojure

2.2.2　Python

2.3　在Linux上安装Storm

2.3.1　安装基础操作系统

2.3.2　安装Java

2.3.3　安装ZooKeeper

2.3.4　安装Storm

2.3.5　运行Storm守护进程

2.3.6　配置Storm

2.3.7　必需的配置项

2.3.8　可选配置项

2.3.9　Storm可执行程序

2.3.10　在工作站上安装Storm可执行程序

2.3.11　守护进程命令

2.3.12　管理命令

2.3.13　本地调试/开发命令

2.4　把toplogy提交到集群中

2.5　自动化集群配置

2.6　Puppet的快速入门

2.6.1　Puppet manifest文件

2.6.2　Puppet类和模块

2.6.3　Puppet模板

2.6.4　使用Puppet Hiera来管理环境

2.6.5　介绍Hiera

第3章　Trident和传感器数据

3.1　使用场景

3.2　Trident topology

3.3　Trident spout

3.4　Trident运算

3.4.1　Trident filter

3.4.2　Trident function

3.5　Trident聚合器

3.5.1　CombinerAggregator

3.5.2　ReducerAggregator

3.5.3　Aggregator

3.6　Trident状态

3.6.1　重复事务型状态

3.6.2　不透明型状态

3.7　执行topology

第4章　实时趋势分析

4.1　应用场景

4.2　体系结构

4.2.1　数据源应用程序

4.2.2　logback Kafka appender

4.2.3　Apache Kafka