logo
分类于: 编程语言 计算机基础 设计

简介

Spark内核设计的艺术:架构设计与实现: 大数据技术丛书

Spark内核设计的艺术:架构设计与实现: 大数据技术丛书 0.0分

资源最后更新于 2020-03-29 02:15:39

作者:耿嘉安

出版社:出版社机械工业出版社

出版日期:2017-12

ISBN:9787111584391

文件格式: pdf

标签: 计算机 编程 程序设计 限时特价 大数据技术丛书

简介· · · · · ·

本书对Spark内部高度抽象的数据结构RDD、分布式DAG调度器/驱动器,以及高效的基于Non-blocking IO分布式计算框架Akka/Netty等内核设计进行了深度剖析,不可多得,是适合大型分布式计算架构师和资深开源贡献者阅读的参考书。作者:耿嘉安

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 本书赞誉
  2. 前言
  3. 第1章 环境准备
  4. 1.1 运行环境准备
  5. 1.2 Spark初体验
  6. 1.3 阅读环境准备
  7. 1.4 Spark源码编译与调试
  8. 1.5 小结
  9. 第2章 设计理念与基本架构
  10. 2.1 初识Spark
  11. 2.2 Spark基础知识
  12. 2.3 Spark基本设计思想
  13. 2.4 Spark基本架构
  14. 2.5 小结
  15. 第3章 Spark基础设施
  16. 3.1 Spark配置
  17. 3.2 Spark内置RPC框架
  18. 3.3 事件总线
  19. 3.4 度量系统
  20. 3.5 小结
  21. 第4章 SparkContext的初始化
  22. 4.1 SparkContext概述
  23. 4.2 创建Spark环境
  24. 4.3 SparkUI的实现
  25. 4.4 创建心跳接收器
  26. 4.5 创建和启动调度系统
  27. 4.6 初始化块管理器BlockManager
  28. 4.7 启动度量系统
  29. 4.8 创建事件日志监听器
  30. 4.9 创建和启动ExecutorAllocationManager
  31. 4.10 ContextCleaner的创建与启动
  32. 4.11 额外的SparkListener与启动事件总线
  33. 4.12 Spark环境更新
  34. 4.13 SparkContext初始化的收尾
  35. 4.14 SparkContext提供的常用方法
  36. 4.15 SparkContext的伴生对象
  37. 4.16 小结
  38. 第5章 Spark执行环境
  39. 5.1 SparkEnv概述
  40. 5.2 安全管理器SecurityManager
  41. 5.3 RPC环境
  42. 5.4 序列化管理器SerializerManager
  43. 5.5 广播管理器BroadcastManager
  44. 5.6 map任务输出跟踪器
  45. 5.7 构建存储体系
  46. 5.8 创建度量系统
  47. 5.9 输出提交协调器
  48. 5.10 创建SparkEnv
  49. 5.11 小结
  50. 第6章 存储体系
  51. 6.1 存储体系概述
  52. 6.2 Block信息管理器
  53. 6.3 磁盘Block管理器
  54. 6.4 磁盘存储DiskStore
  55. 6.5 内存管理器
  56. 6.6 内存存储MemoryStore
  57. 6.7 块管理器BlockManager
  58. 6.8 BlockManagerMaster对BlockManager的管理
  59. 6.9 Block传输服务
  60. 6.10 DiskBlockObjectWriter详解
  61. 6.11 小结
  62. 第7章 调度系统
  63. 7.1 调度系统概述
  64. 7.2 RDD详解
  65. 7.3 Stage详解
  66. 7.4 面向DAG的调度器DAGScheduler
  67. 7.5 调度池Pool
  68. 7.6 任务集合管理器TaskSetManager
  69. 7.7 运行器后端接口LauncherBackend
  70. 7.8 调度后端接口SchedulerBackend
  71. 7.9 任务结果获取器TaskResultGetter
  72. 7.10 任务调度器TaskScheduler
  73. 7.11 小结
  74. 第8章 计算引擎
  75. 8.1 计算引擎概述
  76. 8.2 内存管理器与执行内存
  77. 8.3 内存管理器与Tungsten
  78. 8.4 任务内存管理器
  79. 8.5 Task详解
  80. 8.6 IndexShuffleBlockResolver详解
  81. 8.7 采样与估算
  82. 8.8 特质WritablePartitionedPairCollection
  83. 8.9 AppendOnlyMap的实现分析
  84. 8.10 PartitionedPairBuffer的实现分析
  85. 8.11 外部排序器
  86. 8.12 Shuffle管理器
  87. 8.13 map端与reduce端的Shuffle组合
  88. 8.14 小结
  89. 第9章 部署模式
  90. 9.1 心跳接收器HeartbeatReceiver
  91. 9.2 Executor的实现分析
  92. 9.3 local部署模式
  93. 9.4 持久化引擎PersistenceEngine
  94. 9.5 领导选举代理
  95. 9.6 Master详解
  96. 9.7 Worker详解
  97. 9.8 StandaloneAppClient实现
  98. 9.9 StandaloneSchedulerBackend的实现分析
  99. 9.10 CoarseGrainedExecutorBackend详解
  100. 9.11 local-cluster部署模式
  101. 9.12 Standalone部署模式
  102. 9.13 其他部署方案
  103. 9.14 小结
  104. 第10章 Spark API
  105. 10.1 基本概念
  106. 10.2 数据源DataSource
  107. 10.3 检查点的实现
  108. 10.4 RDD的再次分析
  109. 10.5 数据集合Dataset
  110. 10.6 DataFrameReader详解
  111. 10.7 SparkSession详解
  112. 10.8 word count例子
  113. 10.9 小结
  114. 附录