logo
分类于: 计算机基础 互联网 云计算&大数据

简介

Apache Kylin权威指南: 大数据技术丛书

Apache Kylin权威指南: 大数据技术丛书 0.0分

资源最后更新于 2020-03-29 04:21:21

作者:Apache Kylin核心团队

出版社:出版社机械工业出版社

出版日期:2017-01

文件格式: pdf

标签: 互联网 网络 计算机 服务器 大数据技术丛书

简介· · · · · ·

在数据分析领域,大部分的技术都诞生在国外,特别是美国,从最初的数据库,到以Hadoop为首的大数据技术,再到今天各种DL(Deep Learning)、AI,等等。但我国拥有着世界上独一无二的“大”数据,最多的人口、最多的移动设备、最活跃的应用市场、最复杂的网络环境等,应对这些挑战,我们需要有自己的核心技术,特别是在基础领域的突破和研发方面。今天,以Apache Kylin为首的各种来自中国的先进技术不断涌现,甚至在很多方面都大大超越了国外的其他技术,这一点也彰显了中国的技术实力。作者:Apache Kylin核心团队。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 推荐序一
  2. 推荐序二
  3. 推荐序三
  4. 推荐序四
  5. 前言
  6. 第1章 Apache Kylin概述
  7. 1.1 背景和历史
  8. 1.2 Apache Kylin的使命
  9. 1.2.1 为什么要使用Apache Kylin
  10. 1.2.2 Apache Kylin怎样解决关键问题
  11. 1.3 Apache Kylin的工作原理
  12. 1.3.1 维度和度量简介
  13. 1.3.2 Cube和Cuboid
  14. 1.3.3 工作原理
  15. 1.4 Apache Kylin的技术架构
  16. 1.5 Apache Kylin的主要特点
  17. 1.5.1 标准SQL接口
  18. 1.5.2 支持超大数据集
  19. 1.5.3 亚秒级响应
  20. 1.5.4 可伸缩性和高吞吐率
  21. 1.5.5 BI及可视化工具集成
  22. 1.6 与其他开源产品比较
  23. 1.7 小结
  24. 第2章 快速入门
  25. 2.1 核心概念
  26. 2.1.1 数据仓库、OLAP与BI
  27. 2.1.2 维度和度量
  28. 2.1.3 事实表和维度表
  29. 2.1.4 Cube、Cuboid和Cube Segment
  30. 2.2 在Hive中准备数据
  31. 2.2.1 星形模型
  32. 2.2.2 维度表的设计
  33. 2.2.3 Hive表分区
  34. 2.2.4 了解维度的基数
  35. 2.2.5 Sample Data
  36. 2.3 设计Cube
  37. 2.3.1 导入Hive表定义
  38. 2.3.2 创建数据模型
  39. 2.3.3 创建Cube
  40. 2.4 构建Cube
  41. 2.4.1 全量构建和增量构建
  42. 2.4.2 历史数据刷新
  43. 2.4.3 合并
  44. 2.5 查询Cube
  45. 2.6 SQL参考
  46. 2.7 小结
  47. 第3章 增量构建
  48. 3.1 为什么要增量构建
  49. 3.2 设计增量Cube
  50. 3.2.1 设计增量Cube的前提
  51. 3.2.2 增量Cube的创建
  52. 3.3 触发增量构建
  53. 3.3.1 Web GUI触发
  54. 3.3.2 构建相关的Rest API
  55. 3.4 管理Cube碎片
  56. 3.4.1 合并Segment
  57. 3.4.2 自动合并
  58. 3.4.3 保留Segment
  59. 3.4.4 数据持续更新
  60. 3.5 小结
  61. 第4章 流式构建
  62. 4.1 为什么要流式构建
  63. 4.2 准备流式数据
  64. 4.2.1 数据格式
  65. 4.2.2 消息队列
  66. 4.2.3 创建Schema
  67. 4.3 设计流式Cube
  68. 4.3.1 创建Model
  69. 4.3.2 创建Cube
  70. 4.4 流式构建原理
  71. 4.5 触发流式构建
  72. 4.5.1 单次触发
  73. 4.5.2 自动化多次触发
  74. 4.5.3 出错处理
  75. 4.6 小结
  76. 第5章 查询和可视化
  77. 5.1 Web GUI
  78. 5.1.1 查询
  79. 5.1.2 显示结果
  80. 5.2 Rest API
  81. 5.2.1 查询认证
  82. 5.2.2 查询请求参数
  83. 5.2.3 查询返回结果
  84. 5.3 ODBC
  85. 5.4 JDBC
  86. 5.4.1 获得驱动包
  87. 5.4.2 认证
  88. 5.4.3 URL格式
  89. 5.4.4 获取元数据信息
  90. 5.5 通过Tableau访问Kylin
  91. 5.5.1 连接Kylin数据源
  92. 5.5.2 设计数据模型
  93. 5.5.3 通过Live方式连接
  94. 5.5.4 自定义SQL
  95. 5.5.5 可视化
  96. 5.5.6 发布到Tableau Server
  97. 5.6 Zeppelin集成
  98. 5.6.1 Zeppelin架构简介
  99. 5.6.2 KylinInterpreter的工作原理
  100. 5.6.3 如何使用Zeppelin访问Kylin
  101. 5.7 小结
  102. 第6章 Cube优化
  103. 6.1 Cuboid剪枝优化
  104. 6.1.1 维度的诅咒
  105. 6.1.2 检查Cuboid数量
  106. 6.1.3 检查Cube大小
  107. 6.1.4 空间与时间的平衡
  108. 6.2 剪枝优化的工具
  109. 6.2.1 使用衍生维度
  110. 6.2.2 使用聚合组
  111. 6.3 并发粒度优化
  112. 6.4 Rowkeys优化
  113. 6.4.1 编码
  114. 6.4.2 按维度分片
  115. 6.4.3 调整Rowkeys顺序
  116. 6.5 其他优化
  117. 6.5.1 降低度量精度
  118. 6.5.2 及时清理无用的Segment
  119. 6.6 小结
  120. 第7章 应用案例分析
  121. 7.1 基本多维分析
  122. 7.1.1 数据集
  123. 7.1.2 数据导入
  124. 7.1.3 创建数据模型
  125. 7.1.4 创建Cube
  126. 7.1.5 构建Cube
  127. 7.1.6 SQL查询
  128. 7.2 流式分析
  129. 7.2.1 Kafka数据源
  130. 7.2.2 创建数据表
  131. 7.2.3 创建数据模型
  132. 7.2.4 创建Cube
  133. 7.2.5 构建Cube
  134. 7.2.6 SQL查询
  135. 7.3 小结
  136. 第8章 扩展Apache Kylin
  137. 8.1 可扩展式架构
  138. 8.1.1 工作原理
  139. 8.1.2 三大主要接口
  140. 8.2 计算引擎扩展
  141. 8.2.1 EngineFactory
  142. 8.2.2 MRBatchCubingEngine2
  143. 8.2.3 BatchCubingJobBuilder2
  144. 8.2.4 IMRInput
  145. 8.2.5 IMROutput2
  146. 8.3 数据源扩展
  147. 8.4 存储扩展
  148. 8.5 聚合类型扩展
  149. 8.5.1 聚合的JSON定义
  150. 8.5.2 聚合类型工厂
  151. 8.5.3 聚合类型的实现
  152. 8.6 维度编码扩展
  153. 8.6.1 维度编码的JSON定义
  154. 8.6.2 维度编码工厂
  155. 8.6.3 维度编码的实现
  156. 8.7 小结
  157. 第9章 Apache Kylin的企业级功能
  158. 9.1 身份验证
  159. 9.1.1 自定义验证
  160. 9.1.2 LDAP验证
  161. 9.1.3 单点登录
  162. 9.2 授权
  163. 9.3 小结
  164. 第10章 运维管理
  165. 10.1 安装和配置
  166. 10.1.1 必备条件
  167. 10.1.2 快速启动Apache Kylin
  168. 10.1.3 配置Apache Kylin
  169. 10.1.4 企业部署
  170. 10.2 监控和诊断
  171. 10.2.1 日志
  172. 10.2.2 任务报警
  173. 10.2.3 诊断工具
  174. 10.3 日常维护
  175. 10.3.1 基本运维
  176. 10.3.2 元数据备份
  177. 10.3.3 元数据恢复
  178. 10.3.4 系统升级
  179. 10.3.5 垃圾清理
  180. 10.4 常见问题和修复
  181. 10.5 获得社区帮助
  182. 10.5.1 邮件列表
  183. 10.5.2 JIRA
  184. 10.6 小结
  185. 第11章 参与开源
  186. 11.1 Apache Kylin的开源历程
  187. 11.2 为什么参与开源
  188. 11.3 Apache开源社区简介
  189. 11.3.1 简介
  190. 11.3.2 组织构成与运作模式
  191. 11.3.3 项目角色
  192. 11.3.4 孵化项目及顶级项目
  193. 11.4 如何贡献到开源社区
  194. 11.4.1 什么是贡献
  195. 11.4.2 如何贡献
  196. 11.5 礼仪与文化
  197. 11.6 如何参与Apache Kylin
  198. 11.7 小结
  199. 第12章 Apache Kylin的未来
  200. 12.1 大规模流式构建
  201. 12.2 拥抱Spark技术栈
  202. 12.3 更快的存储和查询
  203. 12.4 前端展现及与BI工具的整合
  204. 12.5 高级OLAP函数
  205. 12.6 展望