我爱电子书-《命令行中的数据科学》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 编程语言计算机基础云计算&大数据

简介

命令行中的数据科学豆 7.6分

资源最后更新于 2020-03-29 02:59:23

作者：〔荷〕Jeroen Janssens

译者：王晓伟刘峰

出版社：出版社人民邮电出版社

出版日期：2015-06

ISBN：9787115391681

文件格式： pdf

标签：计算机大数据数据库

简介· · · · · ·

本书集实用性和先进性于一身，为数据分析人员使用命令行这个灵活的工具提供了重要参考。作者讲解了众多实用的命令行工具，以及如何使用它们高效地获取、清洗、探索和建模数据。无论你使用Windows、OS X，还是Linux，都可以安装包含80多个命令行工具的“数据科学工具箱”，迅速建立自己的数据分析环境。无论你是否已经习惯于使用Python或R语言，都能够通过本书体会到使用命令行的快捷、灵活与伸缩自如。Jeroen Janssens，爱思唯尔（世界领先的科技及医学出版公司）首席数据科学家，曾是纽约YPlan公司高级数据科学家。专门从事机器学习、异常检测和数据可视化。在荷兰马斯特里赫特大学获得人工智能硕士学位，在荷兰蒂尔堡大学获得机器学习博士学位。他热衷于创建数据科学的开源工具，个人网站是http://jeroenjanssens.com/。

直接下载

简介

命令行中的数据科学 豆 7.6分

简介· · · · · ·

目录

O'Reilly Media, Inc.介绍

业界评论

前言

从本书可以学到的

怎样阅读本书

本书面向的读者

使用代码示例

Safari® Books Online

联系我们

致谢

第1章 简介

1.1 概述

1.2 数据科学就是OSEMN

1.2.1 数据获取

1.2.2 数据清洗

1.2.3 数据探索

1.2.4 数据建模

1.2.5 数据解释

1.3 插入的几章

1.4 什么是命令行

1.5 为什么用命令行做数据科学工作

1.5.1 命令行的灵活性

1.5.2 命令行可增强

1.5.3 命令行可扩展

1.5.4 命令行可扩充

1.5.5 命令行无处不在

1.6 一个现实用例

1.7 延伸阅读

第2章 入门指南

2.1 概述

2.2 设置数据科学工具箱

2.2.1 步骤1：下载和安装VirtualBox

2.2.2 步骤2：下载和安装Vagrant

2.2.3 步骤3：下载并启动数据科学工具箱

2.2.4 步骤4：登录（Linux和Mac OS X）

2.2.5 步骤4：登录（微软Windows）

2.2.6 步骤5：关闭或重启

2.3 必要的概念和工具

2.3.1 环境

2.3.2 运行命令行工具

2.3.3 五类命令行工具

2.3.4 命令行工具的组合

2.3.5 输入和输出重定向

2.3.6 处理文件

2.3.7 寻求帮助

2.4 延伸阅读

第3章 数据获取

3.1 概述

3.2 将本地文件复制到数据科学工具箱

3.2.1 本地数据科学工具箱

3.2.2 远程数据科学工具箱

3.3 解压缩文件

3.4 微软Excel电子表格的转换

3.5 查询关系数据库

3.6 从互联网下载

3.7 调用Web API

3.8 延伸阅读

第4章 创建可重用的命令行工具

4.1 概述

4.2 将单行转变为shell脚本

4.2.1 步骤1：复制和粘贴

4.2.2 步骤2：添加执行权限

4.2.3 步骤3：定义shebang

4.2.4 步骤4：删除固定的输入

4.2.5 步骤5：参数化

4.2.6 步骤6：扩展PATH

4.3 用Python和R创建命令行工具

4.3.1 移植shell脚本

4.3.2 处理来自标准输入的流数据

4.4 延伸阅读

第5章 数据清洗

5.1 概述

5.2 纯文本的常见清洗操作

5.2.1 行过滤

5.2.2 值提取

5.2.3 值替换和删除

命令行中的数据科学豆 7.6分

第1章简介

第2章入门指南

第3章数据获取

第4章创建可重用的命令行工具

第5章数据清洗

第6章管理数据工作流

第7章数据探索

第8章并行管道

第9章数据建模