注重体验与质量的电子书资源下载网站
分类于: 其它
简介
Python网络数据采集 豆 7.7分
资源最后更新于 2020-03-20 17:45:50
作者:https://itpanda.net/book/114/download/112
译者:陶俊杰陈小莉
出版社:出版社人民邮电出版社
出版日期:2016-03
文件格式: pdf
标签: 计算机 编程 图灵程序设计丛书 数据挖掘 数据 Python 爬虫
简介· · · · · ·
本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。Ryan Mitchell数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。
目录
版权声明
O'Reilly Media, Inc. 介绍
业界评论
译者序
前言
第一部分 创建爬虫
第 1 章 初见网络爬虫
第 2 章 复杂 HTML 解析
第 3 章 开始采集
第 4 章 使用 API
第 5 章 存储数据
第 6 章 读取文档
第二部分 高级数据采集
第 7 章 数据清洗
第 8 章 自然语言处理
第 9 章 穿越网页表单与登录窗口进行采集
第 10 章 采集 JavaScript
第 11 章 图像识别与文字处理
第 12 章 避开采集陷阱
第 13 章 用爬虫测试网站
第 14 章 远程采集
附录 A Python 简介
附录 B 互联网简介
附录 C 网络数据采集的法律与道德约束
作者简介
封面介绍
看完了