logo
分类于: 其它

简介

Python网络数据采集

Python网络数据采集 7.7分

资源最后更新于 2020-03-20 17:45:50

作者:https://itpanda.net/book/114/download/112

译者:陶俊杰陈小莉

出版社:出版社人民邮电出版社

出版日期:2016-03

文件格式: pdf

标签: 计算机 编程 图灵程序设计丛书 数据挖掘 数据 Python 爬虫

简介· · · · · ·

本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。Ryan Mitchell数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 版权声明
  2. O'Reilly Media, Inc. 介绍
  3. 业界评论
  4. 译者序
  5. 前言
  6. 第一部分 创建爬虫
  7. 第 1 章 初见网络爬虫
  8. 第 2 章 复杂 HTML 解析
  9. 第 3 章 开始采集
  10. 第 4 章 使用 API
  11. 第 5 章 存储数据
  12. 第 6 章 读取文档
  13. 第二部分 高级数据采集
  14. 第 7 章 数据清洗
  15. 第 8 章 自然语言处理
  16. 第 9 章 穿越网页表单与登录窗口进行采集
  17. 第 10 章 采集 JavaScript
  18. 第 11 章 图像识别与文字处理
  19. 第 12 章 避开采集陷阱
  20. 第 13 章 用爬虫测试网站
  21. 第 14 章 远程采集
  22. 附录 A Python 简介
  23. 附录 B 互联网简介
  24. 附录 C 网络数据采集的法律与道德约束
  25. 作者简介
  26. 封面介绍
  27. 看完了