分类于: 编程语言 计算机基础 云计算&大数据

简介

Python3爬虫、数据清洗与可视化实战

Python3爬虫、数据清洗与可视化实战 4.7分

资源最后更新于 2020-03-28 16:57:34

作者:零一

出版社:出版社电子工业出版社

出版日期:2018-03

ISBN:9787121333590

文件格式: pdf

标签: 计算机 编程 程序设计 数据分析 Python

简介· · · · · ·

本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。本书共分11章,6个核心主题:其一是Python基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python数据库应用,包括MongoDB、MySQL在Python中的连接与应用;其四是数据清洗和组织,包括NumPy数组知识、pandas数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括Matplotlib和Pyecharts两个库的使用,涉及饼图、柱形图、线图、词云图、地图等图形,帮助读者进入可视化的殿堂。本书以实战为主,适合Python初学者及高等院校的相关专业学生,也适合Python培训机构作为实验教材使用。零一,原名陈海城,沐垚科技创始人,电商自媒体,资深数据分析师,8年电商从业经验,擅长Excel、PowerBI、R、Python等工具,主要研究数据化运营、商业智能和人工智能在电商领域的应用,专注数据+电商的新零售服务。出版《电商数据分析淘宝实战》《美丽的电商运营日记》《ExcelBI之道:从零开始学Power工具应用》《淘宝、天猫电商数据分析与挖掘实战》联系方式:公众号:start_data,个人号:haicheng1008,邮箱:lingyi@muyaotech.com
提示:如遇问题或者链接还未及时添加,请联系小编 afeiship#qq.com(#换@),我们会尽快处理!

目录

  1. 作者介绍
  2. 前言
  3. 第1章 Python 基础
  4. 1.1 安装 Python 环境
  5. 1.2 Python 操作入门
  6. 1.3 Python数据类型
  7. 1.4 Python 语句与函数
  8. 第2章 写一个简单的爬虫
  9. 2.1 关于爬虫的合法性
  10. 2.2 了解网页
  11. 2.3 使用 requests 库请求网站
  12. 2.4 使用 Beautiful Soup 解析网页
  13. 2.5 清洗和组织数据
  14. 2.6 爬虫攻防战
  15. 第3章 用 API 爬取天气预报数据
  16. 3.1 注册免费 API 和阅读技术文档
  17. 3.2 获取 API 数据
  18. 3.3 存储数据到 MongoDB
  19. 3.4 MongoDB 数据库查询
  20. 第4章 大型爬虫案例:抓取某电商网站的商品数据
  21. 4.1 观察页面特征和解析数据
  22. 4.2 工作流程分析
  23. 4.3 构建类目树
  24. 4.4 获取产品列表
  25. 4.5 代码优化
  26. 4.6 爬虫效率优化
  27. 4.7 容错处理
  28. 第5章 Scrapy 爬虫
  29. 5.1 Scrapy 简介
  30. 5.2 Scrapy 安装
  31. 5.3 案例:用 Scrapy 抓取股票行情
  32. 第6章 Selenium 爬虫
  33. 6.1 Selenium 简介
  34. 6.2 案例:用 Selenium 抓取电商网站数据
  35. 第7 章数据库连接和查询
  36. 7.1 使用 PyMySQL
  37. 7.2 使用 SQLAlchemy
  38. 7.3 MongoDB
  39. 第8章 NumPy
  40. 8.1 NumPy 简介
  41. 8.2 一维数组
  42. 8.3 多维数组
  43. 8.4 数组的运算
  44. 第9章 pandas 数据清洗
  45. 9.1 数据读写、选择、整理和描述
  46. 9.2 数据分组、分割、合并和变形
  47. 9.3 缺失值、异常值和重复值处理
  48. 9.4 时序数据处理
  49. 9.5 数据类型转换
  50. 9.6 正则表达式
  51. 第10章 综合应用实例
  52. 10.1 按性价比给用户推荐旅游产品
  53. 10.2 通过热力图分析为用户提供出行建议
  54. 第11章 数据可视化
  55. 11.1 matplotlib
  56. 11.2 pyecharts
  57. 专业服务