A8

书    名:Python 3爬虫 数据清洗与可视化实战

作 译 者:零一,韩要宾,黄园园

出版时间:2018-03

千 字 数:200

版    次:01-01

页    数:212

开    本:16开

I S B N :9787121333590

定价:¥49.00

1 章 Python 基础  1

11 安装Python 环境 1

111 Python 362 安装与配置  1

112 使用IDE 工具——PyCharm  4

113 使用IDE 工具——Anaconda  4

12 Python 操作入门  6

121 编写一个Python 代码  6

122 Python 基本操作  9

123 变量  10

13 Python 数据类型  10

131 数字  10

132 字符串 11

133 列表  13

134 元组  14

135 集合  15

136 字典  15

14 Python 语句与函数  16

141 条件语句  16

142 循环语句  16

143 函数  17

2 章 写一个简单的爬虫  18

21 关于爬虫的合法性  18

22 了解网页  20

221 认识网页结构  21

222 写一个简单的HTML  21

23 使用requests 库请求网站  23

Python 3 爬虫、数据清洗与可视化实战

231 安装requests 库  23

232 爬虫的基本原理  25

233 使用GET 方式抓取数据  26

234 使用POST 方式抓取数据  27

24 使用Beautiful Soup 解析网页  30

25 清洗和组织数据  34

26 爬虫攻防战  35

3 章 用API 爬取天气预报数据  38

31 注册免费API 和阅读技术文档  38

32 获取API 数据  40

33 存储数据到MongoDB  45

331 下载并安装MongoDB  45

332 在PyCharm 中安装Mongo Plugin  46

333 将数据存入MongoDB  49

34 MongoDB 数据库查询  52

4 章 大型爬虫案例:抓取某电商网站的商品数据  55

41 观察页面特征和解析数据  55

42 工作流程分析  64

43 构建类目树  65

44 获取产品列表  68

45 代码优化  70

46 爬虫效率优化  74

47 容错处理  77

5 章 Scrapy 爬虫  78

51 Scrapy 简介  78

52 Scrapy 安装  79

53 案例:用Scrapy 抓取股票行情  80

6 章 Selenium爬虫  88

61 Selenium 简介  88

62 案例:用Selenium 抓取电商网站数据  90

7 章 数据库连接和查询  100

71 使用PyMySQL  100

711 连接数据库  100

712 案例:某电商网站女装行业T O P100 销量数据  102

72 使用SQLAlchemy  104

721 SQLAlchemy 基本介绍  104

722 SQLAlchemy 基本语法  105

73 MongoDB  107

731 MongoDB 基本语法  107

732 案例:在某电商网站搜索“连衣裙”的商品数据  107

8 章 NumPy  109

81 NumPy 简介  109

82 一维数组 110

821 数组与列表的异同 110

822 数组的创建  111

83 多维数组  111

831 多维数组的高效性能 112

832 多维数组的索引与切片 113

833 多维数组的属性 113

84 数组的运算 115

9 章 pandas 数据清洗  117

91 数据读写、选择、整理和描述 117

911 从CSV 中读取数据 119

912 向CSV 写入数据  120

913 数据选择  120

914 数据整理  122

915 数据描述  123

92 数据分组、分割、合并和变形  124

921 数据分组  124

922 数据分割  127

923 数据合并  128

924 数据变形  134

925 案例:旅游数据的分析与变形  136

Python 3 爬虫、数据清洗与可视化实战

93 缺失值、异常值和重复值处理  140

931 缺失值处理  140

932 检测和过滤异常值  144

933 移除重复数据  147

934 案例:旅游数据的值检查与处理  149

94 时序数据处理  152

941 日期/时间数据转换  152

942 时序数据基础操作  153

943 案例:天气数据分析与处理  155

95 数据类型转换  158

96 正则表达式  160

961 元字符与限定符  161

962 案例:用正则表达式提取网页文本信息  162

10 章 综合应用实例  164

101 按给用户推荐旅游产品  164

1011 数据采集  165

1012 数据清洗、建模  169

102 通过热力图分析为用户提供出行建议  172

1021 某旅游网站热门景点爬虫代码(qunaer_sightspy)  175

1022 提取CSV 文件中经纬度和销量信息  178

1023 创建景点门票销量热力地图HTML 文件  179

11 章 数据可视化  182

111 matplotlib  183

1111 画出各省份平均价格、各省份平均成交量柱状图  183

1112 画出各省份平均成交量折线图、柱状图、箱形图和饼图  184

1113 画出价格与成交量的散点图  185

112 pyecharts  186

1121 Echarts 简介  186

1122 pyecharts 简介  187

1123 初识pyecharts,玫瑰相送  187

1124 pyecharts 基本语法  188

1125 基于商业分析的pyecharts 图表绘制  190

1126 使用pyecharts 绘制其他图表  199

1127 pyecharts 和Jupyter  203

本书内容来自笔者在浙江某高校授课内容,主要介绍运用Python工具获取电商平台的页面数据,并对数据做清洗和存储。本书简化了Python基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容,对于Python基础,建议新手可以选购对应的基础书籍配合本书一起学习。0123456789

python爬取淘宝商品做数据挖掘_Python 3爬虫 数据清洗与可视化实战 Python数据抓取技术 python3网络爬虫教程书籍 运用Python工具获取电商平台页面数据挖掘书籍...相关推荐

  1. python爬取淘宝商品做数据挖掘

    作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 项目内容: 本项目选择 淘宝商品类目:零食 数量:一共100页,44 ...

  2. 利用Python爬虫爬取淘宝商品做数据挖掘分析实战篇,超详细教程

    项目内容 本案例选择>> 商品类目:沙发: 数量:共100页  4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...

  3. [Python3网络爬虫开发实战] 7-动态渲染页面爬取-4-使用Selenium爬取淘宝商品

    在前一章中,我们已经成功尝试分析Ajax来抓取相关数据,但是并不是所有页面都可以通过分析Ajax来完成抓取.比如,淘宝,它的整个页面数据确实也是通过Ajax获取的,但是这些Ajax接口参数比较复杂,可 ...

  4. 无法爬取淘宝商品页面

    问题描述:无法爬取淘宝商品页面 案例如下: import requests import redef getHTMLText(url):try: r = requests.get(url,timeou ...

  5. 使用Selenium爬取淘宝商品(绕过登录页面)

    文章目录 1.准备工作 2.接口分析 3.页面分析 4.获取商品列表 5.解析商品列表 6.保存到MongoDB 7.遍历每页 8.异常处理(绕过登录反爬机制) 方法一:修改ChromeDriver. ...

  6. Python爬取淘宝商品信息保存到Excel

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  7. Python爬虫:Selenium模拟Chrome浏览器爬取淘宝商品信息

    对于采用异步加载技术的网页,有时候想通过逆向工程的方式来设计爬虫进行爬取会比较困难,因此,要想通过python获取异步加载数据往往可以使用Selenium模拟浏览器的方式来获取. Selenium是一 ...

  8. python爬淘宝商品销量信息_python爬取淘宝商品销量信息

    python爬取淘宝商品销量的程序,运行程序,输入想要爬取的商品关键词,在代码中的'###'可以进一步约束商品的属性,比如某某作者的书籍,可以在###处输入作者名字,以及时期等等.最后可以得到所要商品 ...

  9. python爬取淘宝商品图片

    python爬取淘宝商品的图片 话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...

最新文章

  1. linux下编译wpa_supplicantnbsp;…
  2. Plasma链0x1的构造
  3. java media_unmount file_(20120801)android文件的读写SD卡总结
  4. php 的cookie设置时间,php cookie时间设置的方法-PHP问题
  5. DocumentNavigator是什么东东?
  6. 依弗科(上海)机电设备有限公司
  7. jQuery:表格的奇偶行变色,jquery实例之表格隔一行
  8. linux socket ip层配置,Linux下Socket通信(TCP实现)
  9. android qt 串口通信,Qt串口通信开发之QSerialPort模块详细使用方法与实例
  10. EF mysql 数据迁移_Asp.Net Core EFCore Migrations 数据迁移
  11. 移动端APP测试概要
  12. IIS7的应用程序池详细解析
  13. Axure各种版本注册码 | 最新Axure RP 8.1.0.3377的授权码
  14. Graphpad prism 使用教程汇总(更新)
  15. IndentationError: expected an indented block 解决
  16. 大前端课程学习心得体会+学习笔记
  17. win10没有声音(扬声器一直显示未插入)
  18. 数据库管理-第二十九期 记一次AFD环境的存储变更(20220803)
  19. 分享个解决右键没有新建TXT文档的办法
  20. leaflet绘制图形,wkt模式与geoJson互转

热门文章

  1. 安装debian第一天遇到的几个问题及解决方案
  2. [转]QT中QString与string的转化,解决中文乱码问题
  3. eclipse导入项目后出现红色叉号的解决方案
  4. 解决IntelliJ IDEA无法读取配置文件的问题
  5. C ++ 11基于反向范围的for循环
  6. MySQL 8.0版本无法使用 node、Navicat等三方工具连接的问题
  7. 简单易用且功能丰富的纯Swift下载框架
  8. python文件操作举例
  9. php----http协议 Cookie
  10. ZABBIX安装官方指南