python爬虫,爬取表格数据

python爬虫,爬取表格数据

python爬虫,爬取全国空气质量指数

编程环境:Jupyter Notebook

所要爬取的网页数据内容如下图

python爬虫代码及含义详细说明

#全国城市

import time

import requests

from bs4 import BeautifulSoup

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'

}#爬虫[Requests设置请求头Headers],伪造浏览器

# 核心爬取代码

url= 'http://www.tianqihoubao.com/aqi/aqi_rank.html'

params = {"show_ram":1}

response = requests.get(url,params=params, headers=headers)#访问url

listData=[]#定义数组

soup = BeautifulSoup(response.text, 'html.parser')#获取网页源代码

tr = soup.find('table',class_='b').find_all('tr')#.find定位到所需数据位置 .find_all查找所有的tr(表格)

# 去除标签栏

for j in tr[1:]: #tr2[1:]遍历第1列到最后一列,表头为第0列

td = j.find_all('td')#td表格

Date = td[0].get_text().strip() #遍历排名

Quality_grade = td[1].get_text().strip() #遍历城市

AQI = td[2].get_text().strip() #遍历空气质量指数AQI

AQI_rank = td[3].get_text().strip() #遍历PM2.5浓度

PM = td[4].get_text() #遍历空气质量状况

Cities = td[5].get_text() #遍历省份

listData.append([Date,Quality_grade,AQI,AQI_rank,PM,Cities])

print (listData)#打印

运行结果如下

python爬虫,爬取表格数据相关教程

python爬表格数据_python爬虫,爬取表格数据相关推荐

  1. python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  2. python解析网页数据_python爬虫——爬取网页数据和解析数据

    1.网络爬虫的基本概念 网络爬虫(又称网络蜘蛛,机器人),就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序. 只要浏览器能够做的事情,原则上,爬虫都能够做到. ...

  3. python爬取js加载的数据_Python爬虫:爬取JS加载数据的网页

    比如简书: Paste_Image.png 我们来写个程序,爬取简书网站随便一个作者的所有文章,再对其所有文章进行分词统计 程序运行统计的结果见文章: 我统计了彭小六简书360篇文章中使用的词语 需要 ...

  4. python爬虫爬取股票软件数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储(转载)...

    完整代码 实际上,整个事情完成了两个相对独立的过程:1.爬虫获取网页股票数据并保存到本地文件:2.将本地文件数据储存到MySQL数据库.并没有直接的考虑把从网页上抓取到的数据实时(或者通过一个临时文件 ...

  5. python爬电影天堂_python爬虫爬取电影天堂电影

    python爬虫爬取电影天堂电影?本项目实现一个简单的爬虫,通过requests和BeautifulSoup爬取电影天堂电影信息,包括片名.年代.产地.类别.语言.海报链接和视频链接等内容.pytho ...

  6. python爬去新浪微博_Python爬虫爬取新浪微博内容示例【基于代理IP】

    Python爬虫爬取新浪微博内容示例[基于代理IP] 发布时间:2020-09-07 10:08:14 来源:脚本之家 阅读:120 本文实例讲述了Python爬虫爬取新浪微博内容.分享给大家供大家参 ...

  7. python爬取分页数据_爬虫抓取分页数据的简单实现

    昨天,我们已经利用Jsoup技术实现了一个简单的爬虫,原理很简单,主要是要先分析页面,拿到条件,然后就去匹配url,采用dome解析的方式循环抓取我们需要的数据,从而即可轻松实现一个简单的爬虫.那么, ...

  8. python怎么爬网站视频教程_python爬虫爬取某网站视频的示例代码

    把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载.(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载) 实现代码如下: from bs4 import B ...

  9. java怎么爬网易云_Python爬虫爬取网易云的音乐

    Python爬虫爬取网易云的音乐(学习笔记) 在开始之前,做一点小小的说明哈: 我只是一个python爬虫爱好者,如果本文有侵权,请联系我删除! 本文需要有简单的python爬虫基础,主要用到两个爬虫 ...

最新文章

  1. 微型计算机存取速度,微型计算机中,存取速度由快到慢排序:
  2. python 笔记:读取mat文件
  3. sublime txt常用插件推荐
  4. 【机器学习经典算法源码分析系列】-- 逻辑回归
  5. RMQ算法,求区间最值
  6. Markdown入门指导
  7. java 多态,接口,抽象类的认识
  8. SCUT - 244 - 全新的游戏 - 凸包
  9. 智能移动项目打包发布经验交流
  10. Postgresql 9.3外部数据封装的新功能
  11. Visual Studio安装及无法打开包括文件: “crtdbg.h”问题解决
  12. 【从零开始学习Go语言】一.初识Go语言
  13. 真是绝了,做了这么多年程序员第一次搞懂微服务架构的数据一致性
  14. 车辆运动控制(1)车辆运动学建模
  15. 罗大佑的童年用计算机咋弹,罗大佑《童年》吉他弹奏教学-520吉他网
  16. 让div填满剩下的空间
  17. 经营报表-FineReport配置Oracle外接数据库(2)
  18. win10卸载电脑管家就蓝屏_99%的电脑都有的win10蓝屏问题,两步就能解决!
  19. 不会英语可以学计算机编程吗,不会英语的人应该怎么学编程
  20. TMC7300-LA:微型直流有刷电机驱动

热门文章

  1. [css] css 3d 动画,跟随鼠标移动做球形旋转
  2. 这个Kaggle三项排行榜的“顶级大师”,今年17岁
  3. 目标检测2020-2021
  4. iOS 磁场传感器的应用 Swift CoreMotion使用
  5. 前端解决图片404的问题
  6. 物流行业SaaS多租用商城系统:提升企业物流管理效率,实现高效协同
  7. Android 图片选取画图案
  8. 计算机考试当天准考证身份证丢失
  9. 清华计算机系科学博士毕业论文要求,博士可以不发SCI毕业?清华取消博士论文发表强制要求...
  10. 2020年11月 工信部考试——Hadoop(数据应用技术)中级认证3