Python 爬虫篇-利用BeautifulSoup库爬取墨迹天气网的天气信息实例演示,调用墨迹天气api接口获取空气质量
安装方法:
pip install BeautifulSoup4
BeautifulSoup 详细使用文档
墨迹天气抓取演示
墨迹天气没有提供专门的天气接口 api,但我们可以用 BeautifulSoup 来简单的爬取到信息。
墨迹天气真的很准呢,里面还有空气质量可以直接获取到,很方便呢。
定位方法:
https://tianqi.moji.com/weather/china/beijing
不确定省后面怎么拼,直接用省的拼写进入页面,然后找到对应的市县区进入后就有路径了。
from urllib.request import urlopen
from bs4 import BeautifulSoupurl = urlopen('https://tianqi.moji.com/weather/china/beijing/haidian-district')
soup = BeautifulSoup(url, 'html.parser') # parser 解析alert = soup.find('div', class_="wea_alert clearfix").em
print("空气质量:" + alert.string)weather = soup.find('div', class_="wea_weather clearfix")
print("当前温度:" + weather.em.string + "℃")
print("天气:" + weather.b.string)
运行效果图:
页面展示:
原理展示:
alert = soup.find('div', class_="wea_alert clearfix")
print(alert)
先找到 class 为 wea_alert clearfix 的 div 标签。
alert.em 用来定位里面的 em 标签。
alert.em.string 用来获取 em 标签里的内容。
喜欢的点个赞❤吧!
Python 爬虫篇-利用BeautifulSoup库爬取墨迹天气网的天气信息实例演示,调用墨迹天气api接口获取空气质量相关推荐
- Python 爬虫进阶篇-利用beautifulsoup库爬取网页文章内容实战演示
我们以 fox新闻 网的文章来举例子,把整篇文章爬取出来. 首先是标题,通过结构可以看出来 class 为 article-header 的节点下的 h1 里的内容即是标题,通过 string 可以获 ...
- 使用Python requests和BeautifulSoup库爬取去哪儿网
功能说明:爬取去哪儿网城市下面若干条景点详细信息并将数据导入Excel表(使用xlwt库) 爬取去哪儿网的教程参考自 https://blog.csdn.net/gscsd_t/article/det ...
- python爬取小说网站资源_利用python的requests和BeautifulSoup库爬取小说网站内容
1. 什么是Requests?html Requests是用Python语言编写的,基于urllib3来改写的,采用Apache2 Licensed 来源协议的HTTP库.python 它比urlli ...
- 每日爬虫练习:bs4库爬取诗词名句网的四大名著
一.前言 2020-04-2日爬虫练习 爬取网站:诗词名句网的四大名著 需求:将四大名著的每一个章节存储到本地 技术路线: 1.requests 2.BeautifulSoup 3.os 二.代码解释 ...
- 【Python爬虫实战】使用Selenium爬取QQ音乐歌曲及评论信息
本文对使用到的技术仅做简单的介绍,若想了解更多,请前往相应的官网网站进行学习. 本文适合对爬虫相关知识接触不多的新手,主要是普及Selenium如何做爬虫,大佬请跳过. 1.Selenium简单介绍 ...
- python爬虫(16)使用scrapy框架爬取顶点小说网
本文以scrapy 框架来爬取整个顶点小说网的小说 1.scrapy的安装 这个安装教程,网上有很多的例子,这里就不在赘述了 2.关于scrapy scrapy框架 是一个非常好的东西,能够实现异步爬 ...
- Python爬虫Selenium手动接管Edge爬取裁判文书网“环境污染”数据(Mac环境)
目标数据:爬取从2007年到2022年,各地级市中级法院历年关于"环境污染"的裁判文书数量. 由于裁判文书网需要登录,Selenium手动接管爬取可避免频繁登录造成的封号风险. S ...
- Python 爬虫篇-利用urllib库下载网页中的图片实例演示
我们用的是 urllib 库,这个库是 python 自带的,我们直接就可以使用. 我们需要来了解一下基本原理,它可以通过图片地址将图片下载下来. 我们来找一张图片做实例看一下. 查看图片的地址,把地 ...
- Python爬虫项目实例——多协程爬取【薄荷网】的食物热量
爬虫网站:http://www.boohee.com/food/group 爬的信息:食物的名称及热量 代码: import gevent from gevent.queue import Queue ...
最新文章
- Kafka:你必须要知道集群内部工作原理的一些事!
- 企业网站推广方案详解
- 十五天精通WCF——第十四天 一起聊聊FaultException
- win32 禁用缩放功能_Firefox 73 将引入全局缩放功能,在所有网站都可适用
- [渝粤教育] 西南科技大学 智能交通系统 在线考试复习资料
- 管理Shader——Shader概览
- u盘版linux initramfs,Linux_内核升级后 出现initramfs错误问题解决, 出现initramfs找不到/root /hos - phpStudy...
- Linux Shell编程笔记6 sed流编辑器
- php发起预约申请,php版微信公众平台实现预约提交后发送email的方法
- 《裸辞后,降薪找工作》
- python编写自定义函数计算约登值(约登指数、Youden Index)、寻找最佳阈值(threshold、cutoff)、以及最佳阈值对应的ROC曲线中的坐标点
- 如何使用pdf转换器
- 开机后黑屏看不到桌面_电脑开机黑屏只有鼠标怎么办?电脑开机后不显示桌面的多种解决方法...
- uniapp tabBar角标问题
- 2017 ACM Arabella Collegiate Programming Contest(solved 9/13, complex 12/13)
- Spark 的宽依赖和窄依赖
- android svg路径动画,Svg 路径动画实现旋转进度条
- 冗余分析(RDA)中若包含生物学重复会怎样?
- 传球游戏_vijos1485
- 解决正点原子Linux开发板配置静态IP重启后失效的问题