python热搜排行功能_简单几行代码用Python爬取微博的热搜榜
简单几行代码用Python爬取微博的热搜榜
想要实时的看微博热搜 但是又不想去微博网站看!怎么办呢?其实很简单! 我们学了这个requests_html 这个库之后 就更加的简单了! 小编只用了短短的几行代码就Python把所有的热搜结果抓取到了!
然后用审查元素找到热搜词的关键元素的对象"td-02" 我们用requests_html的函数 find 也就是CSS选择器
官方的文档是这样写的!
find(selector: str = '*', *, containing: Union[str, typing.List[str]] = None, clean: bool = False, first: bool = False,_encoding: str = None) → Union[typing.List[_ForwardRef('Element')], _ForwardRef('Element')]
接收一个css选择器参数,返回一个Element对象或Element对象组成的列表。
参数说明:selector - css选择器
clean - 对找到的
containing - 如果指定,则只会返回包含指定文本的Element对象
first - 是否只返回第一个结果
_encoding - 编码格式
CSS选择器示例:a
a.someClass
a#someID
a[target=_blank]
查看CSS选择器的更多详细内容
如果first参数被置为True, 则只返回找到的第一个Element对象
是不是觉得很简单呢? 当然你也可以用XPath 方法可以自己写哦!也可以留言问小编!
废话不多说 直接上代码吧!from requests_html import HTMLSession
session = HTMLSession()
def weibo():
'''
微博热搜榜 实时抓取微博的排行榜!需要设置请求头headers!
'''
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'
}
url = 'https://s.weibo.com/top/summary/summary?cate=realtimehot'
r = session.get(url, headers=headers)
# 查找元素td-02 所有的
r = r.html.find('.td-02')
a = 1
for x in r:
print(str(a) + '>' + x.text)
a += 1
if __name__ == '__main__':
weibo()
运行结果如下图 为了更加直观的看出 我加了序号! 不喜欢的可以去掉!不影响代码的!
python热搜排行功能_简单几行代码用Python爬取微博的热搜榜相关推荐
- python有趣的面试题_一道3行代码的Python面试题,我懵逼了...|python基础教程|python入门|python教程...
https://www.xin3721.com/eschool/pythonxin3721/ 前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时 ...
- 简单几行代码带你爬取王者荣耀皮肤
爬取王者荣耀皮肤 分析思路 源代码 爬取王者荣耀皮肤 分析思路 url:https://pvp.qq.com/web201605/js/herolist.json url还是很容易拼接的 源代码 im ...
- 爬取微博实时热搜数据可视化分析
文章目录 爬取微博实时热搜数据可视化分析 一.爬取数据 1.1 Spider主要函数 1.2 根据微博一分钟更新一次的状态进行爬虫 二.可视化 2.1 利用轮播图加柱状图进行可视化 爬取微博实时热搜数 ...
- 100行代码教你爬取斗图网(Python多线程队列)
100行代码教你爬取斗图网(Python多线程队列) 前言 根据之前写的两篇文章,想必大家对多线程和队列有了一个初步的了解,今天这篇文章就来实战一下,用多线程 + 队列 爬取斗图网的全网图片. 你还在 ...
- python热搜排行功能_用Python做一个微博热搜榜的语音播报
微博是一个社交平台,有高效的信息流,几乎所有人能在这上面找到自己感兴趣的内容.经常使用微博的小伙伴,大家对微博热搜榜应该都不会很陌生.每天发生了什么新闻呢,谁谁谁又上热搜了. 在这个信息社会,每天发生 ...
- python热搜排行功能_手把手教你用Python+Pyecharts让微博热搜榜动起来
今天教大家如何用pyecharts制作微博热搜榜动态展示视频,先上视频看看效果: 教程主要有2部分: 一是python爬取微博热搜内容 二是用pyecharts制作动态视频 下面给大家详细介绍一下 一 ...
- python微博爬虫实战_爬虫实战(一):爬取微博用户信息
前言 最近做课设,是一个有关个人隐私安全的课题,在网上找了很多论文,最后上海交通大学的一篇硕士论文<面向社会工程学的SNS分析和挖掘>[1] 给了我很多灵感,因为是对个人隐私安全进行评估, ...
- python 爬取微博实时热搜,并存入数据库实例
刚学python没几天,打算用paython爬去微博热搜数据试验一下,但是发现微博热搜是动态数据,网页源码并不能直接获取想要的数据,network里也并不能找到相关内容,这时重新查看网页源码,发现有类 ...
- java爬虫自动识别验证码_简单Java爬虫(一)爬取手机号码
原创 野狗菌 希望你能喜欢 今天 关于本文: 本文介绍一个简单Java爬虫,获取网页源码,爬取电话号码. 本篇教程用我的博客一个测试网页演示. --野狗菌[希望你能喜欢] 测试页面: https:// ...
最新文章
- kaldi上第一个免费的中文语音识别例子
- 服务化的未来--ServiceMesh?
- YII2 载入默认值 loadDefaultValues
- c++ override final关键字
- toolStrip 按钮图片大小的修改
- java fx 多个窗口_JavaFX Scene Builder(窗口各种设置)
- 如何卸载赛门铁克(Symantec)企业防病毒客户端软件SEP(Symantec Endpoint Protection)?
- linux 交叉编译ffplay,交叉编译ffmpeg生成ffplay
- 阴阳师服务器维护2月20,《阴阳师》手游2月20日维护更新公告
- java spy_Java Spy-代码跟踪神器
- 只有程序猿才能看懂的段子,不笑你拿小拳拳捶我!!!
- 字符串——BZOJ 3097: Hash Killer I【构造题,思维题】
- 微信小程序_调用openAi搭建虚拟伙伴聊天
- 阿里云服务器CPU Intel Xeon Platinum 8269CY和8163处理器区别
- 哈工大软件构造课程知识点总结(二)
- 显卡驱动的作用(本质作用)
- 社交电商是什么?社交电商如何做好
- 软考access机考什么_软考程序员考试是机考还是笔试
- elasticsearch做如何进行日志采集
- pokemon 下载 android,Pokemon Home