简单几行代码用Python爬取微博的热搜榜

想要实时的看微博热搜 但是又不想去微博网站看!怎么办呢?其实很简单! 我们学了这个requests_html 这个库之后 就更加的简单了! 小编只用了短短的几行代码就Python把所有的热搜结果抓取到了!

然后用审查元素找到热搜词的关键元素的对象"td-02"  我们用requests_html的函数 find 也就是CSS选择器

官方的文档是这样写的!

find(selector: str = '*', *, containing: Union[str, typing.List[str]] = None, clean: bool = False, first: bool = False,_encoding: str = None) → Union[typing.List[_ForwardRef('Element')], _ForwardRef('Element')]

接收一个css选择器参数,返回一个Element对象或Element对象组成的列表。

参数说明:selector - css选择器

clean - 对找到的

containing - 如果指定,则只会返回包含指定文本的Element对象

first - 是否只返回第一个结果

_encoding - 编码格式

CSS选择器示例:a

a.someClass

a#someID

a[target=_blank]

查看CSS选择器的更多详细内容

如果first参数被置为True, 则只返回找到的第一个Element对象

是不是觉得很简单呢? 当然你也可以用XPath 方法可以自己写哦!也可以留言问小编!

废话不多说 直接上代码吧!from requests_html import HTMLSession

session = HTMLSession()

def weibo():

'''

微博热搜榜 实时抓取微博的排行榜!需要设置请求头headers!

'''

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'

}

url = 'https://s.weibo.com/top/summary/summary?cate=realtimehot'

r = session.get(url, headers=headers)

# 查找元素td-02 所有的

r = r.html.find('.td-02')

a = 1

for x in r:

print(str(a) + '>' + x.text)

a += 1

if __name__ == '__main__':

weibo()

运行结果如下图 为了更加直观的看出 我加了序号! 不喜欢的可以去掉!不影响代码的!

python热搜排行功能_简单几行代码用Python爬取微博的热搜榜相关推荐

  1. python有趣的面试题_一道3行代码的Python面试题,我懵逼了...|python基础教程|python入门|python教程...

    https://www.xin3721.com/eschool/pythonxin3721/ 前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时 ...

  2. 简单几行代码带你爬取王者荣耀皮肤

    爬取王者荣耀皮肤 分析思路 源代码 爬取王者荣耀皮肤 分析思路 url:https://pvp.qq.com/web201605/js/herolist.json url还是很容易拼接的 源代码 im ...

  3. 爬取微博实时热搜数据可视化分析

    文章目录 爬取微博实时热搜数据可视化分析 一.爬取数据 1.1 Spider主要函数 1.2 根据微博一分钟更新一次的状态进行爬虫 二.可视化 2.1 利用轮播图加柱状图进行可视化 爬取微博实时热搜数 ...

  4. 100行代码教你爬取斗图网(Python多线程队列)

    100行代码教你爬取斗图网(Python多线程队列) 前言 根据之前写的两篇文章,想必大家对多线程和队列有了一个初步的了解,今天这篇文章就来实战一下,用多线程 + 队列 爬取斗图网的全网图片. 你还在 ...

  5. python热搜排行功能_用Python做一个微博热搜榜的语音播报

    微博是一个社交平台,有高效的信息流,几乎所有人能在这上面找到自己感兴趣的内容.经常使用微博的小伙伴,大家对微博热搜榜应该都不会很陌生.每天发生了什么新闻呢,谁谁谁又上热搜了. 在这个信息社会,每天发生 ...

  6. python热搜排行功能_手把手教你用Python+Pyecharts让微博热搜榜动起来

    今天教大家如何用pyecharts制作微博热搜榜动态展示视频,先上视频看看效果: 教程主要有2部分: 一是python爬取微博热搜内容 二是用pyecharts制作动态视频 下面给大家详细介绍一下 一 ...

  7. python微博爬虫实战_爬虫实战(一):爬取微博用户信息

    前言 最近做课设,是一个有关个人隐私安全的课题,在网上找了很多论文,最后上海交通大学的一篇硕士论文<面向社会工程学的SNS分析和挖掘>[1] 给了我很多灵感,因为是对个人隐私安全进行评估, ...

  8. python 爬取微博实时热搜,并存入数据库实例

    刚学python没几天,打算用paython爬去微博热搜数据试验一下,但是发现微博热搜是动态数据,网页源码并不能直接获取想要的数据,network里也并不能找到相关内容,这时重新查看网页源码,发现有类 ...

  9. java爬虫自动识别验证码_简单Java爬虫(一)爬取手机号码

    原创 野狗菌 希望你能喜欢 今天 关于本文: 本文介绍一个简单Java爬虫,获取网页源码,爬取电话号码. 本篇教程用我的博客一个测试网页演示. --野狗菌[希望你能喜欢] 测试页面: https:// ...

最新文章

  1. kaldi上第一个免费的中文语音识别例子
  2. 服务化的未来--ServiceMesh?
  3. YII2 载入默认值 loadDefaultValues
  4. c++ override final关键字
  5. toolStrip 按钮图片大小的修改
  6. java fx 多个窗口_JavaFX Scene Builder(窗口各种设置)
  7. 如何卸载赛门铁克(Symantec)企业防病毒客户端软件SEP(Symantec Endpoint Protection)?
  8. linux 交叉编译ffplay,交叉编译ffmpeg生成ffplay
  9. 阴阳师服务器维护2月20,《阴阳师》手游2月20日维护更新公告
  10. java spy_Java Spy-代码跟踪神器
  11. 只有程序猿才能看懂的段子,不笑你拿小拳拳捶我!!!
  12. 字符串——BZOJ 3097: Hash Killer I【构造题,思维题】
  13. 微信小程序_调用openAi搭建虚拟伙伴聊天
  14. 阿里云服务器CPU Intel Xeon Platinum 8269CY和8163处理器区别
  15. 哈工大软件构造课程知识点总结(二)
  16. 显卡驱动的作用(本质作用)
  17. 社交电商是什么?社交电商如何做好
  18. 软考access机考什么_软考程序员考试是机考还是笔试
  19. elasticsearch做如何进行日志采集
  20. pokemon 下载 android,Pokemon Home

热门文章

  1. 投影仪玩法多,你知道如何使用
  2. JavaWeb跨域单点登录
  3. Java_面向对象编程-2
  4. Apache Dubbo RSocket Gateway 入门教程
  5. windows系统推荐必装软件
  6. 魔兽世界私服单机版中maps,vmaps,mmaps地图的作用
  7. 什么才是合格的系统交付-交付内容说明
  8. [siggraph13]《使命召唤:黑色行动2》的光照技术
  9. 掌握了这些技巧,电商直播带货就能高效完成
  10. java 集合排序(Comparable、Comparator)