成果

代码

import time
from WebWorm.RandomHeader import *
import requests
from bs4 import BeautifulSoup# 爬取微博实时热事
def weiBo():# 微博热搜URLurl = 'https://s.weibo.com/top/summary'# 随机头headers = {"User-Agent": getRandomHeader()}# 请求网页response = requests.get(url, headers=headers)# 设置编码response.encoding = 'utf-8'# 得到网页内容html = response.text# 解析htmlinfo = BeautifulSoup(html, "html.parser")# 抓取tbody下面的a标签a = info.find('tbody').findAll('a')# 存放所有的新闻news = []# 遍历a标签for i in a:# 把新闻内容加入数组news.append(i.text)# 获取当前时间date = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())date = date.replace(' ', '-')# 把新闻写入文件with open(date + '-WeiBoNews.txt', mode='w', encoding='utf-8') as file:for i in news:file.write(i + '\n')def baiDu():# 百度热搜URLurl = 'http://top.baidu.com/buzz?b=1&fr=topindex'# 随机头headers = {"User-Agent": getRandomHeader()}# 请求网页response = requests.get(url, headers=headers)# 设置编码response.encoding = 'gbk'# 得到网页内容html = response.text# 解析htmlinfo = BeautifulSoup(html, "html.parser")# 抓取a标签a = info.findAll(name="a", attrs={"class": "list-title"})# 存放所有的新闻news = []# 遍历a标签for i in a:# 把新闻内容加入数组news.append(i.text)# 获取当前时间date = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())date = date.replace(' ', '-')# 把新闻写入文件with open(date + '-BaiDuNews.txt', mode='w', encoding='utf-8') as file:for i in news:file.write(i + '\n')if __name__ == '__main__':# 爬取微博实时热事weiBo()#  爬取百度实时热事baiDu()

总结

可以定时爬取发送邮件给自己,每天阅读两分钟,了解天下事。

Python 爬取微博、百度实时热点相关推荐

  1. python爬取微博热搜榜

    python爬取微博热搜榜 最近应我大学室友得需求,做了一个简单的爬虫案例,先给大家看一下程序运行效果 接下来就是贴出代码了,在这里我会做一些简单说明,对如刚入门的同学可能会有所帮助,这里使用的是py ...

  2. python热搜排行功能_简单几行代码用Python爬取微博的热搜榜

    简单几行代码用Python爬取微博的热搜榜 想要实时的看微博热搜 但是又不想去微博网站看!怎么办呢?其实很简单! 我们学了这个requests_html 这个库之后 就更加的简单了! 小编只用了短短的 ...

  3. 看看你爱的他今天是什么‘颜色‘ -- Python爬取微博评论制作专属偶像词云

    简介:快来拿出你珍藏的pick star,用大家对他的爱重塑一个他吧.通过爬取微博评论,制作你的偶像图片词云,天天都是不重样的哦! 很多人学习python,不知道从何学起. 很多人学习python,掌 ...

  4. python爬取微博热搜数据并保存!

    主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下importrequests;importbs4mylist=[]r=requests.get(ur- 很多 ...

  5. python爬取微博话题下面的帖子并存入excel文件

    此次写的是python爬取微博话题下面的帖子,示例代码以爬取#转发这个杨超越# https://s.weibo.com/weibo/%23%E8%BD%AC%E5%8F%91%E8%BF%99%E4% ...

  6. python爬取微博数据词云_用Python爬取微博数据生成词云图片

    原标题:用Python爬取微博数据生成词云图片 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 对商业智能BI.大数 ...

  7. python3爬取微博评论教程_用python 爬取微博评论,怎么打开微博评论下的查看更多|...

    怎样用python爬新浪微博大V所有数据 先上结论,通过公开的api如爬到某大v的所有数据,需足以下两个条件: 1.在你的爬虫开始运行时,该大v的所有微博发布量没有超过回溯查询的上限,新浪是2000, ...

  8. python爬取微博热门消息(一)——效果展示

    微博的热搜榜对于研究大众的流量有非常大的价值. 今天的教程就来说说如何爬取微博的热搜榜. 感兴趣的小伙伴可以 收藏 + 关注 哦! 另外,关于本项目的效果展示,以及教程,点击一下链接即可. pytho ...

  9. python爬取微博热门消息(三)—— 爬取微博热门信息的功能函数

    微博的热搜榜对于研究大众的流量有非常大的价值. 今天的教程就来说说如何爬取微博的热搜榜. 感兴趣的小伙伴可以 收藏 + 关注 哦! 另外,关于本项目的效果展示,以及教程,点击一下链接即可. pytho ...

  10. python爬取微博热搜写入数据库_python实现爬取微博热搜存入Mysql

    python爬取微博热搜存入Mysql最终的效果 使用的库 目标分析 一:得到数据 二:链接数据库 总代码 最终的效果 废话不多少,直接上图 这里可以清楚的看到,数据库里包含了日期,内容,和网站lin ...

最新文章

  1. 独家 | Bamboolib:你所见过的最有用的Python库之一(附链接)
  2. 通过XShell将linux服务器上的Tomcat下项目部署后,怎样对日志操作来调试
  3. 数据结构-----Trie树
  4. 图像bayer格式介绍以及bayer插值原理CFA
  5. 前端学习(3032):vue+element今日头条管理-反馈
  6. linux用户的vim命令无效,Linux SUDO Bug可让您以root用户身份运行命令,大多数命令不受影响...
  7. javascript中 __proto__与prorotype的理解
  8. Python+OpenCV:Hough直线检测(Hough Line Transform)
  9. [Unity菜鸟] Character控制移动
  10. gephi java教程_gephi生成图(java版)
  11. Python3之标准库
  12. python算法爬楼梯
  13. 串联两个路由器共享宽带上网
  14. 从零开始,耗时两年,19岁小伙自制一块32位Risc-V处理器,可玩「贪吃蛇」
  15. 越南edu学生校园校友邮箱申请UNIDAYS学生认证登录Apple music原创教程
  16. Google Earth Engine——MERRA-2 M2T1NXAER:1980-2022年气溶胶逐日数据集
  17. 剑指offer.把数字翻译成字符串
  18. Upload 上传:图片上传
  19. RTSP安防网络摄像头/海康大华硬盘录像机网页无插件直播流媒体服务器EasyNVR证书配置页面按钮无法正常打开和关闭的问题解析
  20. 这届铲屎官不错,既舍得花钱,又会科学养猫养狗

热门文章

  1. 树莓派是网盘?nextcloud在树莓派上的应用
  2. 一招教你在Linux命令行下测网速
  3. No application encryption key has been specified laravel
  4. 全栈工程师修炼指南 - 学习/实践
  5. 大一学生一周十万字爆肝版C语言总结笔记
  6. 从魔兽世界论专业队友的重要性
  7. java报表开发(bi报表开发)
  8. 解决 Client.Timeout exceeded while awaiting headers或Docker Pulling fs layer net/http: TLS handshake的方案
  9. 深入剖析eMule 【for_wind】
  10. stm32出现ram、rom不够用,调试方法