用python爬虫爬取微博信息

话不多说,直接上代码!

import requests
from bs4 import BeautifulSoup
from urllib import parse
import timeheaders = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36 Edg/84.0.522.52"}def get_html(url):html = requests.get(url,headers=headers)if html.status_code==200:print("获取页面成功")parse_html(html.text)else:print("ERROR",html.text)returndef parse_html(content):soup = BeautifulSoup(content,'lxml')trs = soup.select('table tbody tr')for tr in trs:title = tr.select_one('td a').texturl = tr.select_one('td a')['href']url = parse.urljoin('https://s.weibo.com',url)message = title+url+'\n'with open("C:/Users/86135/Desktop/微博信息.txt",'at',encoding='utf-8') as f:f.write(message)f.close()if __name__ == '__main__':start = time.time()url = "https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6"get_html(url)url2 = "https://s.weibo.com/top/summary?cate=socialevent"get_html(url2)print(time.time()-start)

运行结果如下:

用python爬虫爬取微博信息相关推荐

  1. php抓取微博评论,python爬虫爬取微博评论案例详解

    前几天,杨超越编程大赛火了,大家都在报名参加,而我也是其中的一员. 在我们的项目中,我负责的是数据爬取这块,我主要是把对于杨超越 的每一条评论的相关信息. 数据格式:{"name" ...

  2. python爬虫-爬取微博转评赞data信息

    利用python简单爬取新浪微博(转发/评论/点赞/blog文本)信息 import requests import json from jsonpath import jsonpath import ...

  3. python爬虫爬取房源信息

      目录 一.数据获取与预处理 二.csv文件的保存 三.数据库存储 四.爬虫完整代码 五.数据库存储完整代码 写这篇博客的原因是在我爬取房产这类数据信息的时候,发现csdn中好多博主写的关于此类的文 ...

  4. Python爬虫爬取微博评论案例详解

    文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 前几天,杨超越编程大赛火了,大家都在报名参加,而我也是其中的一员. 在我们的项目中 ...

  5. 复工复产,利用Python爬虫爬取火车票信息

    文章目录 Python 爬虫操作基本操作 python 标准库 urllib 获取信息 上传信息 python 标准库 urllib3 获取信息 上传信息 第三方库 requests 获取特征信息 模 ...

  6. python 爬虫爬取小说信息

    1.进入小说主页(以下示例是我在网上随便找的一片小说),获取该小说的名称.作者以及相关描述信息 2.获取该小说的所有章节列表信息(最重要的是每个章节的链接地址href) 3.根据每个章节的地址信息下载 ...

  7. Python爬虫爬取微博热搜保存为 Markdown 文件

    微博热搜榜python爬虫,仅供学习交流 源码及注释: # -*- coding=UTF-8 -*- #!usr/bin/env pythonimport os import time import ...

  8. python爬虫爬取网页信息

    爬虫流程:准备工作➡️爬取网页,获取数据(核心)➡️解析内容➡️保存数据 解析页面内容:使用beautifulsoup定位特定的标签位置,使用正则表达式找到具体内容 import导入一些库,做准备工作 ...

  9. python爬虫爬取华硕笔记本信息

    之前一个朋友麻烦我帮他爬取一下华硕笔记本信息,最后存储为一个csv格式的文件,文件格式为"系列 型号".本文为本人实现该爬虫的心路旅程. 目录 一.获取系列信息 1. 爬虫可行性分 ...

最新文章

  1. echarts切换折线图变大_这个月,我就和折线图杠上了...
  2. SQL Server 2008 R2如何开启数据库的远程连接
  3. hadoop文件写入
  4. 差分放大电路差模共模公式_提高差分放大器的共模抑制比,电阻的选择很关键...
  5. python并发编程2-进程
  6. 【C#学习之旅】一、数据类型
  7. 【代码笔记】iOS-performSelectorOnMainThread
  8. linux内核设计与实现 epub_mongodb内核源码设计实现、性能优化、最佳运维系列-网络传输层模块源码实现四...
  9. 跨界 +赋能——互联网的下一个关键词
  10. android textwatcher 延时,Android TextWatcher监控EditText中的输入内容并限制其个数
  11. python 删除指定目录_删除Python中除一个子目录外的目录
  12. 【已解决】C盘-系统引导盘扩大容量
  13. 移动开发者的必知音视频基础知识
  14. 请你设计一个用于填充n阶方阵的上三角区域的程序。
  15. 失业参加聚会_谁被邀请参加聚会?
  16. 微信小程序的五种跳转方式
  17. 环境部署经验老衲悄悄的
  18. 空气炸锅能从“网红”到“长红”吗?
  19. 极兔、百世被罚后:每单涨价 4、5 毛
  20. 计算机公式大小写,excel大写金额公式

热门文章

  1. 一分钟应对勒索病毒WannaCry
  2. 后台分页工具类(.net)
  3. 隐藏Apache的版本号及其它敏感信息
  4. Android自定义View分享——仿网易云音乐留声机效果
  5. VMware虚拟机安装Windows2003操作教程
  6. Android Fragment(三)ListFragment简单介绍以及Fragment之间通信
  7. 八、ILI2511 初版调试
  8. Chinese Lovers’ Day
  9. js实现密码输入框点击小眼睛显示或隐藏密码
  10. 微信小程序04---头像上传、瀑布流、下拉刷新、触底加载更多、分包