1,微博网页版爬取难度较大,本次爬取手机版评论数据:m.weibo.cn;
2,评论网页为动态的,查看方式network----XHR----请求对应的url


注:url中的id,mid与微博地址中的后缀一致,评论往下滑,20条之后,会出现新的url,新的url中多了max_id,该参数类似分页参数,在preview的data下面有,该max_id即下一条url中的max_id


import requests
import json
import pprint
import pandas as pd
import re#服务器返回的内容用变量接收
response=requests.get('https://m.weibo.cn/comments/hotflow?id=4664928428097689&mid=4664928428097689&max_id_type=0')print(response.text)
print(json.loads(response.text))
pprint.pprint(json.loads(response.text))#字典数据
data=json.loads(response.text)
pprint.pprint(data)
users=data['data']['data']lname=[]
ltext=[]
for user in users:#print(user['user']['id'])#print(user['user']['screen_name'])#print(user['text'])text=user['text']text=re.sub(r'<[^>]*>','',user['text'])  #去除图片name=user['user']['screen_name']print(name)print(text)lname.append(name)ltext.append(text)df=pd.DataFrame({'name':lname,'comment':ltext})
df=df[['name','comment']]df.to_excel(r'D:\comment.xlsx')

某条微博评论数据爬取相关推荐

  1. 微博评论数据爬取以及分析

    #不许你没看过の系列!# 吹爆最近的国漫<哪吒之魔童降世> 从故事情节.角色设计到特效处理 都非常牛!!! #连海报都好好看啊# 上映首周票房已经达到14.1亿! 打破国漫票房记录! 豆瓣 ...

  2. python抓取微博评论_Python爬取新浪微博评论数据,你有空了解一下?

    开发工具 Python版本:3.6.4 相关模块: argparse模块: requests模块: jieba模块: wordcloud模块: 以及一些Python自带的模块. 环境搭建 安装Pyth ...

  3. 腾讯新闻评论数据爬取

    前言 鉴于最近在做观点挖掘的相关工作,观点的数据源是网络评论数据,于是第一个想到的就是新闻观点数据,一个热门的新闻可能一晚上就会有上万条评论,所以如何分析并利用好这些评论信息,将会是一件非常有意思的事 ...

  4. 爬虫项目八:Python对天猫商品数据、评论数据爬取

    文章目录 前言 一.商品数据 1.分析url 2.登录账号 3.解析数据 4.模拟滑动滑块 二.评论数据 1.分析url 2.解析数据 前言 天猫商城商品数据.评论数据爬取 提示:以下是本篇文章正文内 ...

  5. 爬取携程和蚂蜂窝的景点评论数据\携程评论数据爬取\旅游网站数据爬取

    本人长期出售超大量微博数据.旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhang@Yahoo.com.同时欢迎加入社交媒体数据交流群:99918768 前言   ...

  6. python分析微博粉丝_GitHub - rainpenber/python_weiboSpider: 微博粉丝数据爬取分析僵尸粉...

    python_weiboSpider 本项目关于微博数据爬取/文本分析/词云展示 文本分析主要用到了LDA主题模型 代码运行说明 1.weibopr.py是用来分析大V博主影响力的,同时会爬取博主微博 ...

  7. python-东方财富网贴吧评论数据爬取

    python-东方财富网贴吧文本数据爬取 分享一下写论文时爬数据用到的代码,有什么问题或者改善的建议的话小伙伴们一起评论区讨论. def getzssz399001DATA(x,y): #爬取x至y页 ...

  8. 爬虫项目十:Python苏宁易购商品数据、评论数据爬取

    文章目录 前言 一.商品数据 1.分析url 2.解析数据 3.实现翻页 二.评论数据 前言 利用Python对苏宁易购商品数据评价数据实现爬取 提示:以下是本篇文章正文内容,下面案例可供参考 一.商 ...

  9. 电商评论数据爬取--R语言

    1.网络爬虫 1.1 什么是网络爬虫 网络爬虫(web crawler),也被称为网络蜘蛛(web spider),是在万维网浏览网页并按照一定规则提取信息的脚本或者程序. 浏览网页时,一般流程如下: ...

  10. 【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云

    [Python爬虫实例学习篇]--5.[超详细记录]从爬取微博评论数据(免登陆)到生成词云 个人博客地址:ht/tps://www.asyu17.cn/ 精彩部分提醒: (1)微博评论页详情链接为一个 ...

最新文章

  1. if __name__ == __main___Python的if __name__==#x27;__main__#x27;你都懂了吗
  2. 【C语言】局部变量、全局变量,局部静态变量,全局静态变量,extern,static的区别...
  3. element ui 图片控件 排序_Element-ui上传图片后隐藏上存控件
  4. 重要的基础注解@import
  5. 报告一下近期读书情况
  6. HTTP和HTTPS的区别是什么?
  7. html头部打开页面为兼容模式,Web页面因为兼容模式产生的奇怪问题解答
  8. 快速的APK厂商快速和免费的Andr​​oid应用程序生成器无需编码技巧
  9. 微信小程序自定义导航栏;uni-app微信小程序自定义顶部导航栏;微信小程序顶部导航栏高度;微信小程序左上角胶囊按钮;uni-app微信小程序左上角胶囊设置
  10. ffmpeg解析出的视频参数PAR,DAR,SAR的意义
  11. 河南初中计算机考试2028,沾沾喜气!河南28名考生被清北提前录取,竟有27人来自一所中学...
  12. MyBatis-Ext,方便易用的MyBatis增强扩展
  13. Unity 3d 摄像头
  14. 力扣 (LeetCode)-对称二叉树,树|刷题打卡
  15. 板端电源硬件调试BUG
  16. 做自媒体应该选择哪个?头条和头条极速版哪个赚钱快又好用?
  17. Python描述 LeetCode 1037. 有效的回旋镖
  18. 服务器上面显示横杠,系统开机左上角显示一横杠一直闪没法系统
  19. 带通滤波器和带阻滤波器详细解析:(定义,区别,工作原理,经典电路图,应用)
  20. 人力资源管理计算机基础,人力资源管理-专-李佑强-计算机应用基础实践报告

热门文章

  1. 拼多多上架助手用哪个?拼多多商家必备工具
  2. CentOs7下Zabbix安装教程——准备工作
  3. 超越竞争对手的秘密武器-技术重用
  4. Java设计模式(二)回调模式
  5. [cuda]cuda驱动版本对应+旧版本cuda下载网址
  6. 计算机导论论文含图,计算机导论(论文).doc
  7. 2021 年高教社杯全国大学生数学建模竞赛题目
  8. 【必修】人工智能原理 学习笔记(二)chapter 2 产生式系统
  9. 慧荣SM2259XT主控贴镁光B27A测试分享,SM2258XT、SM2259XT2可参考
  10. Matlab 绘制直方图、面积图、饼图、针状图