最近,被逼无奈开始自学python爬虫。爬取微博网页版话题下的发布微博内容数据,发现有的微博需要点击展开全文按钮才能获得全文数据,否则只有部分数据。探索了一下发现大多都是selenium+python的代码,在这儿保存一个自己解决的BeautifulSoup下展开全文的方法。

for i in range(0,len(data)):if data[i].select("a[action-type='fl_unfold']")!=[]:content = data[i].find_all("p",style="display: none")if content[0].get_text().replace("\/r\/n", "").strip().endswith('收起全文d'):nr_info = content[0].get_text().replace("\/r\/n", "").strip()nr = filter_tags(db.escape_string(emoji.demojize(nr_info)))print(nr)else:nr_info=soup.select('div > div.card-feed > div.content > p.txt')  #微博内容if len(nr_info)>0:nr_info = nr_info[0].get_text().replace("\/r\/n", "").strip()nr = filter_tags(db.escape_string(emoji.demojize(nr_info)))print(nr)else:print("内容为空")

学习参考的内容:(浏览器收藏夹快放不下了)

Python中使用Beautiful Soup库的超详细教程 - 知乎

https://www.jb51.net/article/209456.htm

selenium+python抓取微博时遇到“展开全文”_m0_37435073的博客-CSDN博客

python 爬取微博展开全文数据 BeautifulSoup相关推荐

  1. python爬取微博热搜数据并保存!

    主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下importrequests;importbs4mylist=[]r=requests.get(ur- 很多 ...

  2. Python爬取微博热搜数据之炫酷可视化

    可视化展示 看完记得点个赞哟 微博炫酷可视化音乐组合版来了! 项目介绍 背景 现阶段,微博.抖音.快手.哗哩哗哩.微信公众号已经成为不少年轻人必备的"生活神器".在21世纪的今天, ...

  3. 用Python爬取微博热搜数据

    废话少说,直接上代码,然后再详细介绍构造过程. 代码 import urllib.request import re import pandas as pd import time import ra ...

  4. python爬取微博恶评_Python爬取新浪微博评论数据,了解一下?

    开发工具 **Python版本:**3.6.4 相关模块: argparse模块: requests模块: jieba模块: wordcloud模块: 以及一些Python自带的模块. 环境搭建 安装 ...

  5. python爬取微博数据词云_用Python爬取微博数据生成词云图片

    原标题:用Python爬取微博数据生成词云图片 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 对商业智能BI.大数 ...

  6. python爬取微博评论(无重复数据)

    python爬取微博评论(无重复数据) 前言 一.整体思路 二.获取微博地址 1.获取ajax地址2.解析页面中的微博地址3.获取指定用户微博地址 三.获取主评论 四.获取子评论 1.解析子评论2.获 ...

  7. python3爬取微博评论教程_用python 爬取微博评论,怎么打开微博评论下的查看更多|...

    怎样用python爬新浪微博大V所有数据 先上结论,通过公开的api如爬到某大v的所有数据,需足以下两个条件: 1.在你的爬虫开始运行时,该大v的所有微博发布量没有超过回溯查询的上限,新浪是2000, ...

  8. python爬取微博热门消息(三)—— 爬取微博热门信息的功能函数

    微博的热搜榜对于研究大众的流量有非常大的价值. 今天的教程就来说说如何爬取微博的热搜榜. 感兴趣的小伙伴可以 收藏 + 关注 哦! 另外,关于本项目的效果展示,以及教程,点击一下链接即可. pytho ...

  9. 爬取微博用户行为数据语义分析数据挖掘报告

    原文链接:http://tecdat.cn/?p=2085 微博作为热门话题的聚集地,评价.点赞转发.评论有无水军--都可能影响新人们的判断.本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户 ...

最新文章

  1. 软件需求开发的18般武艺
  2. Node.js + Nginx-现在怎么办?
  3. 40)类与类之间的关系(has use is)
  4. MySQL基本命令 (二)
  5. Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据随机指定七个字符生成逼真车牌图片数据集(自然场景下+各种噪声效果)可视化
  6. 机器学习-算法背后的理论与优化(part5)--结构风险最小(下)
  7. GAN也有脾气:「太难的部分我就不生成了,在下告退」
  8. python程序设计实验配置_20181235 实验三《Python程序设计》实验报告
  9. matlab读取excel里的数据并用imagesc画图
  10. js面向对象编程(三)非构造函数的继承(转载)
  11. 通用采集器Modbus协议应用
  12. Spring MVC笔记 使用JdbcTemplate
  13. 《企业IT架构转型之道》阿里巴巴中台战略思想和架构实战-书摘整理
  14. Android 界面设计 简约个人求职简历表格
  15. Power Analysis估算样本容量
  16. OSPF-1.ospf基础及工作流程
  17. 本周最新文献速递20220327
  18. 互联网快讯:瑞幸回应价格异常;极米H3S、极米Z6X Pro受用户青睐;知网回应被中科院停用
  19. 读书笔记-精准努力-励志本身就已经让你爽了以为自己真这样做了
  20. LDC个人技术博客上线

热门文章

  1. 游戏服务器运维常见故障总结
  2. neko 命令行操作
  3. python网络编程——HTTP客户端
  4. XPS如何在线转Word格式
  5. 简述docx文档格式-CTF竞赛专用
  6. 雅思阅读话题词汇-alluvial
  7. 低成本打造初创团队的 DevOps 实践(采用 NAS中的KVM 承载 Gogs + Jenkins + Nexus 服务)【0x02】安装Nexus
  8. icp相关数学,向量模的平方转换成矩阵相乘
  9. Hadoop大数据通用处理平台
  10. python 对excel的函数操作_自动化报表(3)