# 爬取微信阅读top总榜
import requests
import re
import csv
url = "https://weread.qq.com/web/category/all"
res = requests.get(url)
res.encoding = 'utf-8'
# print(res.text)obj = re.compile(r'<p class="wr_bookList_item_index">(?P<index>\d+)</p>'r'.*?<p class="wr_bookList_item_title">(?P<name>.*?)</p>'r'<p class="wr_bookList_item_author"><.*?>(?P<author>.*?)</a>.*?<p class="wr_bookList_item_desc">('r'?P<description>.*?)</p>', re.S)# obj = re.compile(r'<p class="wr_bookList_item_index">(?P<index>.*?)</p>', re.S)
result = obj.finditer(res.text)
books = []
for item in result:dic = item.groupdict()dic['作者'] = dic.pop('author')dic['排名'] = dic.pop('index')dic['书名'] = dic.pop('name')dic['描述'] = dic.pop('description')books.append(dic)print(dic)header = ["排名", "作者", "书名", "描述"]
# newline是数据之间不加空行
with open('weixingRead.csv', 'w', newline='', encoding='utf-8') as f:writer = csv.DictWriter(f, fieldnames=header)  # 提前预览列名writer.writeheader() writer.writerows(books)  

python正则爬取微信阅读总榜单写入csv相关推荐

  1. Python爬虫爬取微信朋友圈的方法,感兴趣的朋友可以了解下

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 小雨 | 作者 python教程 | 来源 接下来,我们将实现微信朋友圈的 ...

  2. Python爬虫爬取微信朋友圈

    更多编程教程请到:菜鸟教程 https://www.piaodoo.com/ 友情链接: 高州阳光论坛https://www.hnthzk.com/ 人人影视http://www.op-kg.com/ ...

  3. python+appium爬取微信运动数据,并分析好友的日常步数情况

    python+appium爬取微信运动数据,并分析好友的日常步数情况 声明:仅供技术交流,请勿用于非法用途,如有其它非法用途造成损失,和本博客无关 目录 python+appium爬取微信运动数据,并 ...

  4. 爬取网易云歌曲榜单中网易云歌曲及其对应id xpath csv re requests python

    基操爬取网易云歌曲榜单中网易云歌曲及其对应id 回顾xpath csv re requests 先进行基础抓包! 1 2 3 然后就是代码啦,兄弟们,我的代码都很完整,看懂思路,直接收藏复制粘贴就可以 ...

  5. python爬虫爬取微信公众号小程序信息

    python爬虫爬取微信公众号小程序信息 爬取内容 某汽车维修信息提供的维修店名称,地点以及电话(手机)号码 爬取步骤 啥也别管,先抓包看看,在这里,博主使用的抓包软件是charles 抓包:将网络传 ...

  6. 用Python实现爬取微信头像

    如何用python实现爬取微信头像 python里面有个itchat包,用这个可以实现 1.先下载 itchat pip install itchat 2.创建一个py文件 import itchat ...

  7. python定时器爬取豆瓣音乐Top榜歌名

    python定时器爬取豆瓣音乐Top榜歌名 作者:vpoet 日期:大约在夏季 注:这些小demo都是前段时间为了学python写的,现在贴出来纯粹是为了和大家分享一下 #coding=utf-8im ...

  8. 【Python】爬取中国历史票房榜,可视化分析

    [Python]爬取中国历史票房榜,可视化分析 最近电影<哪吒之魔童转世>票房已经超过<流浪地球>,<复联4>.升到中国内地票房第二位.就好有哪些电影排进了历史票房 ...

  9. 爬取猫眼电影TOP100榜单

    爬取猫眼电影Top100榜单 分析网页 内容提取 前提:会基础的python3以及requests库,正则等. 分析网页 top100榜单网址为https://maoyan.com/board/4,通 ...

最新文章

  1. R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行expoTrans指数变换(Exponential transformation、可以处理负数)
  2. 破局!Alan Yuille:深度学习关键在于克服组合爆炸
  3. 快速整理excel_3小时整理了33个excel动图技巧,能快速提高工作效率,收藏备用吧...
  4. 双线性插值算法ARM NEON优化
  5. 网络适配器无法建立连接_「图」KB4515384更新令人抓狂:网络适配器又无法启用...
  6. python中__init__和__new__方法的使用
  7. Anaconda 安装 Python 库(MySQLdb)的方法
  8. Android Studio经常使用配置及使用技巧(二)
  9. 重构的小故事 Change Value to Reference or Vice Verse
  10. css3中的perspective与perspective-origin
  11. js 加入收藏,设为首页
  12. 【软件测试学习笔记】易用性测试概念及测试项总结
  13. pascal voc2012分割标签处理
  14. 处理C盘容量不足问题(以AppData为例)
  15. 走到人生边上 - 笔记
  16. Mac终端命令和连接服务器
  17. 笔记 | 人工智能导论 语义网络表示
  18. 实训项目 ---- vue中小说首页页面的制作
  19. Boosting方法入门
  20. 车联网(智能网联汽车)无线电频率规划发布 助力制造强国和网络强国建设

热门文章

  1. 十一届蓝桥模拟赛 元素之间最大的元素距离 JAVA
  2. 计算机应用项目概述,计算机应用包括哪些项目?
  3. mac笔记本常用快捷键
  4. 前端开发全家桶:UI组件 开发框架 服务端 辅助工具 应用实例 Demo示例
  5. [分形学] Julia Set (茱莉亚集) VC 源代码
  6. 如何刷机:iphone8锁屏密码错误多次,手机停用,连接iTunes,磁盘已满,双重认证弊端!
  7. vnc远程桌面手机版,vnc远程桌面手机版软件,怎么使用
  8. git fatal: detected dubious ownership in repository 解决方法
  9. CB Insights:全面拆解谷歌AI战略布局
  10. 推荐系统深度学习篇-NFM 模型介绍(1)