爬取知乎高赞情话,甜蜜过七夕
又是一年一度的七夕情人节了!
有女朋友的就牵好手,有男朋友的就抱紧腿,什么都么得的小伙伴就带好装备,静静的吃狗粮就ok了。
在这个到处都冒着粉红泡泡的日子,不做点什么都不太好意思。
作为一名合格的代码搬砖工,经过慎重的思考,决定为小伙伴们的幸福贡献一份微薄之力。
特此爬取知乎上的高赞情话,让你在对女神/男神的约会中甜蜜暴击(咳咳咳,吃多了糖,有点齁)
1.搜索知乎高赞情话话题或评论
知乎搜索"情话",出现各种关于情话的话题贴,随便扫一眼都是心动的感觉啊喂。找一个高赞的,或者自己喜欢的点进入。
2.爬取高赞情话话题
“我的脑袋是个小小星球,每天只有你开着月亮列车巡游。”
有点意境,不错不错。就是你了。
单页面的话,结构简单,我们就选用requests,构建简单的爬虫结构。
第一步,创建一个知乎情话的对象。
初始化参数为起始页面链接和ua库。
第二步,创建发送请求的函数parse_url() ,参数为请求的链接url。
依据xpath获取网页内容的函数content_xpath(),参数为response响应对象和数据的xpath规则。
第三步,启动主函数
发送请求,获取响应。找到评论内容的xpath规则,调用content_xpath()函数,获取文本内容。
第四步,清洗数据,存入txt文本
代码如下:
def write_to_file(self, content):"""数据写入文件:return:"""file_path = os.path.dirname(os.path.abspath(__file__)) + "/七夕情话.txt"with open(file_path, "a", encoding='utf-8') as f:f.write(content+'\r\n')
知乎高赞的情话,已经尽归我手了。看下效果:
祝愿各位小伙伴今天可以躺到喜欢的人怀里。O(∩_∩)O哈哈~
想要源码的可以私我哟
“我本来是要行走江湖的,但是遇到你我觉得可以先停一停。”
爬取知乎高赞情话,甜蜜过七夕相关推荐
- 以爬取知乎为例,进行python 多进程爬虫性能分析
以爬取知乎为例,进行python 多进程爬虫性能分析 如果对多进程multiproessing模块不熟悉,请先浏览 python 使用multiprocessing模块进行多进程爬虫 问题背景: 爬取 ...
- python爬虫知乎图片_python 爬取知乎图片
先上完整代码 1 importrequests2 importtime3 importdatetime4 importos5 importjson6 importuuid7 from pyquery ...
- python 爬取知乎图片
先上完整代码 1 import requests 2 import time 3 import datetime 4 import os 5 import json 6 import uuid 7 f ...
- 60行代码爬取知乎“神回复”,句句戳中泪点
作者 | shenzhongqiang 转载自Python与数据分析(ID:PythonML) 之前的一篇文章<爬了下知乎神回复,笑死人了~>发布后,引发了大家热烈的反响.很多朋友觉得很神 ...
- [python爬虫] BeautifulSoup和Selenium简单爬取知网信息测试
作者最近在研究复杂网络和知识图谱内容,准备爬取知网论文相关信息进行分析,包括标题.摘要.出版社.年份.下载数和被引用数.作者信息等.但是在爬取知网论文时,遇到问题如下: 1.爬取内容总为空,其原因 ...
- python 数据分析 书籍推荐 知乎_Python 爬取知乎 9674 个问答,揭秘最受欢迎的 98 本书!...
原标题:Python 爬取知乎 9674 个问答,揭秘最受欢迎的 98 本书! 作者 | Yura 责编 | 胡巍巍 高尔基这话有没有道理我不知道, 咱也不敢问, 主要是现在也问不了. 那对我来说,读 ...
- python实战1.0——爬取知乎某问题下的回复
python实战1.0--爬取知乎某问题下的回复 确定问题 爬取 进行简单筛选 保存数据 # 获取问题下的回复总数 def get_number():url = 'https://www.zhihu. ...
- 如何用 60 行代码爬取知乎神回复?
作者 | 强哥 责编 | 郭芮 知乎上经常会有很多令人忍俊不禁的神回复,初看之下拍案叫绝,细思之下更是回味无穷.本文就来介绍下如何爬取知乎的神回复,揭晓其背后的原理. 知乎神回复都有些什么特点呢?我们 ...
- python爬虫爬取知乎图片,轻松解决头像荒
前言 最近逛知乎,发现了一个问题. 回答下很多好看的头像,因此我动了一个心思,想要制作一个小网页,可以随机返回一款好看的情头.心思既起,当然要开始付诸行动.但是想要制作如此一个网页,后 ...
最新文章
- List 为什么可以实例化ArrayList
- c语言编程用得上i7,为什么我的C应用程序比Core i7上的C应用程序(使用相同的库)更快...
- Java中static的作用详解_java中static作用详解
- 【备忘】外币评估数据存储表
- 数据分析如何入门,以及如何做职业规划?
- 一步步用ABAP Development Tools连接SAP云平台上的ABAP编程环境
- 2017年秋招美团Java程序员开发,看我如何拿到offer
- 入门机器学习(十四)--编程作业-支持向量机(Python实现)
- 90后过年,吃零下18度的年夜饭
- 集成学习-幸福感预测案例分析
- 黑色炫酷粒子html网站源码
- 《人机交互技术》 第五章 界面设计
- Redis分布式锁----悲观锁实现,以秒杀系统为例 - 林炳文Evankaka的专栏 - CSDN博客
- 短视频平台api接口php源码
- 解决运行js代码报错—Warning: To load an ES module, set “type“: “module“ in the package.json or use the .mjs
- platform device和platform driver
- python坑爹的黑店_曝光米兰爱马仕黑店极其坑爹配货经验!大家不要再白白上当了!...
- Unity数据持久化——Json
- SQL Server 2016下载安装教程
- 均衡计算机教室一类标准,义务教育基本均衡样表(黎思小学201711更新-)