又是一年一度的七夕情人节了!
有女朋友的就牵好手,有男朋友的就抱紧腿,什么都么得的小伙伴就带好装备,静静的吃狗粮就ok了。

在这个到处都冒着粉红泡泡的日子,不做点什么都不太好意思。
作为一名合格的代码搬砖工,经过慎重的思考,决定为小伙伴们的幸福贡献一份微薄之力。
特此爬取知乎上的高赞情话,让你在对女神/男神的约会中甜蜜暴击(咳咳咳,吃多了糖,有点齁)

1.搜索知乎高赞情话话题或评论

知乎搜索"情话",出现各种关于情话的话题贴,随便扫一眼都是心动的感觉啊喂。找一个高赞的,或者自己喜欢的点进入。

2.爬取高赞情话话题


“我的脑袋是个小小星球,每天只有你开着月亮列车巡游。”

有点意境,不错不错。就是你了。

单页面的话,结构简单,我们就选用requests,构建简单的爬虫结构。


第一步,创建一个知乎情话的对象。
初始化参数为起始页面链接和ua库。

第二步,创建发送请求的函数parse_url() ,参数为请求的链接url。
依据xpath获取网页内容的函数content_xpath(),参数为response响应对象和数据的xpath规则。

第三步,启动主函数

发送请求,获取响应。找到评论内容的xpath规则,调用content_xpath()函数,获取文本内容。

第四步,清洗数据,存入txt文本

代码如下:

def write_to_file(self, content):"""数据写入文件:return:"""file_path = os.path.dirname(os.path.abspath(__file__)) + "/七夕情话.txt"with open(file_path, "a", encoding='utf-8') as f:f.write(content+'\r\n')

知乎高赞的情话,已经尽归我手了。看下效果:

祝愿各位小伙伴今天可以躺到喜欢的人怀里。O(∩_∩)O哈哈~

想要源码的可以私我哟

“我本来是要行走江湖的,但是遇到你我觉得可以先停一停。”

爬取知乎高赞情话,甜蜜过七夕相关推荐

  1. 以爬取知乎为例,进行python 多进程爬虫性能分析

    以爬取知乎为例,进行python 多进程爬虫性能分析 如果对多进程multiproessing模块不熟悉,请先浏览 python 使用multiprocessing模块进行多进程爬虫 问题背景: 爬取 ...

  2. python爬虫知乎图片_python 爬取知乎图片

    先上完整代码 1 importrequests2 importtime3 importdatetime4 importos5 importjson6 importuuid7 from pyquery ...

  3. python 爬取知乎图片

    先上完整代码 1 import requests 2 import time 3 import datetime 4 import os 5 import json 6 import uuid 7 f ...

  4. 60行代码爬取知乎“神回复”,句句戳中泪点

    作者 | shenzhongqiang 转载自Python与数据分析(ID:PythonML) 之前的一篇文章<爬了下知乎神回复,笑死人了~>发布后,引发了大家热烈的反响.很多朋友觉得很神 ...

  5. [python爬虫] BeautifulSoup和Selenium简单爬取知网信息测试

    作者最近在研究复杂网络和知识图谱内容,准备爬取知网论文相关信息进行分析,包括标题.摘要.出版社.年份.下载数和被引用数.作者信息等.但是在爬取知网论文时,遇到问题如下:   1.爬取内容总为空,其原因 ...

  6. python 数据分析 书籍推荐 知乎_Python 爬取知乎 9674 个问答,揭秘最受欢迎的 98 本书!...

    原标题:Python 爬取知乎 9674 个问答,揭秘最受欢迎的 98 本书! 作者 | Yura 责编 | 胡巍巍 高尔基这话有没有道理我不知道, 咱也不敢问, 主要是现在也问不了. 那对我来说,读 ...

  7. python实战1.0——爬取知乎某问题下的回复

    python实战1.0--爬取知乎某问题下的回复 确定问题 爬取 进行简单筛选 保存数据 # 获取问题下的回复总数 def get_number():url = 'https://www.zhihu. ...

  8. 如何用 60 行代码爬取知乎神回复?

    作者 | 强哥 责编 | 郭芮 知乎上经常会有很多令人忍俊不禁的神回复,初看之下拍案叫绝,细思之下更是回味无穷.本文就来介绍下如何爬取知乎的神回复,揭晓其背后的原理. 知乎神回复都有些什么特点呢?我们 ...

  9. python爬虫爬取知乎图片,轻松解决头像荒

    前言 最近逛知乎,发现了一个问题.         回答下很多好看的头像,因此我动了一个心思,想要制作一个小网页,可以随机返回一款好看的情头.心思既起,当然要开始付诸行动.但是想要制作如此一个网页,后 ...

最新文章

  1. List 为什么可以实例化ArrayList
  2. c语言编程用得上i7,为什么我的C应用程序比Core i7上的C应用程序(使用相同的库)更快...
  3. Java中static的作用详解_java中static作用详解
  4. 【备忘】外币评估数据存储表
  5. 数据分析如何入门,以及如何做职业规划?
  6. 一步步用ABAP Development Tools连接SAP云平台上的ABAP编程环境
  7. 2017年秋招美团Java程序员开发,看我如何拿到offer
  8. 入门机器学习(十四)--编程作业-支持向量机(Python实现)
  9. 90后过年,吃零下18度的年夜饭
  10. 集成学习-幸福感预测案例分析
  11. 黑色炫酷粒子html网站源码
  12. 《人机交互技术》 第五章 界面设计
  13. Redis分布式锁----悲观锁实现,以秒杀系统为例 - 林炳文Evankaka的专栏 - CSDN博客
  14. 短视频平台api接口php源码
  15. 解决运行js代码报错—Warning: To load an ES module, set “type“: “module“ in the package.json or use the .mjs
  16. platform device和platform driver
  17. python坑爹的黑店_曝光米兰爱马仕黑店极其坑爹配货经验!大家不要再白白上当了!...
  18. Unity数据持久化——Json
  19. SQL Server 2016下载安装教程
  20. 均衡计算机教室一类标准,义务教育基本均衡样表(黎思小学201711更新-)

热门文章

  1. 节能高速 京瓷四款A3多功用数码复合机全新上市
  2. vue实现点击图片查看图片
  3. 解决pdf文件无法打印问题的最好方法
  4. 查询计算机关机方式,Win7系统怎么查看上次关机时间 查看win7电脑上次关机时间的方法...
  5. 有限状态FSM详解(3)——通用的FSM
  6. Gover算法的简单解释
  7. 我的大菠萝 – 2,控件及数据绑定
  8. 软件测试质量改进,软件测试与持续质量改进
  9. java 删除指定字符_字符串删除指定位置字符 JAVA 删除字符串中指定的字符
  10. Linux常用基础命令(很全)