Python爬去知乎上问题下所有图片
![](/assets/blank.gif)
![](/assets/blank.gif)
from zhihu_oauth import ZhihuClient from zhihu_oauth.exception import NeedCaptchaExceptionclient = ZhihuClient()try:client.login('email_or_phone', 'password')print(u"登陆成功!") except NeedCaptchaException:# 保存验证码并提示输入,重新登录with open('a.gif', 'wb') as f:f.write(client.get_captcha())captcha = input('please input captcha:')client.login('+8613872273541', 'z289784552', captcha)print(u"登陆成功!") client.save_token('token.pkl')
获取Token
![](/assets/blank.gif)
![](/assets/blank.gif)
from __future__ import print_function # 使用python3的print方法 from zhihu_oauth import ZhihuClient import re import os import urllib.requestclient = ZhihuClient() # 登录 client.load_token('token.pkl') # 加载token文件 id = 46508954 # https://www.zhihu.com/question/24400664(长得好看是一种怎么样的体验) question = client.question(id) print(u"问题:",question.title) print(u"回答数量:",question.answer_count) os.mkdir(question.title + u"(图片)") path = question.title + u"(图片)" index = 1 # 图片序号 for answer in question.answers:content = answer.content # 回答内容re_compile = re.compile(r'<img src="(https://pic\d\.zhimg\.com/.*?\.(jpg|png))".*?>')img_lists = re.findall(re_compile, content)if (img_lists):for img in img_lists:img_url = img[0] # 图片urlurllib.request.urlretrieve(img_url, path + u"/%d.jpg" % index)print(u"成功保存第%d张图片" % index)index += 1
加载Token并读取数据
转载于:https://www.cnblogs.com/wuyujie/p/9441927.html
Python爬去知乎上问题下所有图片相关推荐
- 用Python爬取知乎上关于程序员的神回复
数据科学俱乐部 中国数据科学家社区 ♚ 作者:强哥,曾供职于摩根士丹利和eBay. 爬取知乎神回复很简单,这篇文章我们就来揭晓一下背后的原理. 知乎神回复都有些什么特点呢?我们先来观察一下 大家看出什 ...
- python爬取知乎上的小姐姐
知乎上的东西质量都很好,有些问题下会有很多很好的回答,其中就有些关于图片的. 比如: 你见过最漂亮的女生长什么样? 平常人可以漂亮到什么程度? 有没有第一次见就让人震惊的手机壁纸? 有哪些图片适合做电 ...
- Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中
Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中 1.需要的Python模块 主要是requests模块,用于得到的网页的数据 安装命令为:pip install requests 2 ...
- python实战1.0——爬取知乎某问题下的回复
python实战1.0--爬取知乎某问题下的回复 确定问题 爬取 进行简单筛选 保存数据 # 获取问题下的回复总数 def get_number():url = 'https://www.zhihu. ...
- Python爬取知乎“神回复”,笑得根本停不下来(附代码)
来源:Python与数据分析 本文约4600字,建议阅读10+分钟. 本文介绍如何爬取知乎的神回复,为你揭晓其背后的原理. 知乎上经常会有很多令人忍俊不禁的神回复,初看之下拍案叫绝,细思之下更是回味无 ...
- 数据挖掘 文本分类 知乎问题单分类(二):爬取知乎某话题下的问题(数据爬取)
数据挖掘 文本分类 知乎问题单分类(二):爬取知乎某话题下的问题(数据爬取) 爬虫目标 Scrapy框架介绍 Scrapy框架原理 [^1] Scrapy工作流程 [^2] 具体实现 安装Scrapy ...
- 用Python爬了知乎“神回复”,笑得根本停不下来
知乎上经常会有很多令人忍俊不禁的神回复,初看之下拍案叫绝,细思之下更是回味无穷.本文就来介绍下如何爬取知乎的神回复,揭晓其背后的原理. 知乎神回复都有些什么特点呢?我们先来观察一下,如下图: 大家看出 ...
- 如何用python爬取数据_如何使用python爬取知乎数据并做简单分析
原标题:如何使用python爬取知乎数据并做简单分析 一.使用的技术栈: 爬虫:python27 +requests+json+bs4+time 分析工具: ELK套件 开发工具:pycharm 数据 ...
- python爬取知乎回答并进行舆情分析:舆情分析部分
python爬取知乎回答并进行舆情分析:舆情分析部分 背景 生成词云 文本预处理(使用停用词.自定义分词) 统计词频 生成词云 折线图 统计每日回答数 生成折线图 展望 背景 在上一节中,利用爬虫爬取 ...
最新文章
- ML基石_4_FeasibilityOfLearning
- 用Go语言建立一个简单的区块链part3:持久化和命令行接口
- 拿到BAT等大厂offer以后,我发现了关于秋招的一些真相
- Java工程师修炼之路
- oracle 数据补齐月份,Oracle自定义函数--增加月份
- 如何让隐藏在大数据背后的价值发挥出来?
- 速看,PMP备考通关宝典来袭
- Fastjson blacklist
- linux火狐怎么切换到ie内核,如何切换浏览器火狐 FIREFOX和IE之间切换
- MySQL密码正确却无法登录
- AKULAKU笔试题(还有1题未答)
- mirrorlink
- 小程序下拉刷新没有响应
- 深入理解Android:卷II
- 解决办法:E: 仓库 “......” 没有 Release 文件。
- 基于yolov5实现FPS游戏自瞄,理论上通杀所有射击游戏
- 【转载】思科CISCO防火墙ASA5510重置密码
- 原创】OllyDBG 入门系列(一)-认识OllyDBG
- java毕业设计项目源代码S2SH基于JSP的网上购书系统|商城电商购物系统
- 【Windows10】电脑副屏无法调节屏幕亮度?解决方法