from zhihu_oauth import ZhihuClient
from zhihu_oauth.exception import NeedCaptchaExceptionclient = ZhihuClient()try:client.login('email_or_phone', 'password')print(u"登陆成功!")
except NeedCaptchaException:# 保存验证码并提示输入,重新登录with open('a.gif', 'wb') as f:f.write(client.get_captcha())captcha = input('please input captcha:')client.login('+8613872273541', 'z289784552', captcha)print(u"登陆成功!")
client.save_token('token.pkl')

获取Token

from __future__ import print_function # 使用python3的print方法
from zhihu_oauth import ZhihuClient
import re
import os
import urllib.requestclient = ZhihuClient()
# 登录
client.load_token('token.pkl')  # 加载token文件
id = 46508954 # https://www.zhihu.com/question/24400664(长得好看是一种怎么样的体验)
question = client.question(id)
print(u"问题:",question.title)
print(u"回答数量:",question.answer_count)
os.mkdir(question.title + u"(图片)")
path = question.title + u"(图片)"
index = 1 # 图片序号
for answer in question.answers:content = answer.content  # 回答内容re_compile = re.compile(r'<img src="(https://pic\d\.zhimg\.com/.*?\.(jpg|png))".*?>')img_lists = re.findall(re_compile, content)if (img_lists):for img in img_lists:img_url = img[0]  # 图片urlurllib.request.urlretrieve(img_url, path + u"/%d.jpg" % index)print(u"成功保存第%d张图片" % index)index += 1

加载Token并读取数据

转载于:https://www.cnblogs.com/wuyujie/p/9441927.html

Python爬去知乎上问题下所有图片相关推荐

  1. 用Python爬取知乎上关于程序员的神回复

    数据科学俱乐部 中国数据科学家社区 ♚ 作者:强哥,曾供职于摩根士丹利和eBay. 爬取知乎神回复很简单,这篇文章我们就来揭晓一下背后的原理. 知乎神回复都有些什么特点呢?我们先来观察一下 大家看出什 ...

  2. python爬取知乎上的小姐姐

    知乎上的东西质量都很好,有些问题下会有很多很好的回答,其中就有些关于图片的. 比如: 你见过最漂亮的女生长什么样? 平常人可以漂亮到什么程度? 有没有第一次见就让人震惊的手机壁纸? 有哪些图片适合做电 ...

  3. Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中

    Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中 1.需要的Python模块 主要是requests模块,用于得到的网页的数据 安装命令为:pip install requests 2 ...

  4. python实战1.0——爬取知乎某问题下的回复

    python实战1.0--爬取知乎某问题下的回复 确定问题 爬取 进行简单筛选 保存数据 # 获取问题下的回复总数 def get_number():url = 'https://www.zhihu. ...

  5. Python爬取知乎“神回复”,笑得根本停不下来(附代码)

    来源:Python与数据分析 本文约4600字,建议阅读10+分钟. 本文介绍如何爬取知乎的神回复,为你揭晓其背后的原理. 知乎上经常会有很多令人忍俊不禁的神回复,初看之下拍案叫绝,细思之下更是回味无 ...

  6. 数据挖掘 文本分类 知乎问题单分类(二):爬取知乎某话题下的问题(数据爬取)

    数据挖掘 文本分类 知乎问题单分类(二):爬取知乎某话题下的问题(数据爬取) 爬虫目标 Scrapy框架介绍 Scrapy框架原理 [^1] Scrapy工作流程 [^2] 具体实现 安装Scrapy ...

  7. 用Python爬了知乎“神回复”,笑得根本停不下来

    知乎上经常会有很多令人忍俊不禁的神回复,初看之下拍案叫绝,细思之下更是回味无穷.本文就来介绍下如何爬取知乎的神回复,揭晓其背后的原理. 知乎神回复都有些什么特点呢?我们先来观察一下,如下图: 大家看出 ...

  8. 如何用python爬取数据_如何使用python爬取知乎数据并做简单分析

    原标题:如何使用python爬取知乎数据并做简单分析 一.使用的技术栈: 爬虫:python27 +requests+json+bs4+time 分析工具: ELK套件 开发工具:pycharm 数据 ...

  9. python爬取知乎回答并进行舆情分析:舆情分析部分

    python爬取知乎回答并进行舆情分析:舆情分析部分 背景 生成词云 文本预处理(使用停用词.自定义分词) 统计词频 生成词云 折线图 统计每日回答数 生成折线图 展望 背景 在上一节中,利用爬虫爬取 ...

最新文章

  1. ML基石_4_FeasibilityOfLearning
  2. 用Go语言建立一个简单的区块链part3:持久化和命令行接口
  3. 拿到BAT等大厂offer以后,我发现了关于秋招的一些真相
  4. Java工程师修炼之路
  5. oracle 数据补齐月份,Oracle自定义函数--增加月份
  6. 如何让隐藏在大数据背后的价值发挥出来?
  7. 速看,PMP备考通关宝典来袭
  8. Fastjson blacklist
  9. linux火狐怎么切换到ie内核,如何切换浏览器火狐 FIREFOX和IE之间切换
  10. MySQL密码正确却无法登录
  11. AKULAKU笔试题(还有1题未答)
  12. mirrorlink
  13. 小程序下拉刷新没有响应
  14. 深入理解Android:卷II
  15. 解决办法:E: 仓库 “......” 没有 Release 文件。
  16. 基于yolov5实现FPS游戏自瞄,理论上通杀所有射击游戏
  17. 【转载】思科CISCO防火墙ASA5510重置密码
  18. 原创】OllyDBG 入门系列(一)-认识OllyDBG
  19. java毕业设计项目源代码S2SH基于JSP的网上购书系统|商城电商购物系统
  20. 【Windows10】电脑副屏无法调节屏幕亮度?解决方法

热门文章

  1. html5 支持音频格式,html5中audio支持音频格式
  2. html中内容超出显示省略号的方法
  3. spring junit单元测试
  4. java 递归调整为队列
  5. hosts 文件与 ipv6
  6. 不是每个人都可以坚持!
  7. 第三方控件netadvantage UltraWebGrid如何生成带加号多级表数据也就是带子表
  8. 父亲的忠告:把孩子培养成普通人
  9. mda.helper.php,dedecms后台更新缓慢甚至卡死怎么办
  10. 关于redis实现单点登录的一点思路