1. 抓包

2. 查看参数信息

多看几页即可看见规律,主要改变的项无非是offset,timestamp,这里的stamp是13位的时间戳,再根据keyword改变搜索项,可以改变offset值实现翻页操作,其他的都是固定项

3. 数据解析

返回的数据中可以得到具体的栏目,image_list中是所有的图片链接,我们解析这个栏目,然后根据title下载图片即可

4. 流程分析

构建url发起请求,改变offset的值执行便利操作,对返回的json数据进行解析,根据title名称建立文件夹,如果栏目含有图片,则以title_num的格式下载图片

import requests

import os

import time

headers = {

'authority': 'www.toutiao.com',

'method': 'GET',

'path': '/api/search/content/?aid=24&app_name=web_search&offset=100&format=json&keyword=%E8%A1%97%E6%8B%8D&autoload=true&count=20&en_qc=1&cur_tab=1&from=search_tab&pd=synthesis&timestamp=1556892118295',

'scheme': 'https',

'accept': 'application/json, text/javascript',

'accept-encoding': 'gzip, deflate, br',

'accept-language': 'zh-CN,zh;q=0.9',

'content-type': 'application/x-www-form-urlencoded',

'referer': 'https://www.toutiao.com/search/?keyword=%E8%A1%97%E6%8B%8D',

'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36',

'x-requested-with': 'XMLHttpRequest',

}

def get_html(url):

return requests.get(url, headers=headers).json()

def get_values_in_dict(list):

result = []

for data in list:

result.append(data['url'])

return result

def parse_data(url):

text = get_html(url)

for data in text['data']:

if 'image_list' in data.keys():

title = data['title'].replace('|', '')

img_list = get_values_in_dict(data['image_list'])

else:

continue

if not os.path.exists('街拍/' + title):

os.makedirs('街拍/' + title)

for index, pic in enumerate(img_list):

with open('街拍/{}/{}.jpg'.format(title, index + 1), 'wb') as f:

f.write(requests.get(pic).content)

print("Download {} Successful".format(title))

def get_num(num):

if isinstance(num, int) and num % 20 == 0:

return num

else:

return 0

def main(num):

for i in range(0, get_num(num) + 1, 20):

url = 'https://www.toutiao.com/api/search/content/?aid={}&app_name={}&offset={}&format={}&keyword={}&' \

'autoload={}&count={}&en_qc={}&cur_tab={}&from={}&pd={}&timestamp={}'.format(24, 'web_search', i,

'json', '街拍', 'true', 20, 1, 1, 'search_tab', 'synthesis', str(time.time())[:14].replace('.', ''))

parse_data(url)

if __name__ == '__main__':

main(40)

python画美图_python获取街拍美图相关推荐

  1. python画饼图函数_python的matplotlib饼状图

    在python的matplotlib画图函数中,饼状图的函数为pie pie函数参数解读 plt.pie(x, explode=None, labels=None, colors=None, auto ...

  2. python画熊猫论文_Python数据可视化之美:专业图表绘制指南(全彩)

    Python数据可视化之美:专业图表绘制指南(全彩)电子书 系统性地介绍Python 的绘图语法系统,包括matplotlib.Seaborn.plotnine 包,以及用于地理空间数据可视化的Bas ...

  3. python爬虫今日头条_python爬虫—分析Ajax请求对json文件爬取今日头条街拍美图

    python爬虫-分析Ajax请求对json文件爬取今日头条街拍美图 前言 本次抓取目标是今日头条的街拍美图,爬取完成之后,将每组图片下载到本地并保存到不同文件夹下.下面通过抓取今日头条街拍美图讲解一 ...

  4. Python 批量获取今日头条街拍美图

    大家好,在以前的文章中我们学了Ajax数据获取,这篇文章我们以今日头条为例,通过分析Ajax请求来抓取今日头条的街拍美图,并将图片下载到本地保存下来. 准备好没,我们现在开始!喜欢记得收藏.点赞.关注 ...

  5. python画美图_用python做个街拍美图手册

    今天分享一篇在家就能养眼的技能,用python爬取街拍美女高清大图,然后批量插入word中,制作街拍美图手册,闲的时候就能拿出来养养眼.本文涉及知识主要包括Ajax动态加载网页爬取.requests保 ...

  6. python爬虫实战,requests模块,Python实现抓取头条街拍美图

    前言 利用Python爬取的是今日头条中的街拍美图.废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: re: requests模块: 以及一些Python自带的 ...

  7. python爬虫今日头条街拍美图开发背景_【Python3网络爬虫开发实战】6.4-分析Ajax爬取今日头条街拍美图...

    [摘要] 本节中,我们以今日头条为例来尝试通过分析Ajax请求来抓取网页数据的方法.这次要抓取的目标是今日头条的街拍美图,抓取完成之后,将每组图片分文件夹下载到本地并保存下来. 1. 准备工作 在本节 ...

  8. 教你用python做个街拍美图手册

    今天分享一篇在家就能养眼的技能,用python爬取街拍美女高清大图,然后批量插入word中,制作街拍美图手册,闲的时候就能拿出来养养眼. 本文涉及知识主要包括Ajax动态加载网页爬取.requests ...

  9. Python爬虫 | 批量爬取今日头条街拍美图

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今日鸡汤浮云一别后,流水十年间. 专栏作者:霖he ...

最新文章

  1. poj 3662 Telephone Lines spfa算法灵活运用
  2. 【剑指offer-Java版】29数组中出现次数超过一半的数字
  3. Go 1.9 新特性
  4. SwiftUI3.0用户登录输入非空校验经典案例
  5. Linux fast open,Linux内核3.7 TCP Fast Open验证实例
  6. 第 3-2 课:集合详解(下) + 面试题
  7. linux vim (your system doesn't appear to have the zip pgm)
  8. CVE-2020-1472 | Netlogon 特权提升漏洞预警
  9. Mysql学习总结(75)——并发量大、数据量大的互联网业务数据库设计军规
  10. 【原】[webkit移动开发笔记]之空链接是使用javascript:void(0)还是使用#none
  11. Dynamic Multipoint ***(DM***)
  12. C#租房管理系统(课程设计)
  13. 编写一个链表结构关于车的属性,读取任意多辆车的车型、车牌号、外形颜色、价钱输入。之后遍历链表,再将链表数据打印出来。
  14. qpython3 l_QPython 3(com.hipipal.qpy3) - 3.0.0 - 应用 - 酷安网
  15. 国家c语言计算机二级,国家计算机二级考试 C语言基本知识.pdf
  16. 加州大学戴维斯计算机博士生,关于加州大学戴维斯分校博士研究生CSC奖学金信息分享会的通知...
  17. 原子的波尔模型、能量量子化、光电效应、光谱实验、量子态、角动量
  18. RuoYi若依代码生成+一键部署
  19. 基础算法(三) --- 轮询
  20. jQuery——B站黑马程序员

热门文章

  1. 全国产计算数据库性能测试报告
  2. JSP页面在浏览器中显示HTML代码被截断显示不全
  3. CFP光模块用在什么设备上?详解CFP封装及应用
  4. 计算机会议影响因子排名,计算机国际顶级会议列表及其影响因子计算机国际顶级会议列表及其影响因子.doc...
  5. 苹果iPhone自研PC处理器架构细节曝光:性能对比Intel直接溢出
  6. 即时配送行业乱象 闪飞侠聚合突围迎战万亿赛道
  7. 致远OA表单自定义函数(取上一行金额)
  8. NUDT硕士博士研究生开题报告latex模板
  9. mysql import 命令_MySQL命令详解:mysqlimport
  10. 自动化专业本科学生的就业方向