简单介绍

在今日头条中输入想要查找图片的名称,并实现相关图片的下载。

#相关工具以及模块

  1. 基于PyCharm编辑-----python3.7
  2. requests:pip install requests -i https://pypi.douban.com/simple
  3. json
  4. urllib: pip install urllib -i https://pypi.douban.com/simple

实现步骤

  1. 找出url规律:
    https://so.toutiao.com/search?keyword=%E6%B3%B0%E5%8B%92%E6%96%AF%E5%A8%81%E5%A4%AB%E7%89%B9&pd=atlas&source=search_subtab_switch&dvpf=pc&aid=4916&page_num=0
    主要关键的为keyword={}表示搜索的关键次,page_num----想要获取的页数,相关页面如下

  2. 构建url,并使用urllib.parse里面的urlencode进行编码

  3. 构建伪装浏览器,同时加上cookie,在cookie中经过测试只有ttwid参数是必要的

  4. 发送请求获取json格式数据,并依次获取图片链接

  5. 循环链接,再次发送请求,同时自动创建picture文件夹存放图片,实现图片下载。

相关代码

import requests
import json
import os
from urllib.parse import  urlencode#伪装浏览器
header={'Host': 'so.toutiao.com','Referer':'https://so.toutiao.com/search?keyword=%E8%A1%97%E6%8B%8D&pd=atlas&source=search_subtab_switch&dvpf=pc&aid=4916&page_num=0','User-Agent':'Chrome/98.0.4750.0 Safari/537.36',}
#经过发现cookie当中两条数据是变化的,但ttwid是最主要的
cookie={'ttwid':'1%7CvpcY2ijDUhRNtnvTXsePdm2UUX_ERonN1e_JaQUY004%7C1652798490%7Cf0009842f35d8bcaea9d44ebd3dbacf2a03c8a5547f99240a33efa0f192de414', #变化# '_S_WIN_WH':'1366_663'#变化
}#创建文件夹
pathd=os.getcwd()+'\\picture'
#判断mydata文件夹是否存在
if os.path.exists(pathd):pass
else:#创建mydata文件夹os.mkdir(pathd)def main(val):values = {'keyword': val}values1= urlencode(values)#编码page_num=eval(input('请输入页数:'))for j in range(0,page_num):url = 'https://so.toutiao.com/search?{}&pd=atlas&source=search_subtab_switch&dvpf=pc&aid=4916&page_num={}&rawJSON=1'.format(values1,str(j))# print(url)red=requests.session()response=red.get(url,headers=header,cookies=cookie)#a=response.texta=json.loads(response.content)urll=a['rawData']['data']for i in range(len(urll)):image_url=urll[i]['img_url']# print(image_url)#下载图片pic=requests.get(image_url)with open('./picture/'+str(j)+str(i)+'.jpg','wb+') as f:f.write(pic.content)if __name__=='__main__':#填入关键词main('泰勒斯威夫特')

结果截图

输入关键词获取今日头条免费图片相关推荐

  1. 今日头条页面图片获取

    今日头条页面图片获取 分为获取目录下的文件路径 以及具体目录下的多张图片 import re import requests import json,os from urllib import req ...

  2. python爬取头条图集_Python爬虫基础练习(六) 今日头条街头篮球图片爬取

    今天我们要爬取的仍然是图片,不过与上一篇有所不一样的是,今天爬取的是今日头条上的图集,接着往下看吧~ 运行平台:Windows Python版本:Python3.6 IDE: Sublime Text ...

  3. Python的Requests来爬取今日头条的图片和文章

    Python的Requests来爬取今日头条的图片和文章并且存入mongo config.py MONGO_HOST = 'localhost' MONGO_PORT = 27017 MONGO_DB ...

  4. 获取“今日头条”西瓜视频

    PC端获取今日头条西瓜视频 测试浏览器:Google || 火狐 Google获取视频方法 打开需要保存的视频当前播放页面[点击播放] F12 大法获取视频链接地址[复制下来:Ctrl+C] 打开一个 ...

  5. php获取今日头条视频地址并插入织梦cms数据库

    每天一篇原创文章,今天更新php获取今日头条视频地址并插入织梦cms数据库.本文由零零下载站(http://www.xxindu.com)原创首发,转载请注明来处. 下面给出代码,有什么问题可以留言, ...

  6. 爬虫 1 ---获取今日头条图片

    主要参考崔庆才(狗粮散播达人)的教程完成对浸提头条图片的爬取 [Python3网络爬虫开发实战] 6.4-分析Ajax爬取今日头条街拍美图 因为网站变动,不能完全照搬他的方法,但是思想上基本一致, 是 ...

  7. python获取今日头条搜索信息_python爬虫(十二、爬取今日头条关键词所有文章)

    今日头条 我们以搜索'妹子'为例 那 么 我 们 在 右 上 角 的 搜 索 框 搜 索 妹 子 , 出 来 了 一 系 列 文 章 那么我们在右上角的搜索框搜索妹子,出来了一系列文章那么我们在右上角 ...

  8. 怎样在今日头条引流卖产品?今日头条免费引流技巧?

    随着互联网引流模式不断变革,人人都是自媒体,每个人都是独立的自媒体传播体,但是想要获得更多资源来丰富思维逻辑,想要在移动互联网站立脚跟,都需要有流量,即是有粉丝.尤其很火的自媒体平台-今日头条,其主要 ...

  9. 如和用Python获取今日头条上面三千美女图,且看教程

    我们的学习爬虫的动力是什么? 有人可能会说:如果我学好了,我可以找一个高薪的工作. 有人可能会说:我学习编程希望能够为社会做贡献(手动滑稽) 有人可能会说:为了妹子! ..... 其实我们会发现妹子才 ...

最新文章

  1. pygame是python的一个库吗,python学习pygame,,基本库导入impor
  2. R3LIVE:一个实时鲁棒、带有RGB颜色信息的激光雷达-惯性-视觉紧耦合系统(香港大学)...
  3. 我国科学家首次揭示“时空”记忆在猕猴大脑中表征的几何结构
  4. 谷歌为何要大力投资生命科学初创公司?
  5. [转]VSTO Office二次开发应用程序键盘鼠标钩子
  6. 从Spring到Java EE 6
  7. 如何用softmax和sigmoid来做多类分类和多标签分类
  8. Linux下安装LAMP的步骤
  9. 2020-8-5 Codeforces摸鱼报告
  10. 要如何实现pdf图片提取?可以试试这些方法
  11. matlab中功率因数模块,最经典的功率因数控制器设计方案
  12. 嵌入式软件项目流程、项目启动说明书(示例)
  13. Vue 路由 跳转【返回、刷新、跳转】
  14. 2014中国民营企业500强在京津冀经济区、珠江三角洲、长江三角洲分布
  15. 08-OS X系统中将control和command键互换
  16. nginx设置IP、文件目录、请求头白名单
  17. APT和Javapoet的精彩联动
  18. 研发部的人员素质要求及自我培养
  19. js对div取值与赋值
  20. Android Monkey测试入门:安装sdk、studio、模拟器,并分析monkey日志

热门文章

  1. nginx 负载均衡安装及升级步骤
  2. linux达人养成计划i,Linux达人养成计划 I
  3. Unity中自制Animation+播放完毕相应事件
  4. 几种数据增强:Mixup,Cutout,CutMix 和yolov4中的 Mosaic
  5. 过年了,让你的服务器提高警惕!
  6. Usage of API documented as @since 1.8+ less... (Ctrl+F1) Inspection info: This inspection finds all
  7. kafka reassign 限速_车主无忧:为什么放弃开源Kafka?
  8. Visual Studio 2010 Win32 Usb HID 动态库创建
  9. AD16布局流程及注意事项
  10. 转载 --史上最全数学符号、公式的英文读法,干货满满!