Python 爬取陈都灵百度图片

标签(空格分隔): 随笔


今天意外发现了自己以前写的一篇爬虫脚本,爬取的是我的女神陈都灵,尝试运行了一下发现居然还能用。故把脚本贴出来分享一下。

import requests
import os
import json
#import random#firsturl='https://image.baidu.com/search/acjson?'
#header={'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
def get_chenduling(le):header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}url = 'https://image.baidu.com/search/acjson?'data={'tn':'resultjson_com','ipn':'rj','ct':'201326592','is':'','fp':'result','queryWord':'陈都灵','cl':'2','lm':'-1','ie':'utf-8','oe':'utf-8','adpicid':'','st':'','z':'','ic':'','word':'陈都灵','s':'','se':'','tab':'','width':'','height':'','face':'','istype':'','qc':'','nc':'','fr':'','cg':'star','pn':'30','rn':'30','gsm':le,}response=requests.get(url,params=data,headers=header)#print(response.text[:3000])chen=json.loads(response.text)#if chen and 'data' in chen:for item in chen.get('data'):newurl=item.get('middleURL')#print(newurl)if newurl:dd=savechen(newurl,header)resave(newurl,dd)nextle=chen.get('gsm')#print(nextle)get_chenduling(nextle)
def savechen(item,header):try:dudu=requests.get(item,headers=header)dudu.raise_for_status()#fpath='{0}.{1}.{2}'.format('d:\chenduling\\',item.split('.')[-2],'jpg')return dudu.contentexcept:print('有毛病。。。。')
def resave(item,html):fpath = '{0}.{1}'.format('d:\chenduling', item.split(',')[-1])if not os.path.exists(fpath):with open (fpath,'wb') as ff:print('downloading.....{0}'.format(item))ff.write(html)def main():le='le'#firsturl = 'https://image.baidu.com/search/acjson?'#header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}get_chenduling(le)
if __name__ =='__main__':main()

运行了一下,一点问题都没有,图片都存放到D盘了,拓展到其他图片估计也没问题,至于le这个参数干嘛的,我也记不清了。隐约记得有一个请求头部包含一串数字,但是这串数字并没有卵用。

转载于:https://www.cnblogs.com/starstrrys/p/11196944.html

Python 爬取陈都灵百度图片相关推荐

  1. Python爬取瀑布流百度图片

    Python爬去瀑布流百度图片 import requests from bs4 import BeautifulSoup import re from urllib.parse import url ...

  2. 用Python爬取彼岸图网图片

     用Python爬取彼岸图网图片 *使用了  四个模块 import time import requests from lxml import etree import os 没有的话自行百度安装. ...

  3. python爬取图片-Python爬取网页中的图片(搜狗图片)详解

    前言 最近几天,研究了一下一直很好奇的爬虫算法.这里写一下最近几天的点点心得.下面进入正文: 你可能需要的工作环境: Python 3.6官网下载 本地下载 我们这里以sogou作为爬取的对象. 首先 ...

  4. python如何爬取网页视频_快就完事了!10分钟用python爬取网站视频和图片

    原标题:快就完事了!10分钟用python爬取网站视频和图片 话不多说,直接开讲!教你如何用Python爬虫爬取各大网站视频和图片. 638855753 网站分析: 我们点视频按钮,可以看到的链接是: ...

  5. Python爬取国家地理杂志的图片

    一.简介:Python爬取国家地理杂志的图片 二.代码展示 from bs4 import BeautifulSoup import requests import osos.mkdir('./img ...

  6. Python爬取 | 唯美女生图片

    这里只是代码展示,且复制后不能直接运行,需要配置一些设置才行,具体请查看下方链接介绍: Python爬取 | 唯美女生图片 from selenium import webdriver from fa ...

  7. 利用python爬取qq个性网图片

    利用python爬取qq个性网图片 网站头像布局大同小异,稍改代码即可爬取想要的头像. 不多bb,上代码. import requests from parsel import Selector im ...

  8. python爬取街拍美女图片

    python爬取街拍美女图片 完整代码: import requests from urllib.parse import urlencode import os from hashlib impor ...

  9. python3爬取30张百度图片大量百度图片【王俊凯】

    python3爬取30张百度图片&大量百度图片[王俊凯] 30张图片(easy!) 好多好多图片! 复习C++之前先玩了一下爬虫,这学期属于是入了小凯的坑爬不出来了qwq 先看结果捏~ 学习了 ...

最新文章

  1. tf.placeholder函数说明
  2. python装饰设备_Python: 装饰器的小例子
  3. ASIC开发设计流程
  4. 每日一皮:开会不关微信的尴尬(2)
  5. 数据库-ADONET-向数据库提交更新
  6. Linux i2c子系统驱动probe
  7. 硬件安全模块(HSM)
  8. Google Earth Engine(GEE)统计制图
  9. js获取唯一设备码_前端JS获取设备IP地址和唯一标识
  10. 2021年西式面点师(初级)考试平台及西式面点师(初级)模拟考试
  11. 互联网产品三大需求文档:BRD、MRD、PRD
  12. 【华为机试真题Java】从入门到入职-真题列表导读
  13. 工作经验分享-vivo链路监控
  14. 指定页面模式,避开IE兼容性问题
  15. css动画实现跳动的小人
  16. Android HIDL HAL 接口定义语言详解
  17. 二维矩阵乘法、矩阵转置、 矩阵与向量乘法(java实现)
  18. 简论数控机床的特点及发展趋势
  19. 黑马程序员_配置环境变量
  20. wls2 ubuntu设置固定IP地址,并实现开机启动

热门文章

  1. 测试人遇到被测 APP 要下架,怎么处理?
  2. jQuery弹幕插件
  3. python 05 字典
  4. unity动画转换插件 AnimationConverter, humanoid generic legacy
  5. 芯片制造全工艺流程详情
  6. 李学江:B2B行业门户网站最终页标题设置方法
  7. 带通滤波器中心频率计算公式中R是哪个值_三个零件组成矿石收音机,LC电路谐振频率换算及零件选购是关键...
  8. 基于Matlab的倍相buck降压电路仿真
  9. 未能找到路径“\bin\roslyn\csc.exe”的一部分 的解决办法
  10. elasticsearch 父子文档