目录

  • 效果演示
      • 代码
      • 效果
    • 爬虫流程
      • 打开网页
      • 获取数据
      • 保存数据

效果演示

废话不多说,先看下代码和效果

代码


# coding:utf-8
import requests
import jsondef download(src,id):dir = './'+str(id)+'.jpg'try:pic = requests.get(src,timeout=10)except requests.exceptions.ConnectionError:print('timeout error')fp= open(dir,'wb')#writefp.write(pic.content)#closefp.close()query ='周星驰'
for i in  range(0,38958,20):url = 'https://www.douban.com/j/search_photo?q='+query+'&limit=20&start='+str(i)# openhtml = requests.get(url).text# getresponse = json.loads(html,encoding='utf-8')for image in response['images']:print(image['src'])# 测试路径download(image['src'],image['id'])

效果

星爷当年如此帅气

爬虫流程

打开网页

首先打开豆瓣官网,输入关键词‘周星驰’进行搜索,结果出来后,我们选择图片选项,注意选择图片前要打开chrome的开发者工具,然后我们可以活动请求的链接地址了
https://www.douban.com/j/search_photo?q=周星驰&limit=20&start=0

这里有三个参数q,limit,start.q表示搜索的关键词,limit表示每页的显示数量,start表示每页的起始序号,注意默认是从0开始

获取数据


搜索结果是json 结果的数据,具体内容是一个数组images,数组的元素是字典

保存数据

def download(src,id):dir = './'+str(id)+'.jpg'try:pic = requests.get(src,timeout=10)except requests.exceptions.ConnectionError:print('timeout error')fp= open(dir,'wb')#writefp.write(pic.content)#closefp.close()

python 豆瓣爬虫:自动下载周星驰图片相关推荐

  1. python discuz_Python爬虫自动下载Discuz论坛附件。

    121,278 因工作需要,要定期收集卡饭论坛的病毒样本板块的病毒样本,所以就考虑用 Python做个爬虫,然后自动下载附件. 核心功能有3个: 1· 登录 2· 伪造cookie保持session ...

  2. python网络爬虫快速下载4K高清壁纸

    python网络爬虫快速下载4K高清壁纸 此处给出下载壁纸的链接地址彼岸图网,进入网站之后,我们看到可以下载风景,游戏,动漫,美女等类型的4K图片,装逼一下,re库有贪婪匹配,那我们就写一个通用代码来 ...

  3. python使用requests库下载单张图片的简单示例

    python使用requests库下载单张图片的简单示例 简要说明 代码示例 简要说明 下载图片的核心代码如下: res = requests.get(url=img_url, headers=hea ...

  4. 使用Tkinter + urllib + requests 实现自动下载百度图片

    整体步骤分三步: 1.设计tkinter页面布局 2.获取图片链接列表 3.执行下载操作 先放代码 import urllib import re import requeststry:from tk ...

  5. 使用Java编写爬虫,下载百度图片

    因为最近需要很多图片素材做机器训练,所以写一个爬虫来下载百度图片里的一些图片,用作机器学习. 先看看效果图: 实现思路: 根据百度图片的Ajax请求,用Chrome获取到URL,然后通过改变URL参数 ...

  6. python 通达信自动下载收盘和财务数据

    python 通达信自动下载收盘和财务数据,自动启动通达信,鼠标自动操作: 通达信直接从官网下载免费版,可下载财务数据. 自动识别屏幕尺寸(目前为1440x900.1920x1080.1366*768 ...

  7. python 福利_发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片!...

    对于Python的自动化测试或者是爬虫开发者来说,对于selenium库想必都听说过,selenium本身是作为Web应用测试工具,但是作为爬虫工具也有很广泛的用途. Selenium虽然好用,但是它 ...

  8. Python批量自动下载获取图片

    import requests from bs4 import BeautifulSoup import json import eventlet import osurlshu = 1 #url中f ...

  9. Python 爬虫自动下载OpenAI Key Papers

    Spinning Up是OpenAI开源的面向初学者的深度强化学习资料,其中列出了105篇深度强化学习领域非常经典的文章, 见 Spinning Up: 博主使用Python爬虫自动爬取了所有文章,而 ...

最新文章

  1. 2500 字全方面解读 Python 的格式化输出
  2. Linux-6.5下 MariaDB-10基于percona-XtraBackup备份工具的原理及配置详解
  3. 网站迁移的一般步骤、常见问题及解决措施
  4. ubuntu gcc安装总结
  5. C++ Primer 5th笔记(chap 16 模板和泛型编程)函数模板显式实参
  6. 无法打开 源 文件 pch.h_outlook 客户端数据文件无法打开,如何解决?
  7. JVM调优:常见垃圾回收器组合
  8. SQL Server--用户自定义函数
  9. angularjsl路由_AngularJS路由和模板
  10. Makefile文件试错
  11. vue实现网络图片瀑布流 + 下拉刷新 + 上拉加载更多
  12. Android利用canvas画各种图形(点、直线、弧、圆、椭圆、文字、矩形、多边形、曲线、圆角矩形...
  13. 数据产品-产品经理必备的七大文档
  14. Mac下的Adobe卸载后无法重装
  15. android平板性价比,性价比超高的安卓娱乐平板推荐
  16. performance性能
  17. H.266/VVC相关技术学习笔记21:帧间预测中五种Merge模式的熵编码方式
  18. 华夏收藏网首届赛宝大会
  19. 一般线性模型、混合线性模型、广义线性模型
  20. Linux Ubuntn环境下---Redis缓存的安装和启动

热门文章

  1. 4路DI开关检测计数器, Modbus TCP协议,WiFi模块 WJ160
  2. c++ 二维矩阵 转vector_C++ vector 实现二维数组
  3. CCF-CSP真题《202209-2 何以包邮?》思路+python满分题解
  4. execution表达式
  5. 电脑蓝屏/中断导致 git 文件损坏的修复方法
  6. 【Linux】Linux进程控制 --- 进程创建、终止、等待、替换、shell派生子进程的理解…
  7. 考研,加油,祝福你们
  8. 二叉搜索树及其操作详解
  9. 弘辽科技:淘宝开店进货一般进多少款?开店要多少钱?
  10. Day88 Java框架 SSM分布式案例--商城(一)介绍