#coding:utf-8from lxml import etree
import requests
import urllib.request
import progressbar  header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)'+'Chrome/67.0.3396.87 Safari/537.36'
}word=input('请输入搜索的内容:')urls=['https://www.pexels.com/search/'+word+'/?page={}'.format(str(i))for i in range(11,12)]
path='E://G/'for url in urls :res=requests.get(url)selector=etree.HTML(res.text)second_urls=selector.xpath('//div[@class="photos"]/article')print(len(second_urls))for second_url in second_urls:new_url=second_url.xpath('a[1]/@href')[0]new_url='https://www.pexels.com'+str(new_url)#print(new_url)new_res=requests.get(new_url)new_selector=etree.HTML(new_res.text)new_second_urls=new_selector.xpath('//a[@class="btn__primary js-download"]')img_src = new_second_urls[0].xpath('@href')[0]img_src=img_src.split('?')[0]data=requests.get(img_src,headers=header)total_length = int(data.headers.get("Content-Length"))with open(path+img_src.split('/')[-1], 'wb') as f:widgets = ['Progress: ', progressbar.Percentage(), ' ',progressbar.Bar(marker='#', left='[', right=']'),' ', progressbar.ETA(), ' ', progressbar.FileTransferSpeed()]pbar = progressbar.ProgressBar(widgets=widgets, maxval=total_length).start()count=0for chunk in data.iter_content(chunk_size=1):if chunk:count=count+1f.write(chunk)f.flush()pbar.update(count)pbar.finish()

这里首先输入搜索关键字,输出每页图片张数,打印下载进度条

python爬取pexels网站图片相关推荐

  1. python爬虫真假网址,python爬取福利网站图片完整代码,懂得人都懂

    网址需要自己替换懂的人都懂512*2,主要学习简单的爬虫,别乱用,否则后果自负! [Python] 纯文本查看 复制代码 import requests,bs4,re,os,threadingclas ...

  2. python爬取某网站图片

    程序运行需要导包 具体看代码中的,缺啥导啥✌. import requests import re import time import os url="https://pic.netbia ...

  3. python最新官网图片_python爬取福利网站图片完整代码

    存起来 自己学习... import requests,bs4,re,os,threading class MeiNvTu: def __init__(self): self.url_main='ht ...

  4. python爬取动态网页图片

    爬取某知名网站图片(爬取动态网页) python爬取动态网页图片 python爬取动态网页图片 环境: python3.pycharm 库: requests.urllib.json 思路: 1.分析 ...

  5. Python爬取小姐姐图片

    使用Python爬取小姐姐图片 首先上网站链接 唯美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 E.g xiaojiejie web 2.下载并安装python环境 pytho ...

  6. python爬取指定关键字图片

    ''' 爬取指定关键字图片 ''' import re# 正则表达式,解析网页 import requests# 请求网页 import traceback import osdef dowmload ...

  7. python爬取贴吧图片_Python爬取贴吧多页图片

    Python爬取贴吧图片都只能爬取第一页的,加了循环也不行,现在可以了. #coding:utf-8 import urllib import urllib2 import re import os ...

  8. Python爬取自然风景图片代码

    Python爬取自然风景图片代码 \qquad 需要用到python的etree库和requests库,需要提前下载安装. from lxml import etree import requests ...

  9. Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘

    更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘 给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...

最新文章

  1. python办公模块_Python 办公自动化教程
  2. 研究生报考苏州大学计算机科学与技术,【图片】18年苏州大学计算机872考研经验分享【苏州大学研究生吧】_百度贴吧...
  3. arduino 超声波测距原理_超声波测距灯
  4. redis-配置主从-实际操作-over
  5. java中json对象去重复_如何忽略Java中JSON对象的多个属性?
  6. TLS协议簇加解密流程
  7. 推荐两个高仿抖音 App 项目
  8. 基于微信小程序会议室预约系统设计与实现毕业设计毕设开题报告参考
  9. flutter显示图标_如何自动调整Flutter中的图标大小
  10. 4g能用吗64java,4g内存能不能装64位系统吗_电脑内存是4g可以安装64位系统吗
  11. Arcpy处理月NDVI,最大合成法合成年NDVI
  12. 浅谈服务器选择固态硬盘的几个优缺点
  13. 离线地图-geoserver
  14. Java后端面试必问:四十八道面试题及答案最新整理(速看速藏)
  15. 信号与系统 - 卷积运算
  16. 塔望 用食品改变世界
  17. sfc /scannow命令如何能用虚拟光驱完成修复?
  18. LockSupport的park/unpark分析
  19. IDEA maven 项目依赖无法解析
  20. LaTex 编译中文

热门文章

  1. fri信号重构-sinc核滤波
  2. 家校在线app 页面
  3. Day08_vant实现_网易云音乐案例
  4. 深度学习图像分类(六):Stochastic_Depth_Net
  5. php 图片 圆角,PHP将图片处理成圆角
  6. mybatis+spring+springmvc ssm整合
  7. 淘宝商城:将公布和解条件
  8. 用JAVA制作抓老鹰游戏_Java制作最难练手速游戏,Faker都坚持不了一分钟
  9. Newline —— CRLF、LF、CR回车和换行
  10. 【浅谈爬虫】一名合格的Python爬虫工程师必须具备技能—具体了解四大Python爬虫分类以及爬虫基本原理实现