python网络爬虫_爬图片

1.安装 Beautifulsoup4

 #解析返回的html与json数据pip install Beautifulsoup4 

使用 :
          运行后输入要搜索的关键字
          输入要下载的数量
          输入需要保存的文件夹名称

#解析返回的html与json数据 ;jupyter noteBook
# !pip install Beautifulsoup4
##使用
# 运行后输入要搜索的关键字
# 输入要下载的数量
# 输入需要保存的文件夹名称
import re
import requests
from urllib import error
from bs4 import BeautifulSoup
import os
import cv2 num = 0
numPicture = 0
file = ''
List = []def Find(url):global Listprint('正在检测图片总数,请稍等.....')t = 0i = 1s = 0while t < 1000:Url = url + str(t)try:Result = requests.get(Url, timeout=7)except BaseException:t = t + 60continueelse:result = Result.textpic_url = re.findall('"objURL":"(.*?)",', result, re.S)  # 先利用正则表达式找到图片urls += len(pic_url)if len(pic_url) == 0:breakelse:List.append(pic_url)t = t + 60return sdef dowmloadPicture(html, keyword):global num# t =0pic_url = re.findall('"objURL":"(.*?)",', html, re.S)  # 先利用正则表达式找到图片urlprint('找到关键词:' + keyword + '的图片,即将开始下载图片...')for each in pic_url:print('正在下载第' + str(num + 1) + '张图片,图片地址:' + str(each))cap=cv2.VideoCapture(each)ret=cap.isOpened()if (ret):ret,img=cap.read()if ret:img = cv2.resize(img, (150, 150), interpolation = cv2.INTER_AREA)cv2.imwrite('./'+file+'/'+file+str(num + 1)+".jpg", img)cap.release()num += 1if num >= numPicture:returnif __name__ == '__main__':  # 主函数入口word = input("请输入搜索关键词: ")#add = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%BC%A0%E5%A4%A9%E7%88%B1&pn=120'url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + word + '&pn='tot = Find(url)print('经过检测%s类图片共有%d张' % (word, tot))numPicture = int(input('请输入想要下载的图片数量 '))file = input('请建立一个存储图片的文件夹,输入文件夹名称即可')y = os.path.exists(file)if y == 1:print('该文件已存在,请重新输入')file = input('请建立一个存储图片的文件夹,)输入文件夹名称即可')os.mkdir(file)else:os.mkdir(file)t = 0tmp = urlwhile t < numPicture:try:url = tmp + str(t)result = requests.get(url, timeout=10)print(url)except error.HTTPError as e:print('网络错误,请调整网络后重试')t = t+60else:dowmloadPicture(result.text, word)t = t + 60print('当前搜索结束,感谢使用')

python网络爬虫_爬图片相关推荐

  1. 精通Python网络爬虫_核心技术框架与项目实战_韦玮.pdf

    精通Python网络爬虫_核心技术框架与项目实战_韦玮 编辑推荐 从技术.工具.实战3个维度讲透Python网络爬虫各项核心技术和主流框架,深度讲解网络爬虫的抓取技术与反爬攻关技巧 内容简介 随着大数 ...

  2. python 爬虫源代码-从零开始学Python网络爬虫_源代码.rar

    [实例简介] [实例截图] [核心代码] 从零开始学Python网络爬虫_源代码_1 ├── 58project │ ├── __pycache__ │ │ ├── channel_extract.c ...

  3. python爬取素材图片代码_一篇文章教会你利用Python网络爬虫获取素材图片

    [一.项目背景] 在素材网想找到合适图片需要一页一页往下翻,现在学会python就可以用程序把所有图片保存下来,慢慢挑选合适的图片. [二.项目目标] 1.根据给定的网址获取网页源代码. 2.利用正则 ...

  4. 如何用python搜索要用的素材_一篇文章教会你利用Python网络爬虫获取素材图片

    [一.项目背景] 在素材网想找到合适图片需要一页一页往下翻,现在学会python就可以用程序把所有图片保存下来,慢慢挑选合适的图片. [二.项目目标] 1.根据给定的网址获取网页源代码. 2.利用正则 ...

  5. Python网络爬虫:爬取并下载个性化签名图片 附GUI窗体版

    Hello,大家好,我是wangzirui32,最近我开了个新的系列,是"Python网络爬虫"分类,还请大家多多支持! 今天,我们来学习如何爬取并下载个性化签名图片,开始学习吧! ...

  6. 利用Python网络爬虫获取分类图片,简单处理反爬教学

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 本文章来自腾讯云 作者:Python进阶者 想要学习Python?有问题得不到第一 ...

  7. 手把手教你用Python网络爬虫获取壁纸图片

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 桃之夭夭,灼灼其华. /1 前言/ ...

  8. 一篇文章教会你利用Python网络爬虫获取素材图片

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 在素材网想找到合适图片需要一页一页往下翻,现在学会python就可 ...

  9. 一篇文章教会你利用Python网络爬虫获取分类图片

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 博海拾贝是一支互联网从业者在线教育的团队,扎根于中国教育行业以及互 ...

最新文章

  1. 如何使错误日志更加方便排查问题
  2. html常用标签详解4-列表标签
  3. tableau可视化数据分析60讲(三)-tableau文件、数据类型及常用数据术语
  4. OGEngine_粒子效果
  5. linkedin爬虫_重新设计Linkedin的指导功能-用户体验案例研究
  6. 野生前端的数据结构练习(1)——栈
  7. 测试鼠标是否双击_鼠标连接电脑没反应
  8. 自定义queue - linked array
  9. Java和JavaScript中使用Json方法大全
  10. LabVIEW2018工具包分享
  11. python_爬取博客文章下载到本地
  12. Fedora 使用 yaourt
  13. Ipad2 使用心得
  14. WPF DataGrid 隐藏列
  15. Web函数请求多并发上线,Web服务部署更快更省
  16. PHP心脏装置,“人工心脏”不再科幻 中山医院完成国产心室辅助装置植入
  17. 正确加载MySQL驱动的语句_正确加载MySQL驱动的语句_____________________;_学小易找答案...
  18. 基于ART-PI SPI驱动W25Q128
  19. 中国全国及各地人口总数和男女比例情况
  20. Java Selenium防止被网站检测

热门文章

  1. [转]ExtJS的使用方法汇总—配置和表格控件使用
  2. 2010年初的一点随想
  3. 使用pymongo连接mongodb时报错:pymongo.errors.OperationFailure: not authorized
  4. Problem D. Country Meow 2018ICPC南京
  5. 冒泡排序及优化(Java实现)
  6. IE9下透明度设置无效
  7. awksed story
  8. 安装Android开发工具
  9. 生产环境nginx平滑升级
  10. 会议之后,对应内容的再次确认