import reimport urllib.request# import urllibimport os

def getHtml(url):    page = urllib.request.urlopen(url)    html = page.read()    return html.decode('UTF-8')

def getImg(html):    reg = r'src="(.+?\.jpg)" pic_ext'  # 要加括号,作为元组返回,抓取淘宝的图片png(先看源码中图片的地址路径)reg = r'data-lazy="(.+?\.png)" '    imgre = re.compile(reg)    imglist = imgre.findall(html)    x = 0    path = 'D:\\pythonTest\\images'    if not os.path.isdir(path):        os.makedirs(path)    paths = path + '\\'  # 保存在test路径下    for imgurl in imglist:        urllib.request.urlretrieve(imgurl, '{}{}.jpg'.format(paths, x))        x = x + 1

html = getHtml("http://tieba.baidu.com/p/2460150866")  # 淘宝的:html = getHtml(r"http://www.taobao.com/")getImg(html)

转载于:https://www.cnblogs.com/vsmart/p/7768944.html

python3 抓取图片相关推荐

  1. python3抓取图片_通过Python3 爬虫抓取漫画图片

    引言: 最近闲来无事所以想着学习下python3,看了好长时间的文档,于是用python3写了一个漫画抓取的程序,好了 废话不多说上码! 第一步: 准备环境 和类库,我用的是python3.5    ...

  2. python3抓取图片视频_Python opencv提取视频中的图片

    #-*- coding: utf-8 -*- importosimport cv2 ##加载OpenCV模块 def video2frames(pathIn='', pathOut='', only_ ...

  3. Python3抓取Bing每日图片做桌面背景,并设置为开机更新背景

    该程序是我学习Python的第一个小程序,用于熟悉Python语法,其中借鉴了很多其他网友的Code,望谅解. 参考列表 主要参考博客列表如下: LittleBearLi http://blog.cs ...

  4. Python通过代理多线程抓取图片

    前言 Python作为一门功能强大的脚本语言,经常被用来写爬虫程序,下面是Python通过代理多线程抓取图片代码 Python爬虫多线程抓取代理服务器参考: http://www.linuxeye.c ...

  5. 获取http地址如何从上面抓取图片_用 Python 自动抓取妹子图

    目录 前言 Media Pipeline 启用Media Pipeline 使用 ImgPipeline 抓取妹子图 瞎比比与送书后话 前言 我们在抓取数据的过程中,除了要抓取文本数据之外,当然也会有 ...

  6. python获取app信息的库_基于python3抓取pinpoint应用信息入库

    这篇文章主要介绍了基于python3抓取pinpoint应用信息入库,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Pinpoint是用Java编写 ...

  7. python3 抓包 解包_Python结构包,解包

    python3 抓包 解包 Python struct module is capable of performing the conversions between the Python value ...

  8. RegExp抓取图片

    RegExp抓取图片 几种显示图片的方式: html语法不严格 <ul><li><img src='img.png' /></li><li> ...

  9. Python抓取图片

    Python 抓取图片(记录) 记录过程,怕忘了.复制就能用. # coding=utf-8 import os import platform from multiprocessing.pool i ...

最新文章

  1. html5改成块状标签,HTML5基本网页结构以及标签的改变
  2. C++中的对象_纪要(二)
  3. 为什么我们需要Logstash,Fluentd等日志摄取器?
  4. Java基础——虚拟机结构
  5. 修改gitignore 后不起作用
  6. Sublime Text 3总是出现“1 missing dependency was just installed.”
  7. Spark入门实战系列--6.SparkSQL(下)--Spark实战应用
  8. python统计excel数据总行数_python 统计excel行数据库
  9. opencv-python:17_图像经典边缘检测算子(边缘检测、图像梯度、Roberts算子、Prewitt算子、Sobel 算子、Laplacian 算子、Canny算子、算子优缺点对比)
  10. 怎样用计算机二元一次方程,键入公式在计算机如何键入二元一次方程式公式 – 手机爱问...
  11. PyQt5 QLabel控件
  12. 题解 P1774 【最接近神的人_NOI导刊2010提高(02)】
  13. 计算机内存是ram,电脑ram内存不足怎么办
  14. pyinstaller包含html文件,pyinstaller打包exe
  15. 2018深信服java笔试题,深信服2018秋招编程题
  16. 实用的Linux命令行技巧
  17. 程序设计思维与实践 Week12 作业 必做题 A-zjm找数
  18. 名悦集团:对于自动挡初学者有哪些驾驶技巧
  19. 偏差-方差均衡(Bias-Variance Tradeoff)
  20. nodejs基于Vue旅游网站的设计与开发express前端源码

热门文章

  1. ASP.NET企业开发框架IsLine FrameWork系列之四--DataProvider 数据访问(上)
  2. 深度学习《Life-Long Learning》
  3. “ORA-01034 - Oracle not available”和“ORA-27101 - shared memory realm does not exist”
  4. leetcode 好的博客汇总
  5. 王道 —— 操作系统的四个特征
  6. 自然语言处理 —— 2.4 嵌入矩阵
  7. leetcode - 898. 子数组按位或操作(使用了集合)
  8. Java指定几个标点符号(或分割)分割字符
  9. Opencv--Mat属性step,size,step1,elemSize,elemSize1
  10. 动态规划——基本思想