python3 抓取图片
import reimport urllib.request# import urllibimport os def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return html.decode('UTF-8') def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' # 要加括号,作为元组返回,抓取淘宝的图片png(先看源码中图片的地址路径)reg = r'data-lazy="(.+?\.png)" ' imgre = re.compile(reg) imglist = imgre.findall(html) x = 0 path = 'D:\\pythonTest\\images' if not os.path.isdir(path): os.makedirs(path) paths = path + '\\' # 保存在test路径下 for imgurl in imglist: urllib.request.urlretrieve(imgurl, '{}{}.jpg'.format(paths, x)) x = x + 1 html = getHtml("http://tieba.baidu.com/p/2460150866") # 淘宝的:html = getHtml(r"http://www.taobao.com/")getImg(html)
转载于:https://www.cnblogs.com/vsmart/p/7768944.html
python3 抓取图片相关推荐
- python3抓取图片_通过Python3 爬虫抓取漫画图片
引言: 最近闲来无事所以想着学习下python3,看了好长时间的文档,于是用python3写了一个漫画抓取的程序,好了 废话不多说上码! 第一步: 准备环境 和类库,我用的是python3.5 ...
- python3抓取图片视频_Python opencv提取视频中的图片
#-*- coding: utf-8 -*- importosimport cv2 ##加载OpenCV模块 def video2frames(pathIn='', pathOut='', only_ ...
- Python3抓取Bing每日图片做桌面背景,并设置为开机更新背景
该程序是我学习Python的第一个小程序,用于熟悉Python语法,其中借鉴了很多其他网友的Code,望谅解. 参考列表 主要参考博客列表如下: LittleBearLi http://blog.cs ...
- Python通过代理多线程抓取图片
前言 Python作为一门功能强大的脚本语言,经常被用来写爬虫程序,下面是Python通过代理多线程抓取图片代码 Python爬虫多线程抓取代理服务器参考: http://www.linuxeye.c ...
- 获取http地址如何从上面抓取图片_用 Python 自动抓取妹子图
目录 前言 Media Pipeline 启用Media Pipeline 使用 ImgPipeline 抓取妹子图 瞎比比与送书后话 前言 我们在抓取数据的过程中,除了要抓取文本数据之外,当然也会有 ...
- python获取app信息的库_基于python3抓取pinpoint应用信息入库
这篇文章主要介绍了基于python3抓取pinpoint应用信息入库,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Pinpoint是用Java编写 ...
- python3 抓包 解包_Python结构包,解包
python3 抓包 解包 Python struct module is capable of performing the conversions between the Python value ...
- RegExp抓取图片
RegExp抓取图片 几种显示图片的方式: html语法不严格 <ul><li><img src='img.png' /></li><li> ...
- Python抓取图片
Python 抓取图片(记录) 记录过程,怕忘了.复制就能用. # coding=utf-8 import os import platform from multiprocessing.pool i ...
最新文章
- html5改成块状标签,HTML5基本网页结构以及标签的改变
- C++中的对象_纪要(二)
- 为什么我们需要Logstash,Fluentd等日志摄取器?
- Java基础——虚拟机结构
- 修改gitignore 后不起作用
- Sublime Text 3总是出现“1 missing dependency was just installed.”
- Spark入门实战系列--6.SparkSQL(下)--Spark实战应用
- python统计excel数据总行数_python 统计excel行数据库
- opencv-python:17_图像经典边缘检测算子(边缘检测、图像梯度、Roberts算子、Prewitt算子、Sobel 算子、Laplacian 算子、Canny算子、算子优缺点对比)
- 怎样用计算机二元一次方程,键入公式在计算机如何键入二元一次方程式公式 – 手机爱问...
- PyQt5 QLabel控件
- 题解 P1774 【最接近神的人_NOI导刊2010提高(02)】
- 计算机内存是ram,电脑ram内存不足怎么办
- pyinstaller包含html文件,pyinstaller打包exe
- 2018深信服java笔试题,深信服2018秋招编程题
- 实用的Linux命令行技巧
- 程序设计思维与实践 Week12 作业 必做题 A-zjm找数
- 名悦集团:对于自动挡初学者有哪些驾驶技巧
- 偏差-方差均衡(Bias-Variance Tradeoff)
- nodejs基于Vue旅游网站的设计与开发express前端源码
热门文章
- ASP.NET企业开发框架IsLine FrameWork系列之四--DataProvider 数据访问(上)
- 深度学习《Life-Long Learning》
- “ORA-01034 - Oracle not available”和“ORA-27101 - shared memory realm does not exist”
- leetcode 好的博客汇总
- 王道 —— 操作系统的四个特征
- 自然语言处理 —— 2.4 嵌入矩阵
- leetcode - 898. 子数组按位或操作(使用了集合)
- Java指定几个标点符号(或分割)分割字符
- Opencv--Mat属性step,size,step1,elemSize,elemSize1
- 动态规划——基本思想