python抓取网站的图片并下载到本地
#!/usr/bin/python # -*- coding: UTF-8 -*- import re import urllib,urllib2;#通过url获取网页 def getHtml(url):# 要设置请求头,让服务器知道不是机器人 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' headers = {'User-Agent': user_agent}request=urllib2.Request(url,headers=headers);page = urllib2.urlopen(request);html = page.read()return html#通过正则表达式来获取图片地址,并下载到本地 def getImg(html):reg = r'src="(.+?\.jpg)"' imgre = re.compile(reg)imglist = imgre.findall(html)x = 0 for imgurl in imglist:print imgurl;#通过urlretrieve函数把数据下载到本地的D:\\images,所以你需要创建目录 urllib.urlretrieve(imgurl, 'D:\\images\\%s.jpg' % x)x = x + 1 html = getHtml("http://www.qiushibaike.com/imgrank/") getImg(html)
python抓取网站的图片并下载到本地相关推荐
- 【python】python 爬虫(python抓取网站的图片)
文章目录 1.什么是爬虫 2.爬虫的思想 一些知识 1 . 环境的搭建请看: 2 . 3 .:Requests urllib的升级版本打包了全部功能并简化了使用方法(点我查看官方文档) 4 : bea ...
- python抓取网站图片_python抓取图片示例 python抓取网页上图片
python抓取网页上图片 这个错误时是什么意思 下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...
- python抓取网站图片_利用python抓取网站图片
看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下. 本人是初学者, ...
- 使用python抓取落网期刊图片
使用python抓取落网期刊图片 虽然使用python开发也将近两年了,但工作中使用python更多处理业务逻辑,数据加工等,难免有些枯燥.乏味.一直听闻python在web数据爬取.数据分析上有无可 ...
- python抓取网站乱码_如何使用Python抓取网站
python抓取网站乱码 by Devanshu Jain 由Devanshu Jain It is that time of the year when the air is filled with ...
- python爬取网站源代码+图片
python爬取网站源代码+图片 需求分析 基础知识 正则表达式 python网络请求 文件读写 实现 基本思路 具体实现 结果 总结 需求分析 大部分有志青年都想建立属于自己的个人网站,从零开始设计 ...
- python爬取网站的图片
python爬取网站的图片 本次爬取图片所需要用到的库:Requests库,BeautifulSoup库,正则表达式,os库. 思路:先爬一张图片,再爬一个网站的图片 先爬一张图片: 首先要得到这张图 ...
- VB 抓取网站验证码图片
VB 抓取网站验证码图片 2010年05月20日 方法一:使用XMLHTTP Public Function GetCheckCode() Dim xmlHttp As Object Dim Pic ...
- Java+Jsoup: 爬取二次元妹子图片并下载到本地(完整代码)
简介 这是一个基于Jsoup的用来爬取网页上图片并下载到本地的Java项目. 完整项目见 https://github.com/AsajuHuishi/CrawlByJsoup exe文件见getIm ...
最新文章
- 太真实!当程序员接手了新项目...... | 每日趣闻
- Keil 二进制数输入宏
- 算法提高课-搜索-DFS之连通性模型-AcWing 1113. 红与黑:dfs和bfs两种做法
- Python:非常详细的解释如何判断某个变量的类型以及代码实现
- 【解题报告】Leecode 2057. 值相等的最小索引——Leecode周赛系列
- python(15)-window7配置iPython
- 架构学习----消息队列
- C++工程通过opencv找到自己定义的矩形中的两平行线的距离
- ATP-EMTP电缆LCC模型中相数与电缆数的设置
- LitJson的使用
- 传递闭包c语言算法解析,找关系的传递闭包 用c语言编 一个关系的传递闭包
- SAE 联合乘云至达与谱尼测试携手共同抗疫
- SpringBoot关于文件上传配置的几种方式
- AD(altium designer)15原理图与PCB设计教程(六)——印制电路板设计的基础知识
- 《离职申请表》交了后 在公司最后一天上班
- java生成word,html文件并将内容保存至数据库 (http://blog.163.com/whs3727@126/blog/static/729915772007325112014115/)
- 华三c语言笔试,H3C笔试及答案解析
- linux下安装mariadb
- P1717 Finger guessing
- android隐藏系统ui_如何启用Android的“系统UI调谐器”以访问实验功能
热门文章
- ES6的变量声明详述
- 【最详细】数据结构(C语言版 第2版)第二章课后习题答案 严蔚敏 等 编著
- java吧王者_java单排上王者!(一) java内存
- html5 canvas图文编辑器源码_5个微信编辑器,再也不用为公众号发愁啦
- linux多线程计算pi,使用蒙特卡洛方法多线程计算pi值
- php5.5 集成环境,windows下配置php5.5开发环境及开发扩展_PHP
- 无头结点单链表的逆置_第1章第2节练习题11 就地逆置单链表
- seir模型的微分方程怎么写_抖音文案怎么写?6种热门文案写作模型
- python中字符串的制表符为_零基础学python_03_字符串(拼接+换行+制表符)
- 编码utf-8的不可映射字符_不要在 MySQL 中使用“utf8”,请使用“utf8mb4”