1、根据给定的网址获取网页源代码

2、利用正则表达式把源代码中的图片地址过滤出来

3、根据过滤出来的图片地址下载网络图片

import re

import urllib.request

def gethtml(url):

page=urllib.request.urlopen(url)

html=page.read()

return html

def getimg(html):

reg = r'src="(.*?\.jpg)"'

img=re.compile(reg)

html=html.decode('utf-8')#python3

imglist=re.findall(img,html)

x = 0

for imgurl in imglist:

urllib.request.urlretrieve(imgurl,'%s.jpg'%x)

x = x+1

html=gethtml("http://news.ifeng.com/a/20161115/50258273_0.shtml")

print(getimg(html))

把代码直接导入解释器,可直接运行抓取图片。

如果有什么不懂的可以评论,看到就会回复,或者添加本人QQ

看完文章记得点赞哦!

python查看图片的源代码,python网络爬虫源代码(可直接抓取图片)相关推荐

  1. [Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  2. c#使用正则表达式获取TR中的多个TD_[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例...

    首先祝大家中秋节和国庆节快乐,欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都 ...

  3. [Python从零到壹] 九.网络爬虫之Selenium基础技术万字详解(定位元素、常用方法、键盘鼠标操作)

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  4. [Python从零到壹] 五.网络爬虫之BeautifulSoup基础语法万字详解

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  5. python查看指令的方法python -h

    python查看指令的方法python -h 进入cmd 输入 python -h C:\Users\Administrator>python -h usage: python [option] ...

  6. python爬虫抓取图片-python网络爬虫源代码(可直接抓取图片)

    在开始制作爬虫前,我们应该做好前期准备工作,找到要爬的网站,然后查看它的源代码我们这次爬豆瓣美女网站,网址为:用到的工具:pycharm,这是它的图标 ...博文来自:zhang740000的博客 P ...

  7. python爬虫代码-python网络爬虫源代码(可直接抓取图片)

    在开始制作爬虫前,我们应该做好前期准备工作,找到要爬的网站,然后查看它的源代码我们这次爬豆瓣美女网站,网址为:用到的工具:pycharm,这是它的图标 ...博文来自:zhang740000的博客 P ...

  8. Python实训day04pm【网络爬虫(文本、图片)】

    Python实训-15天-博客汇总表 目录 1.网络爬虫 1.1.爬取文本 1.2.爬取图片 2.其他知识点 上午题目讲解 昨天的基础题目讲解 爬取非文本(图片) 1.网络爬虫 #bili 视频,爬下 ...

  9. 爬取动漫美女,手把手教你用Python网络爬虫获取动漫图片

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:砸漏 ( 想要学习Python?Python学习交流群 ...

  10. python学习笔记分享(四十)网络爬虫(7)反爬虫问题,解决中文乱码,登陆和验证码处理

    网络爬虫深度知识 一.反爬虫问题 (一)反爬虫原因 1.网络爬虫浪费了网站的流量 2.数据是私有资源 3.爬虫协议与原则 (二)反爬虫方式 (三)反反爬虫 1.原理 2.三种方法 二.解决中文乱码 ( ...

最新文章

  1. 轻量级的jQuery表单验证插件 - HAPPY.js
  2. 前端控制器html,DispatcherServlet(前端控制器)访问顺序和url匹配规则
  3. Windows 10 系统安装教程
  4. PAT-乙级-1021. 个位数统计 (15)
  5. seq_file机制
  6. 24个 CSS 高级技巧合集
  7. RedisUtil工具类
  8. pkgm : 压缩包维护与解压脚本
  9. 用C语言统计给定文本文件中汉字的个数
  10. SSM和SSH2区别
  11. ubuntu搜狗输入法切换快捷键fcitx设置
  12. 中国象棋马走日(要求打印每一种走法) — 递归
  13. 3d max 材质编辑器操作实例——自定义球
  14. IEEE Transactions on Systems, Man, and Cybernetics: Systems(TSMC)投稿须知
  15. [转]Flixel只能用于Flex吗?
  16. 设计公司该怎样开展业务?
  17. oracle数据库导出灰色_Oracle数据库导入导出命令总结
  18. sap BusinessObject Enterprise XI 4.0 安装载图
  19. TDengine在黑格智造的落地应用
  20. android设置移动联通电信wap接入点

热门文章

  1. 光学镜头是制作过程阶段理解
  2. php 解析网页慢,网页访问变慢的原因分析及优化
  3. oracle的cbd和pdb区别,Oracle 12C CDB、PDB常用管理命令
  4. 如何免费给PDF文件添加、删除水印?
  5. vue图片查看插件v-viewer使用
  6. 超声波测距传感器初识之HC-SR04
  7. 精彩十年(3)——初露锋芒
  8. 如何使用MSN Chat Monitor Sniffer?
  9. ZCU106的PYNQ移植
  10. IDEA中启动服务器和访问项目