#coding:utf-8
import requests
import re
import urllib
import os, sys
from bs4 import BeautifulSoup as bs'''
作用:获取百度贴吧图片'''
def get_content(url):r = urllib.urlopen(url)html = r.read()r.close()return html
html = get_content("http://tieba.baidu.com/p/5347937418")
url(http://tb2.bdstatic.com/tb/static-pb/img/cur_zin.cur), pointer;" src="http://imgsrc.baidu.com/forum/w%3D580/sign=af5797c0b9fb43161a1f7a7210a44642/96f8ce1b9d16fdfa3d6b31e5bf8f8c5494ee7b49.jpg" size="230432" changedsize="true">'
regex = r'class="BDE_Image".+?src="(.+?\.jpg)"'
pat = re.compile(regex)
list = re.findall(pat,html)
i = 0
os.mkdir("d://image")
for item in list:urllib.urlretrieve(item,"d://image//%s.jpg" % i)print ii += 1

步骤:
1. 打开网页获取html
2. 分析图片所在的标签特点
3. 使用正则筛选图片链接
4. 遍历列表使用 urllib.urlretrieve弄到本地

python爬贴吧图片下载到本地相关推荐

  1. Python爬取网页图片至本地

    Python爬取网页图片至本地 爬取网页上的图片至本地 参考代码如下: # -*- codeing = utf-8 -*- import requests import rephotos = [] h ...

  2. python 下载图片到内存卡_python-23:将图片下载到本地

    python-23 :将图片下载到本地 得到图片的网址之后我么你怎么将图片下载到本地 呢? 在 python 中我们使用 urllib 库里面的 urllib.urlretrieve() 函 数 又是 ...

  3. 第十讲:Python爬取网页图片并保存到本地,包含次层页面

    上一讲我们讲到了从昵图网的首页下载图片到本地,但是我们发现首页上面的大部分链接其实都可以进入到二级页面. 在二级页面里面,我们也可以同样进行图片的下载,通过层层循环我们可以把网址的一部分图片下载到本地 ...

  4. python爬取动态页面并保存_第十讲:Python爬取网页图片并保存到本地,包含次层页面...

    上一讲我们讲到了从昵图网的首页下载图片到本地,但是我们发现首页上面的大部分链接其实都可以进入到二级页面. 在二级页面里面,我们也可以同样进行图片的下载,通过层层循环我们可以把网址的一部分图片下载到本地 ...

  5. Python爬取bing图片

    我之前写过一篇Python爬取百度图片,有兴趣的朋友可以去读一下,这次写的是爬取Bing的图片. 打开Bing图片,搜索关键词,开始分析页面,可以发现bing和百度一样都是下滑自动加载,百度默认一次加 ...

  6. python爬取推背图图片

    最近在自学python,尝试一下它的爬虫功能.于是脑袋一热就像把网页上的推背图的图片都爬下来放一个文件夹里.于是就有了下面的代码. 注:本教程只做学习交流使用,下载的图片只是本地查看,未做他用,如有侵 ...

  7. Python爬取网站图片数据

    Python爬取网站图片数据 找到需要爬取的网站地址 模拟网站http请求 根据调试模式获取的了解读取到真实的地址url,读取请求头数据和参数信息,模拟http请求调用 import requests ...

  8. 使用Python爬取网页图片

    使用Python爬取网页图片 李晓文 21 天前 近一段时间在学习如何使用Python进行网络爬虫,越来越觉得Python在处理爬虫问题是非常便捷的,那么接下来我就陆陆续续的将自己学习的爬虫知识分享给 ...

  9. 利用python爬取网页图片

    学习python爬取网页图片的时候,可以通过这个工具去批量下载你想要的图片 开始正题: 我从尤物网去爬取我喜欢的女神的写真照,我们这里主要用到的就两个模块 re和urllib模块,有的时候可能会用到t ...

最新文章

  1. 上海银行:转型创新网银与应用质量双赢
  2. c语言课程设计走迷宫游戏,C语言课程设计-迷宫游戏.doc
  3. Activiti概述
  4. 九大技巧教你快速提升移动应用登陆转化率
  5. 2021-11-18可变参数
  6. 分层设计 --java中的几种包
  7. 【计算机系统】指令流水线
  8. windows下springboot集成redis
  9. Storm原理与实现
  10. Qt Widgets——子区域和子窗口
  11. 虚拟机 之 root 用户密码重新设定(忘记了)
  12. 取石子游戏(斐波那契博弈)
  13. python︱微服务Sanic制作一个简易本地restful API
  14. Web页面输出Excel的数字问题解决方法
  15. 宏基ACER Aspire R3600 REVO离子平台
  16. android jni调试打印char阵列
  17. 现代控制理论课程实验三:一阶倒立摆的LQR控制器设计
  18. 【干货分享】Color Fonts是什么?多彩字体详解
  19. SSM员工工资管理系统(Java毕设项目)
  20. 如何让搜索引擎收录我的站点

热门文章

  1. PyQt5桌面应用开发(9):经典布局QMainWindow
  2. git命令详解( 三 )
  3. 对CC系列知识共享许可证的理解及整理(CC BY-NC-SA 4.0的使用方法)
  4. android 音乐播放器评测,七大主流Android音乐播放器横向评测
  5. 【C语言】函数 ---- 函数的嵌套调用和链式访问、函数的声明和定义、变量的声明和定义、函数递归与迭代、递归时的栈溢出问题
  6. Wi-Fi 安全协议 - WPA
  7. Google Maps API V3 之 图层
  8. 怎样用计算机进入手机驱动程序,一加手机驱动怎么样 一加手机驱动手动安装【图文教程】...
  9. 看李俊超老师SEO视频教程 全程笔记
  10. 强大的WINZIP 17 的简单测试和windows备份功能,脚本的利用