大家好,今天来给大家分享一下如何抓取某房产网站房源户型图的所有图片,而且自动以房源名称命名一个文件夹,把所有图片放到文件夹中。

大概的思路是:

1、获取网页源代码

2、获取图片地址与房源名称

3、在当前目录,建立一个文件夹,以房源名称命名

4、保存图片并简单对图片进行重命名

以下是全部代码:

#coding:utf8
#python抓取网页图片并保存到本地电脑
import urllib2,re,os,time,sys,urllib
def save_img(url):reload(sys)sys.setdefaultencoding('utf8')html=urllib2.urlopen(url).read()#获取网页源代码name=re.findall('【(.*?)户型图_长沙.*?房型图_小区照片_相册',html)[0]  #获取小区名称,为了下面建立一个文件夹做准备img_list_url=re.findall('data-index="\d+" src="(.*?)" />',html)  #获取所有需要图片URLcur_path=os.path.abspath(os.curdir)  #获取当前目录glal_path=cur_path+'\\'+name.encode('gbk')  #当前目录 name名称连接 生成一个 新的路径 比如 :E:\python\test\某某小区os.mkdir(glal_path)   #创建一个文件夹i=1  #定义一个i=1for img_url in img_list_url:urllib.urlretrieve(img_url,glal_path+'\\'+'%s.jpg'%str(i))  #保存图片,img_url是图片地址  后面参数是路径与重新命名的图片名称i=i+1
if __name__ == '__main__':url="xxx"   #房源详情URL地址save_img(url)

代码只是演示举例,实现功能,具体不同网站匹配规则可能不同。

url地址就不公开了,我用xxx代替了,就不公开了,大家只是学习方法就可以,给大家一下看一下运行效果如下:

大家可以看到运行之后,生成了一个文件夹保利麓谷林语并且保存了8张图片,再发张截图如下:

好了,今天就分享这里,你学会了吗?

李亚涛简介-一个没有才华的python程序员,关注我学习更多python知识

李亚涛:python抓取某房源户型图并自动保存到文件夹相关推荐

  1. python爬虫保存图片到指定文件夹_李亚涛:python抓取某房源户型图并自动保存到文件夹...

    大家好,今天来给大家分享一下如何抓取某房产网站房源户型图的所有图片,而且自动以房源名称命名一个文件夹,把所有图片放到文件夹中. 大概的思路是: 1.获取网页源代码 2.获取图片地址与房源名称 3.在当 ...

  2. python网页编程测试_李亚涛:python编写友情链接检测工具

    原标题:李亚涛:python编写友情链接检测工具 友情链接是网站外链的非常重要的来源,作为一个网站运营推广人员,需要定期对网站的友链进行更新与检查,如果有人下掉你的链接,这样你可以及时的检测并清除掉. ...

  3. python中文件分类_李亚涛:python实现电脑文件一键分类

    原标题:李亚涛:python实现电脑文件一键分类 python还挺好玩的,可以做蛮多事情! 比如桌面非常非常多的文件,想要整理一下,也可以用到python 比如我就自己写了个程序,整理文件就是运行一下 ...

  4. Project 2 :Python爬虫源码实现抓取豆瓣电影爱情电影Top200并保存到文件

    基于python3.6-pycharm编写的,都已经调试过了,欢迎大家提出交流意见. 关于一些基础的数据网页分析(比如为什么是这个url)没有过多赘述,看不懂的自行百度. 源码可以直接拷贝运行. 转载 ...

  5. [Python] 抓取必应每日一图,设置为桌面壁纸

    在Windows 10 64位系统环境下,使用 Python 3.6 进行图片抓取和设置壁纸操作. 其中,图片链接 https://area.sinaapp.com/bingImg/ 为 Bing 每 ...

  6. python抓取贝壳房源信息

    分析了贝壳的房源信息数据,发现地址链接的参数传递是有规律的 https://tj.ke.com/chengjiao/a3l4/ a3 实际表示的 l4 表示的是 然后 将复合条件拼成一个字符串,带过去 ...

  7. 网易教程python_Python抓取网易云专辑图详细教程

    原标题:Python抓取网易云专辑图详细教程 运行环境 网易云音乐的网页跟普通的网页相比主要有两点不同: 网页是 js 动态加载的 使用了iframe框架 点击一下专辑页面翻页按钮看看url ,你会发 ...

  8. python 批量查询网页导出结果_李亚涛:python批量查询网页收录情况并计算收录率...

    想要一个关键词有排名 第一件事就是保证有一个页面布局了这个关键词,而且这个页面已经被收录了. 所以,我们网站在更新一些信息的时候,比如发布资讯,如果没有被收录,那就无法获得排名,也就没办法带来流量. ...

  9. python网页优化_李亚涛:python辅助seo优化让你更轻松

    原标题:李亚涛:python辅助seo优化让你更轻松 一个专业的seo其实要学习非常多的知识点,因为SEO涉及的东西比较多: 学习seo要掌握哪些技能呢? 之前我写过一篇文章有给大家介绍:0基础学SE ...

最新文章

  1. 如何快速融入团队(三)
  2. java中输出时 什么作用_JAVA中输入和输出处理(Java I/O)重点总结
  3. 平台积分体系设计方案
  4. python 多进程 multiprocessing 进程池 pool apply_async()函数与apply()函数的用法
  5. 迅为I.MX6Q开发板配不同分辨率不同尺寸液晶屏幕
  6. IdentityServer4【QuickStart】之使用asp.net core Identity
  7. android AVB2.0(六)Super动态分区介绍
  8. DNS服务器介绍(二)——主从复制和区域转发
  9. 常用的文本编辑器介绍
  10. linux 文件 16进制显示,linux 16进制 产看文件
  11. 易康eCognition9.0安装教程-附软件安装包
  12. 鸿蒙系统王维,以少总多,意余于象——王维《终南山》赏析
  13. linux下解压rar和7z压缩文件
  14. 腾讯优图:AI内容理解新实践
  15. 暧昧散场,穿过你的黑发我的手968
  16. 关于在控制面板上软件卸载失败的问题
  17. FHE、MPC、zk-SNARK有何不同
  18. Windows10与Kali Linux之间通过XFTP来共享文件
  19. Linux常用命令——jwhois命令
  20. 如何将微博全景图下载到手机发布至QQ

热门文章

  1. 有一种游戏(从妄撮谈起)
  2. 第七章 : Git 介绍 (上)[Learn Android Studio 汉化教程]
  3. spring核心容器 spring container 详解
  4. Hust oj 2157 吃豆豆
  5. Django admin修改用户密码
  6. 基于JAVA\JSP的校园二手交易网站的设计与实现参考【数据库设计、毕业设计、源码、开题报告】
  7. 带恒温冷藏功能的便携式自动采样器——可用于毒情监测
  8. 为什么不建议你内推?原来80%的内推码都无效!
  9. 【安卓逆向】护眼软件去广告教程(简单详细)软件名护眼宝
  10. 你知道URL、URI和URN三者之间的区别吗?