李亚涛:python抓取某房源户型图并自动保存到文件夹
大家好,今天来给大家分享一下如何抓取某房产网站房源户型图的所有图片,而且自动以房源名称命名一个文件夹,把所有图片放到文件夹中。
大概的思路是:
1、获取网页源代码
2、获取图片地址与房源名称
3、在当前目录,建立一个文件夹,以房源名称命名
4、保存图片并简单对图片进行重命名
以下是全部代码:
#coding:utf8
#python抓取网页图片并保存到本地电脑
import urllib2,re,os,time,sys,urllib
def save_img(url):reload(sys)sys.setdefaultencoding('utf8')html=urllib2.urlopen(url).read()#获取网页源代码name=re.findall('【(.*?)户型图_长沙.*?房型图_小区照片_相册',html)[0] #获取小区名称,为了下面建立一个文件夹做准备img_list_url=re.findall('data-index="\d+" src="(.*?)" />',html) #获取所有需要图片URLcur_path=os.path.abspath(os.curdir) #获取当前目录glal_path=cur_path+'\\'+name.encode('gbk') #当前目录 name名称连接 生成一个 新的路径 比如 :E:\python\test\某某小区os.mkdir(glal_path) #创建一个文件夹i=1 #定义一个i=1for img_url in img_list_url:urllib.urlretrieve(img_url,glal_path+'\\'+'%s.jpg'%str(i)) #保存图片,img_url是图片地址 后面参数是路径与重新命名的图片名称i=i+1
if __name__ == '__main__':url="xxx" #房源详情URL地址save_img(url)
代码只是演示举例,实现功能,具体不同网站匹配规则可能不同。
url地址就不公开了,我用xxx代替了,就不公开了,大家只是学习方法就可以,给大家一下看一下运行效果如下:
大家可以看到运行之后,生成了一个文件夹保利麓谷林语并且保存了8张图片,再发张截图如下:
好了,今天就分享这里,你学会了吗?
李亚涛简介-一个没有才华的python程序员,关注我学习更多python知识
李亚涛:python抓取某房源户型图并自动保存到文件夹相关推荐
- python爬虫保存图片到指定文件夹_李亚涛:python抓取某房源户型图并自动保存到文件夹...
大家好,今天来给大家分享一下如何抓取某房产网站房源户型图的所有图片,而且自动以房源名称命名一个文件夹,把所有图片放到文件夹中. 大概的思路是: 1.获取网页源代码 2.获取图片地址与房源名称 3.在当 ...
- python网页编程测试_李亚涛:python编写友情链接检测工具
原标题:李亚涛:python编写友情链接检测工具 友情链接是网站外链的非常重要的来源,作为一个网站运营推广人员,需要定期对网站的友链进行更新与检查,如果有人下掉你的链接,这样你可以及时的检测并清除掉. ...
- python中文件分类_李亚涛:python实现电脑文件一键分类
原标题:李亚涛:python实现电脑文件一键分类 python还挺好玩的,可以做蛮多事情! 比如桌面非常非常多的文件,想要整理一下,也可以用到python 比如我就自己写了个程序,整理文件就是运行一下 ...
- Project 2 :Python爬虫源码实现抓取豆瓣电影爱情电影Top200并保存到文件
基于python3.6-pycharm编写的,都已经调试过了,欢迎大家提出交流意见. 关于一些基础的数据网页分析(比如为什么是这个url)没有过多赘述,看不懂的自行百度. 源码可以直接拷贝运行. 转载 ...
- [Python] 抓取必应每日一图,设置为桌面壁纸
在Windows 10 64位系统环境下,使用 Python 3.6 进行图片抓取和设置壁纸操作. 其中,图片链接 https://area.sinaapp.com/bingImg/ 为 Bing 每 ...
- python抓取贝壳房源信息
分析了贝壳的房源信息数据,发现地址链接的参数传递是有规律的 https://tj.ke.com/chengjiao/a3l4/ a3 实际表示的 l4 表示的是 然后 将复合条件拼成一个字符串,带过去 ...
- 网易教程python_Python抓取网易云专辑图详细教程
原标题:Python抓取网易云专辑图详细教程 运行环境 网易云音乐的网页跟普通的网页相比主要有两点不同: 网页是 js 动态加载的 使用了iframe框架 点击一下专辑页面翻页按钮看看url ,你会发 ...
- python 批量查询网页导出结果_李亚涛:python批量查询网页收录情况并计算收录率...
想要一个关键词有排名 第一件事就是保证有一个页面布局了这个关键词,而且这个页面已经被收录了. 所以,我们网站在更新一些信息的时候,比如发布资讯,如果没有被收录,那就无法获得排名,也就没办法带来流量. ...
- python网页优化_李亚涛:python辅助seo优化让你更轻松
原标题:李亚涛:python辅助seo优化让你更轻松 一个专业的seo其实要学习非常多的知识点,因为SEO涉及的东西比较多: 学习seo要掌握哪些技能呢? 之前我写过一篇文章有给大家介绍:0基础学SE ...
最新文章
- 如何快速融入团队(三)
- java中输出时 什么作用_JAVA中输入和输出处理(Java I/O)重点总结
- 平台积分体系设计方案
- python 多进程 multiprocessing 进程池 pool apply_async()函数与apply()函数的用法
- 迅为I.MX6Q开发板配不同分辨率不同尺寸液晶屏幕
- IdentityServer4【QuickStart】之使用asp.net core Identity
- android AVB2.0(六)Super动态分区介绍
- DNS服务器介绍(二)——主从复制和区域转发
- 常用的文本编辑器介绍
- linux 文件 16进制显示,linux 16进制 产看文件
- 易康eCognition9.0安装教程-附软件安装包
- 鸿蒙系统王维,以少总多,意余于象——王维《终南山》赏析
- linux下解压rar和7z压缩文件
- 腾讯优图:AI内容理解新实践
- 暧昧散场,穿过你的黑发我的手968
- 关于在控制面板上软件卸载失败的问题
- FHE、MPC、zk-SNARK有何不同
- Windows10与Kali Linux之间通过XFTP来共享文件
- Linux常用命令——jwhois命令
- 如何将微博全景图下载到手机发布至QQ
热门文章
- 有一种游戏(从妄撮谈起)
- 第七章 : Git 介绍 (上)[Learn Android Studio 汉化教程]
- spring核心容器 spring container 详解
- Hust oj 2157 吃豆豆
- Django admin修改用户密码
- 基于JAVA\JSP的校园二手交易网站的设计与实现参考【数据库设计、毕业设计、源码、开题报告】
- 带恒温冷藏功能的便携式自动采样器——可用于毒情监测
- 为什么不建议你内推?原来80%的内推码都无效!
- 【安卓逆向】护眼软件去广告教程(简单详细)软件名护眼宝
- 你知道URL、URI和URN三者之间的区别吗?