网站css内图片下载脚本
觉得功能太烂BUG太多的,想加以改进的朋友,可以下载下面的压缩包进行修改补充,这次我加了足够的注释,方便大家阅读
解压之后把整个文件夹(saveimg1.4)放在www目录下通过浏览器访问http://localhost/saveimg1.4/ 即可使用 saveimg1.4.rar (5 K) 下载百度首页外链式css( http://su.bdimg.com/static/superpage/css/index_min_0ffaafc0.css)为例
--------------------------已修正--------------------------
2012.11.29
代码简化之判断css文件所在的文件夹目录
############################
之前的代码为:
############################
//$url="http://192.168.190.47/phpwind/images/pw_core.css?20111111";
function getbaseurl($url){
$a=ltrim($url,'http://');
$b=explode('/',$a);
array_pop($b);
$c=implode('/',$b);
$baseurl='http://'.$c.'/';
return $baseurl;
}
############################
去掉之前用的切割组合,使用系统默认函数dirname()
echo dirname("http://192.168.190.47/phpwind/images/down.png");
//输出结果为:“ http://192.168.190.47/phpwind/images”
2012.11.30
1.bug修复 => 修复即使文件下载为空都提示下载成功的错误。
2.简化下载代码,也许底层执行过程是一样的,只是php代码减少了一点。
--------------------------原代码--------------------------
ob_start();
readfile($url);
$obj=ob_get_contents();
ob_end_clean();
$fp2=fopen($filename,"w");
fwrite($fp2,$obj);
fclose($fp2);
echo $url.'<font color="green">下载成功</font><br/>';
--------------------------修改为--------------------------
$b=file_get_contents($url);
$c=file_put_contents($filename,$b);
if($c!=0){
echo $url.'<font color="green">下载成功</font><br/>';
}else{
echo $url.'<font color="red">下载失败</font><br/>';
}
2012.12.03
css中的图片地址BUG修复
今天在采集新浪的某个页面的时候发现其中的css图片的地址采用的是url(/images/xx.jpg)这样的格式
而不是url(./images/xx.jpg)
也不是url(images/xx.jpg)
这样这个图片的地址就是www_sian.cn/images_xx_jpg
而非www_sian.cn/css/images/xx_jp_g(假设css文件放在了 www.sian.cn/css目录下)
这样在获去了css中的图片地址之后则需要做一个正则匹配
下面需要考虑图片地址在url的引用方法
1 images/xxx.jpg
2 ./images/xxx.jpg
3 ../images/xxx.jpg
4 /images/xxx.jpg
$check=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
if($check==1){
echo 'YES';//是第四种情况
}else{
echo 'NO';//不是第四种情况
}
2012.12.08
获取css中图片地址的方法修改
可能最开始想的是直接取出css中的url()整个元素,所以一直向正则匹配那边在想,使用的是$arr=preg_split('/url\(/',$content);
既然没有利用到正则的优势,似乎使用$arr=explode('url(',$content)效率要高一些?
2012.12.08
1.css文件中url图片地址地址修复
坑爹的百度贴吧居然使用了background:url(http://tb2.bdstatic.com/tb/style/chat/img/new.gif)这样的方法
只能再多加一个判断了
1 images/xxx.jpg
2 ./images/xxx.jpg
3 ../images/xxx.jpg
4 /images/xxx.jpg
5 http://
$check=preg_match('/^http/',$z);
if($check==1){
//直接保存图片地址
}else{
$check2=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
if($check2==1){
echo 'YES';//是第四种情况
}else{
echo 'NO';//不是第四种情况
}
}
--------------------------未解决--------------------------
新浪博客、新浪微博的css文件保存之后是乱码,我能想到的就是使用file_get_contents( )和file_put_contents( )来实现文件下载出现了问题。
原文地址: http://bbs.lampbrother.net/read-htm-tid-150076.html
<script type=text/javascript charset=utf-8 src="http://static.bshare.cn/b/buttonLite.js#style=-1&uuid=&pophcol=3&lang=zh"></script> <script type=text/javascript charset=utf-8 src="http://static.bshare.cn/b/bshareC0.js"></script>
阅读(22) | 评论(0) | 转发(0) |
上一篇:关于facebook的hiphop
下一篇:战地日记 第二篇 一月总结及一些感想
- 怎样在网上卖东西?
- 【原创】ganglia被监控机部署...
- 美国RT服务器租用仿牌网站不二...
- 阿波说:删除负面-负面删除...
- 【本港财经】建行(亚洲)发明虚...
- 毕业五年(续)
- 毕业五年
- 职业生涯规划
- 中国软件开发工程师之痛...
- 闲置书处理!
- 大家都是用什么来管理hadoop集...
- 网站被人挂了吗,添加了些程序...
- Nginx如何保证不走宕机的那个...
- 大家谈谈MYSQL客户端和服务器...
- 以下代码运行后为何会输出5?...
网站css内图片下载脚本相关推荐
- 爬虫-python -(3) 网站菜价和图片下载 bs4解析
文章目录 1.bs4爬*网站菜价 2.bs4图片网站 3.总结 bs4是通过网站的标签以及属性找到,对应文本信息或者标签属性. 1.bs4爬*网站菜价 例程给的网站,改版了,需要post,查找返回数据 ...
- 如何做一个炫酷的动画网站-css实现图片上下浮动效果
目前网站制作技术已经非常成熟.所以要实现一个炫酷的动画网站还是非常容易,现在通过js和css就都能实现.直接css就能实现各种效果,下面我们来通过一个小动画看看如何用css来实现让你的网站图片上下浮动 ...
- python百度贴吧图片下载脚本实例
功能介绍: 对百度贴吧内的图片进行下载: python版本: python2.7 用到的库: urllib,requests 核心原理 使用urllib库爬取贴吧页面的图片链接,将其进行下载:requ ...
- 爬虫 图片下载器:从图片分享网站下载图片并进行分类整理
目录 前言 1. 图片下载器概述 2. 环境准备 3. 分析目标网站 4. 使用Python编写图片下载器 4.1 安装依赖库 4.2 获取图片链接 4.3 下载图片 4.4 图片分类整理 5. 总结 ...
- Python学习第一课——爬取模特秀网站的模特图片
第一次写博客,经验不足. 很早以前就听说过爬虫,但是从未自己去实现过,昨天看到一个爬虫的教学视频,不免心里痒痒,于是自己动手编程实现.在这里我选择的是Python语言(不要问我为什么,实际上我也没有学 ...
- 简单图片下载器 - 豆瓣小说图书封面下载 连续多页
写了一个简单的图片下载器,可以连续多页,直到没有[下一页]. 特别注意的是header里一定要添加上Cookie,要不然抓取的是假数据.获取Cookie,可以用浏览器开发者工具来辅助. 而且添加了时间 ...
- 赞!原来还有这些免费图片下载网站(内附部分爬虫代码)
大兄弟你进来一定不是看我废话的吧,嗯,安排上,咱用图和爬虫说话,这些网站真的很不错! emm-顺便和想看详细解析的兄弟说一句,这里有个详细的样例, 爬虫爬取精美图片详介传送门 内容检索 1. hipp ...
- 利用wget 抓取 网站网页 包括css背景图片
利用wget 抓取 网站网页 包括css背景图片 wget是一款非常优秀的http/ftp下载工具,它功能强大,而且几乎所有的unix系统上都有.不过用它来dump比较现代的网站会有一个问题:不支持c ...
- php css定位到图片上,CSS_浅谈css中图片定位之所有图标放在一张图上,如今做网页为了使网站丰富多 - phpStudy...
浅谈css中图片定位之所有图标放在一张图上 如今做网页为了使网站丰富多彩,富于表现力,往往需要应用大量的图片/图标.如何处理这些图片,使其尽量不影响网页载入,解析等速度,是一个不大不小的问题.如果你的 ...
最新文章
- POJ-1321-棋盘问题(深搜)
- fhqtreap的学习笔记
- input()与raw_input()
- 计算机网络之传输层:3、TCP协议
- 指令脚本redis线上环境监控脚本(python脚本)
- 怎么用jquery实现全选_经济薄弱,该怎么实现花园梦?用这些替代物降低养花成本...
- ❤️作为测试行业的过来人,宝贵的经验分享给刚入行的你
- ArcGIS三种方式打断相交线------拓扑法
- 基于Java的网络教学系统
- 小迪渗透代码审计(柒)
- 【23种设计模式】【单例模式】
- python植物大战僵尸辅助_【python面向对象实战练习】植物大战僵尸
- 树莓派系列(一):树莓派介绍
- 2019-4给学员试讲内容分享
- 怎么抵抗DDOS攻击?
- 【爬虫实战】国家企业公示网-crawler爬虫抓取数据
- Java开发必须会的技能!java页面导出数据到excel
- 月桂酸异丙酯(IPL)行业调研报告 - 市场现状分析与发展前景预测
- 51 单片机实战教程(13 外围芯片驱动程序之CS1237芯片驱动)
- 插入mysql数据库时间相差14个小时