网站css内图片下载脚本

觉得功能太烂BUG太多的，想加以改进的朋友，可以下载下面的压缩包进行修改补充，这次我加了足够的注释，方便大家阅读
解压之后把整个文件夹（saveimg1.4）放在www目录下通过浏览器访问http://localhost/saveimg1.4/ 即可使用 saveimg1.4.rar (5 K) 下载百度首页外链式css（ http://su.bdimg.com/static/superpage/css/index_min_0ffaafc0.css）为例

--------------------------已修正--------------------------

2012.11.29

代码简化之判断css文件所在的文件夹目录
        ############################
        之前的代码为：
        ############################
        //$url="http://192.168.190.47/phpwind/images/pw_core.css?20111111";
        function getbaseurl($url){
            $a=ltrim($url,'http://');
            $b=explode('/',$a);
            array_pop($b);
            $c=implode('/',$b);
            $baseurl='http://'.$c.'/';
            return $baseurl;
        }
        ############################
    去掉之前用的切割组合，使用系统默认函数dirname()
    echo dirname("http://192.168.190.47/phpwind/images/down.png");
    //输出结果为：“ http://192.168.190.47/phpwind/images”

2012.11.30

1.bug修复 => 修复即使文件下载为空都提示下载成功的错误。
2.简化下载代码，也许底层执行过程是一样的，只是php代码减少了一点。

--------------------------原代码--------------------------
    ob_start();
    readfile($url);
    $obj=ob_get_contents();
    ob_end_clean();
    $fp2=fopen($filename,"w");
    fwrite($fp2,$obj);
    fclose($fp2);
    echo $url.'<font color="green">下载成功</font><br/>';
    --------------------------修改为--------------------------
    $b=file_get_contents($url);
    $c=file_put_contents($filename,$b);
    if($c!=0){
        echo $url.'<font color="green">下载成功</font><br/>';
    }else{
        echo $url.'<font color="red">下载失败</font><br/>';
    }

2012.12.03

css中的图片地址BUG修复
        今天在采集新浪的某个页面的时候发现其中的css图片的地址采用的是url(/images/xx.jpg)这样的格式
        而不是url(./images/xx.jpg)
        也不是url(images/xx.jpg)
        这样这个图片的地址就是www_sian.cn/images_xx_jpg
        而非www_sian.cn/css/images/xx_jp_g（假设css文件放在了 www.sian.cn/css目录下）
        这样在获去了css中的图片地址之后则需要做一个正则匹配

下面需要考虑图片地址在url的引用方法
        1    images/xxx.jpg
        2  ./images/xxx.jpg
        3 ../images/xxx.jpg
        4   /images/xxx.jpg

$check=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
        if($check==1){
            echo 'YES';//是第四种情况
        }else{
            echo 'NO';//不是第四种情况
        }

2012.12.08

获取css中图片地址的方法修改
可能最开始想的是直接取出css中的url()整个元素，所以一直向正则匹配那边在想，使用的是$arr=preg_split('/url\(/',$content);
既然没有利用到正则的优势，似乎使用$arr=explode('url(',$content)效率要高一些？

2012.12.08

1.css文件中url图片地址地址修复
        坑爹的百度贴吧居然使用了background:url(http://tb2.bdstatic.com/tb/style/chat/img/new.gif)这样的方法
        只能再多加一个判断了
        1    images/xxx.jpg
        2  ./images/xxx.jpg
        3 ../images/xxx.jpg
        4   /images/xxx.jpg
        5    http://
        $check=preg_match('/^http/',$z);
        if($check==1){
            //直接保存图片地址
        }else{
            $check2=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
            if($check2==1){
                echo 'YES';//是第四种情况
            }else{
                echo 'NO';//不是第四种情况
            }
        }

--------------------------未解决--------------------------

新浪博客、新浪微博的css文件保存之后是乱码，我能想到的就是使用file_get_contents( )和file_put_contents( )来实现文件下载出现了问题。

原文地址： http://bbs.lampbrother.net/read-htm-tid-150076.html

阅读(22) | 评论(0) | 转发(0) |

上一篇：关于facebook的hiphop

下一篇：战地日记第二篇一月总结及一些感想

网站css内图片下载脚本相关推荐

爬虫-python -(3) 网站菜价和图片下载 bs4解析
文章目录 1.bs4爬*网站菜价 2.bs4图片网站 3.总结 bs4是通过网站的标签以及属性找到,对应文本信息或者标签属性. 1.bs4爬*网站菜价例程给的网站,改版了,需要post,查找返回数据 ...
如何做一个炫酷的动画网站-css实现图片上下浮动效果
目前网站制作技术已经非常成熟.所以要实现一个炫酷的动画网站还是非常容易,现在通过js和css就都能实现.直接css就能实现各种效果,下面我们来通过一个小动画看看如何用css来实现让你的网站图片上下浮动 ...
python百度贴吧图片下载脚本实例
功能介绍: 对百度贴吧内的图片进行下载: python版本: python2.7 用到的库: urllib,requests 核心原理使用urllib库爬取贴吧页面的图片链接,将其进行下载:requ ...
爬虫图片下载器：从图片分享网站下载图片并进行分类整理
目录前言 1. 图片下载器概述 2. 环境准备 3. 分析目标网站 4. 使用Python编写图片下载器 4.1 安装依赖库 4.2 获取图片链接 4.3 下载图片 4.4 图片分类整理 5. 总结 ...
Python学习第一课——爬取模特秀网站的模特图片
第一次写博客,经验不足. 很早以前就听说过爬虫,但是从未自己去实现过,昨天看到一个爬虫的教学视频,不免心里痒痒,于是自己动手编程实现.在这里我选择的是Python语言(不要问我为什么,实际上我也没有学 ...
简单图片下载器 - 豆瓣小说图书封面下载连续多页
写了一个简单的图片下载器,可以连续多页,直到没有[下一页]. 特别注意的是header里一定要添加上Cookie,要不然抓取的是假数据.获取Cookie,可以用浏览器开发者工具来辅助. 而且添加了时间 ...
赞！原来还有这些免费图片下载网站（内附部分爬虫代码）
大兄弟你进来一定不是看我废话的吧,嗯,安排上,咱用图和爬虫说话,这些网站真的很不错! emm-顺便和想看详细解析的兄弟说一句,这里有个详细的样例, 爬虫爬取精美图片详介传送门内容检索 1. hipp ...
利用wget 抓取网站网页包括css背景图片
利用wget 抓取网站网页包括css背景图片 wget是一款非常优秀的http/ftp下载工具,它功能强大,而且几乎所有的unix系统上都有.不过用它来dump比较现代的网站会有一个问题:不支持c ...
php css定位到图片上,CSS_浅谈css中图片定位之所有图标放在一张图上，如今做网页为了使网站丰富多 - phpStudy...
浅谈css中图片定位之所有图标放在一张图上如今做网页为了使网站丰富多彩,富于表现力,往往需要应用大量的图片/图标.如何处理这些图片,使其尽量不影响网页载入,解析等速度,是一个不大不小的问题.如果你的 ...

网站css内图片下载脚本

网站css内图片下载脚本相关推荐

最新文章

热门文章