觉得功能太烂BUG太多的,想加以改进的朋友,可以下载下面的压缩包进行修改补充,这次我加了足够的注释,方便大家阅读
解压之后把整个文件夹(saveimg1.4)放在www目录下通过浏览器访问http://localhost/saveimg1.4/ 即可使用 saveimg1.4.rar (5 K) 下载百度首页外链式css( http://su.bdimg.com/static/superpage/css/index_min_0ffaafc0.css)为例

--------------------------已修正--------------------------

2012.11.29

代码简化之判断css文件所在的文件夹目录
        ############################
        之前的代码为:
        ############################
        //$url="http://192.168.190.47/phpwind/images/pw_core.css?20111111";
        function getbaseurl($url){
            $a=ltrim($url,'http://');
            $b=explode('/',$a);
            array_pop($b);
            $c=implode('/',$b);
            $baseurl='http://'.$c.'/';
            return $baseurl;
        }
        ############################
    去掉之前用的切割组合,使用系统默认函数dirname()
    echo dirname("http://192.168.190.47/phpwind/images/down.png");
    //输出结果为:“ http://192.168.190.47/phpwind/images”

2012.11.30

1.bug修复 => 修复即使文件下载为空都提示下载成功的错误。
    2.简化下载代码,也许底层执行过程是一样的,只是php代码减少了一点。

--------------------------原代码--------------------------
    ob_start();
    readfile($url);
    $obj=ob_get_contents();
    ob_end_clean();
    $fp2=fopen($filename,"w");
    fwrite($fp2,$obj);
    fclose($fp2);
    echo $url.'<font color="green">下载成功</font><br/>';
    --------------------------修改为--------------------------
    $b=file_get_contents($url);
    $c=file_put_contents($filename,$b);
    if($c!=0){
        echo $url.'<font color="green">下载成功</font><br/>';
    }else{
        echo $url.'<font color="red">下载失败</font><br/>';
    }

2012.12.03

css中的图片地址BUG修复
        今天在采集新浪的某个页面的时候发现其中的css图片的地址采用的是url(/images/xx.jpg)这样的格式
        而不是url(./images/xx.jpg)
        也不是url(images/xx.jpg)
        这样这个图片的地址就是www_sian.cn/images_xx_jpg
        而非www_sian.cn/css/images/xx_jp_g(假设css文件放在了 www.sian.cn/css目录下)
        这样在获去了css中的图片地址之后则需要做一个正则匹配

下面需要考虑图片地址在url的引用方法
        1    images/xxx.jpg
        2  ./images/xxx.jpg
        3 ../images/xxx.jpg
        4   /images/xxx.jpg

$check=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
        if($check==1){
            echo 'YES';//是第四种情况
        }else{
            echo 'NO';//不是第四种情况
        }

2012.12.08

获取css中图片地址的方法修改
        可能最开始想的是直接取出css中的url()整个元素,所以一直向正则匹配那边在想,使用的是$arr=preg_split('/url\(/',$content);
        既然没有利用到正则的优势,似乎使用$arr=explode('url(',$content)效率要高一些?

2012.12.08

1.css文件中url图片地址地址修复
        坑爹的百度贴吧居然使用了background:url(http://tb2.bdstatic.com/tb/style/chat/img/new.gif)这样的方法
        只能再多加一个判断了
        1    images/xxx.jpg
        2  ./images/xxx.jpg
        3 ../images/xxx.jpg
        4   /images/xxx.jpg
        5    http://
        $check=preg_match('/^http/',$z);
        if($check==1){
            //直接保存图片地址
        }else{
            $check2=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
            if($check2==1){
                echo 'YES';//是第四种情况
            }else{
                echo 'NO';//不是第四种情况
            }
        }

--------------------------未解决--------------------------

新浪博客、新浪微博的css文件保存之后是乱码,我能想到的就是使用file_get_contents( )和file_put_contents( )来实现文件下载出现了问题。

原文地址: http://bbs.lampbrother.net/read-htm-tid-150076.html

<script type=text/javascript charset=utf-8 src="http://static.bshare.cn/b/buttonLite.js#style=-1&uuid=&pophcol=3&lang=zh"></script> <script type=text/javascript charset=utf-8 src="http://static.bshare.cn/b/bshareC0.js"></script>

阅读(22) | 评论(0) | 转发(0) |

0

上一篇:关于facebook的hiphop

下一篇:战地日记 第二篇 一月总结及一些感想

相关热门文章
  • 怎样在网上卖东西?
  • 【原创】ganglia被监控机部署...
  • 美国RT服务器租用仿牌网站不二...
  • 阿波说:删除负面-负面删除...
  • 【本港财经】建行(亚洲)发明虚...
  • 毕业五年(续)
  • 毕业五年
  • 职业生涯规划
  • 中国软件开发工程师之痛...
  • 闲置书处理!
  • 大家都是用什么来管理hadoop集...
  • 网站被人挂了吗,添加了些程序...
  • Nginx如何保证不走宕机的那个...
  • 大家谈谈MYSQL客户端和服务器...
  • 以下代码运行后为何会输出5?...
给主人留下些什么吧!~~
评论热议

网站css内图片下载脚本相关推荐

  1. 爬虫-python -(3) 网站菜价和图片下载 bs4解析

    文章目录 1.bs4爬*网站菜价 2.bs4图片网站 3.总结 bs4是通过网站的标签以及属性找到,对应文本信息或者标签属性. 1.bs4爬*网站菜价 例程给的网站,改版了,需要post,查找返回数据 ...

  2. 如何做一个炫酷的动画网站-css实现图片上下浮动效果

    目前网站制作技术已经非常成熟.所以要实现一个炫酷的动画网站还是非常容易,现在通过js和css就都能实现.直接css就能实现各种效果,下面我们来通过一个小动画看看如何用css来实现让你的网站图片上下浮动 ...

  3. python百度贴吧图片下载脚本实例

    功能介绍: 对百度贴吧内的图片进行下载: python版本: python2.7 用到的库: urllib,requests 核心原理 使用urllib库爬取贴吧页面的图片链接,将其进行下载:requ ...

  4. 爬虫 图片下载器:从图片分享网站下载图片并进行分类整理

    目录 前言 1. 图片下载器概述 2. 环境准备 3. 分析目标网站 4. 使用Python编写图片下载器 4.1 安装依赖库 4.2 获取图片链接 4.3 下载图片 4.4 图片分类整理 5. 总结 ...

  5. Python学习第一课——爬取模特秀网站的模特图片

    第一次写博客,经验不足. 很早以前就听说过爬虫,但是从未自己去实现过,昨天看到一个爬虫的教学视频,不免心里痒痒,于是自己动手编程实现.在这里我选择的是Python语言(不要问我为什么,实际上我也没有学 ...

  6. 简单图片下载器 - 豆瓣小说图书封面下载 连续多页

    写了一个简单的图片下载器,可以连续多页,直到没有[下一页]. 特别注意的是header里一定要添加上Cookie,要不然抓取的是假数据.获取Cookie,可以用浏览器开发者工具来辅助. 而且添加了时间 ...

  7. 赞!原来还有这些免费图片下载网站(内附部分爬虫代码)

    大兄弟你进来一定不是看我废话的吧,嗯,安排上,咱用图和爬虫说话,这些网站真的很不错! emm-顺便和想看详细解析的兄弟说一句,这里有个详细的样例, 爬虫爬取精美图片详介传送门 内容检索 1. hipp ...

  8. 利用wget 抓取 网站网页 包括css背景图片

    利用wget 抓取 网站网页 包括css背景图片 wget是一款非常优秀的http/ftp下载工具,它功能强大,而且几乎所有的unix系统上都有.不过用它来dump比较现代的网站会有一个问题:不支持c ...

  9. php css定位到图片上,CSS_浅谈css中图片定位之所有图标放在一张图上,如今做网页为了使网站丰富多 - phpStudy...

    浅谈css中图片定位之所有图标放在一张图上 如今做网页为了使网站丰富多彩,富于表现力,往往需要应用大量的图片/图标.如何处理这些图片,使其尽量不影响网页载入,解析等速度,是一个不大不小的问题.如果你的 ...

最新文章

  1. POJ-1321-棋盘问题(深搜)
  2. fhqtreap的学习笔记
  3. input()与raw_input()
  4. 计算机网络之传输层:3、TCP协议
  5. 指令脚本redis线上环境监控脚本(python脚本)
  6. 怎么用jquery实现全选_经济薄弱,该怎么实现花园梦?用这些替代物降低养花成本...
  7. ❤️作为测试行业的过来人,宝贵的经验分享给刚入行的你
  8. ArcGIS三种方式打断相交线------拓扑法
  9. 基于Java的网络教学系统
  10. 小迪渗透代码审计(柒)
  11. 【23种设计模式】【单例模式】
  12. python植物大战僵尸辅助_【python面向对象实战练习】植物大战僵尸
  13. 树莓派系列(一):树莓派介绍
  14. 2019-4给学员试讲内容分享
  15. 怎么抵抗DDOS攻击?
  16. 【爬虫实战】国家企业公示网-crawler爬虫抓取数据
  17. Java开发必须会的技能!java页面导出数据到excel
  18. 月桂酸异丙酯(IPL)行业调研报告 - 市场现状分析与发展前景预测
  19. 51 单片机实战教程(13 外围芯片驱动程序之CS1237芯片驱动)
  20. 插入mysql数据库时间相差14个小时

热门文章

  1. 让APK只包含指定的ABI
  2. MySQL之存储过程
  3. 大数据0404-java动态代理
  4. 微信浏览器屏蔽下载链接的解决方案
  5. 为什么公司选择裁员,而不是降薪
  6. Linux远程传输scp非默认端口
  7. eclipse开发ABAP
  8. 卸载/关闭/使无效intel dptf (Intel(R) Dynamic Platform and Thermal Framework Generic Participant)
  9. c语言ch2什么意思,ch2-3C语言的语法.ppt
  10. away3D基础6-颜色材质