小偷程序:把远程网站上的数据(图片,网页及其他文件)抓取到本地,处理后再显示

正则表达式: 用于字符串的模式分割 、匹配、查找及替换操作。

相关函数:
int ereg ( string $pattern , string $string [, array &$regs ] )
若省略参数返回的数组,找到则返回值为 True 否则 返回 False
与之对应  eregi() 不区分大小写。  
string  file_get_contents ( string $filename [, bool $use_include_path = false [, resource $context[, int $offset = 0 [, int $maxlen ]]]] )
读取整个文件,比如:
用此函数可以获取网页信息
他就是小偷程序的基础。
比如:
<?php
$url=file_get_contents(" http://www.ubuntu.org.cn/index_kylin");
echo $url;
?>

但是对于另一个网站:

<?php
$url=file_get_contents(" http://www.alangzhong.com/index.html");
echo $url;

?>
发现很多的背景图片是看不见的。

查看网页源代码我们发现,这是
<img width="116" height="98" 
src="/upload/201503/b123ec26-bb8f-43be-b5ad-cdf45153d053.png"/>

图片的地址使用了相对路径,而我们本地没有这样的文件,当然显示不出来。
用正则表达式选定图片,然后远程地址替换相对路径:
下面代码的超时问题没有解决。
<?php
//ini_set('max_execution_time', '0');   //三者都没用啊,一直超时
//@ini_set('default_socket_timeout', 20000);
//set_time_limit(2);
$url=file_get_contents("http://www.alangzhong.com/index.html");
//echo $url;
$fp = @fopen($url, "r") or die("超时");  //为什么不断超时
$contents = file_get_contents($url);
eregi("<img width=\"116\" height=\"98\" src=\"/upload/201503/b123ec26-bb8f-43be-b5ad-cdf45153d053.png\"/>",$contents,$rg);
//  远程地址替换相对路径
$rg[1]=str_replace("src=\"../upload/","src=\"http://www.alangzhong.com/index.html/upload/",$rg[1]);echo $rg[1];
?>

PHP 简单的小偷程序相关推荐

  1. PHP小偷程序原理和实例

    今天要学习的是一个简单的小偷程序,那什么是小偷程序呢? 什么是小偷程序?顾名思义,小偷就是偷东西的,而程序就是计算机用的.合起来也很好理解:就是使用程序技术,在未经源站同意的情况下,拿取该站公开免费的 ...

  2. PHP万能小偷程序源码

    PHP万能小偷程序源码 源码,发出来大家共享一下,下面是采集车的官方介绍信息: 1.完全免费 采集车是一款完全免费的信息收集工具,我们本着团结共享的精神,尽量压缩建站成本. 2.高通用性 无论您是使用 ...

  3. XMLHTTP小偷程序原理

    小偷程序原理和简单示例 发表:2004-4-13 164720 出处:你的博客网(yourblog.org) 现在网上流行的小偷程序比较多,有新闻类小偷,音乐小偷,下载小偷,那么它们是如何做的呢,下面 ...

  4. vivi采集php,php源码:VIVI万能小偷程序1.5 智能采集不求人(内置2条采集规则)

    好东西介绍: Warning: curl_setopt(): CURLOPT_FOLLOWLOCATION cannot be activated when an open_basedir is se ...

  5. 用javascript实现网页小偷程序

    所谓网页小偷程序,其实就是网页部分内容的抓取器,通过了XMLHTTP组件调用其它网站上的网页,通过过虑网页内容,来得到自己所需信息,例如获取新闻内容,获取网站用户信息等等. 下面将通过一段javasc ...

  6. 小偷程序,专盗别人的网页内容

    前言:小偷程序其实是懒人的妙法.它可以偷文章,实时新闻资讯,歌曲,甚至歌曲数据的职能寻找和入库等!功能可谓强大,但是还有好多朋友到处求小偷程序,问什么?因为网上没有几篇详细介绍小偷程序的文章供大家参考 ...

  7. PHP内容采集器(PHP小偷程序)

    采集器,通常又叫小偷程序,主要是用来抓取别人网页内容的.关于采集器的制作,其实并不难,就是远程打开要采集的网页,然后用正则表达式将需要的内容匹配出来,只要稍微有点正则表达式的基础,都能做出自己的采集器 ...

  8. 最近写的一个QVOD电影小偷程序

    QVOD电影小偷程序( 中企传媒广告联盟出品) QVOD电影小偷程序,PHP小偷程序,免费电影源码  时隔一年,宋飞飞再发小偷程序,本次小偷程序会逐步共享给广大做广告联盟的朋友使 用,大概会写5个左右 ...

  9. 子程序调用与宏定义的异同_如何用数控系统进行简单的宏程序调用?老师傅告诉你,用G65就行...

    什么是简单调用?很多人都不知道吧,如果想要深入操作宏, 就先要学会变量,学会变量之担,再去操作宏,就会变得非常的简单,今天给大家分享如何用G65进行简单的宏程序调用. 用户宏的简单宏调用是指在主程序中 ...

最新文章

  1. python求分段函数值_高中数学知识点整理(2)——函数概念及基本初等函数篇(上)...
  2. df、du、fdisk、lsblk区别
  3. id_Tech5_challenges--siggraph09
  4. java正则表达式验证密码_java密码验证正则表达式校验
  5. windows下远程连接Linux桌面
  6. 第四十二期:Linux转正日常办公电脑到底行不行
  7. java - 菲波拉契数列 兔子个数
  8. 很简单的事情不细心,就可能导致很大的麻烦,然后花费好几倍的人力物力时间和弥补该“小问题”;
  9. 上手测试GaussDB(for Redis) 和开源 Redis,只为推荐质优价廉的Redis
  10. 为什么不断做迁移,那是在还技术债
  11. 中国抗生素骨水泥行业市场供需与战略研究报告
  12. 单麦克纳姆轮受力分析
  13. 【t092】迷之阶梯
  14. CSS布局:让页脚始终保持底部的方法
  15. maven pom文件的一些自己的理解
  16. csdn积分怎么获取?
  17. linux-文件系统格式区别xfs、ext4、ext3、ext2、vfat、swap、EFI system partition
  18. 人人都是产品经理 2.0
  19. MySQL批量创建测试数据脚本
  20. 华为鸿蒙OS正式发布!教你如何升级

热门文章

  1. Sec-WebSocket-Key
  2. 【2023蓝桥杯】2017年第八届C/C++A组真题(解析笔记)
  3. vue-获取当前位置
  4. 在这个世界上,还有什么东西是不会过期的?
  5. [附源码]Python计算机毕业设计SSM基于JAVA的校园电车租赁系统(程序+LW)
  6. win11的小组件怎么关闭???
  7. 海信vidda电视进入工厂模式,开启adb调试,安装app
  8. 金融行业机房监控4大难题?你中招了吗
  9. java解决跨域 -夜幕思年华
  10. 使用Qt绘制一个简约美观的界面 【使用QSS简单美化】(笔记)