php 抓取网站,php 获取网页内容的四种方法
1,使用xmlhttp对象,类似asp中的ActiveXObject对象。
代码:
//获取网页内容
$xhr = new COM("MSXML2.XMLHTTP");
$xhr->open("GET","http://localhost/xxx.php?id=2",false);
$xhr->send();
echo $xhr->responseText
2,file_get_contents方法
$url = "http://www.jbxue.com";
$contents = file_get_contents($url);
//如果出现中文乱码使用下面代码
//$getcontent = iconv("gb2312", "utf-8",$contents);
echo $contents;
?>
3,fopen->fread->fclose
$handle = fopen ("http://www.jbxue.com", "rb");
$contents = "";
do {
$data = fread($handle, 1024);
if (strlen($data) == 0) {
break;
}
$contents .= $data;
} while(true);
fclose ($handle);
echo $contents;
?>
4,curl方法
$url = "http://www.jbxue.com";
$ch = curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
//需要用户检测的网页中,增加下面两行
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD);
$contents = curl_exec($ch);
curl_close($ch);
echo $contents;
?>
注意:
1,使用file_get_contents和fopen必须空间开启allow_url_fopen。
方法:编辑php.ini,设置 allow_url_fopen = On,allow_url_fopen关闭时fopen和file_get_contents都不能打开远程文件。
2,curl方法,则需要开启curl。
方法:windows下修改php.ini,将extension=php_curl.dll前面的分号去掉,拷贝 ssleay32.dll和libeay32.dll到C:/WINDOWS/system32下;
Linux下安装curl扩展就可以了。
php 抓取网站,php 获取网页内容的四种方法相关推荐
- php获取另一个网页内容,php获取网页内容的三种方法
本文介绍下,php实现获取网页内容的三种方法,有需要的朋友,参考下吧. 用php代码实现获取网页的原理: 将抓取内容,通过正则表达式过滤,得到想要的内容. 关于正则表达式的内容,程序员之家介绍了很多, ...
- java 中lock,java中lock获取锁的四种方法
在java接口中会存放着许多方法,方便线程使用时的直接调用.对于lock接口大家都不陌生,我们已经初步对概念进行了理解.那么在获取锁的方法上想必还不是很清楚.下面我们就lock获取锁的四种方法分别进行 ...
- 学习笔记---将Asp.Net网站发布到IIS的四种方法及注意事项
将Asp.Net网站发布到IIS的四种方法及注意事项: 不管是那种发布方法, 第一件事情是让IIS能够支持asp.net程序, 默认IIS是不开器asp.net网站程序的支持的.在IIS中的" ...
- Lock锁及获取锁的四种方法
为什么使用LOCK? LOCK锁 LOCK锁的上锁与解锁 为什么使用LOCK? 传统的Synchronized锁有非常多的缺点: 锁的唤醒和阻塞代价较高,线程的阻塞和唤醒,操作系统需要在用户态与内核态 ...
- android 图片资源目录下,Android编程实现获取图片资源的四种方法
本文实例讲述了Android编程实现获取图片资源的四种方法.分享给大家供大家参考,具体如下: 1. 图片放在sdcard中: Bitmap imageBitmap = BitmapFactory.de ...
- php获取网页内容的三种方法
3种利用php获得网页源代码抓取网页内容的方法,我们可以根据实际需要选用. 1.使用file_get_contents获得网页源代码 这个方法最常用,只需要两行代码即可,非常简单方便. 参考代码: & ...
- 去除WordPress网站链接中“category”的四种方法
作为wordpress的重度用户,对于wordpress网站的每一个细节我都很在意. 相信很多站长和我一样! 网站搭建起来,我发现url中一直有一个"category",我表示很不 ...
- PHP 获取网页内容的三种方法
抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容. file_get_contents() 把整个文件读入一个字符串中. <meta charset="utf-8" ...
- php 三种获取网页内容,PHP 获取网页内容的三种方法
抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容. file_get_contents() 把整个文件读入一个字符串中. $url = "http://onestopweb.ite ...
最新文章
- DIV+CSS如何设置字体间距
- 初识OSGI.NET插件框架
- Struts2 为什么被淘汰?自己作死!
- 科大星云诗社动态20210313
- centos7 yum 安装lnmp
- 如何通过 C# 判断某个 IP 是否属于某IP段?
- app中使用用户名/邮箱/手机号登录的思路分析
- 盘点那些有“数学味”的建筑
- 两个list取交集_利用jieba计算两个句子的相似度
- OpenCV图像、矩阵、数组介绍
- 约瑟夫环问题——python
- R语言模型中的加总偏误与内生性:一种数值模拟方法
- c语言用while循环输出九九乘法表,用C语言的while循环,打印九九乘法表
- 电脑微信聊天记录删除后如何找回?三个简单方法
- mydumper的安装与使用
- 【今日头条】今日头条三面面经
- XPE常见问题FAQ
- Linux之文件共享
- pkcs1解密 springboot_使用springboot完成密码的加密解密
- 计算机组成原理实验箱D7,计算机组成原理实验(实验箱).doc