一个用PHP获取远程网址header头信息的方法,这在采集时很有用,他可以让你判断出来,远程文件或网页是否正常,是否是404页

有二种方法,

1.用php的函数get_headers

get_headers --  Fetches all the headers sent by the server in response to a HTTP request

Description

array get_headers ( string url [, int format] )

get_headers() returns an array with the headers sent by the server in response to a HTTP request. Returns FALSE on failure and an error of level E_WARNING will be issued.

If the optional format parameter is set to 1, get_headers() parses the response and sets the array's keys.

例子 1. get_headers() example

$url = 'http://www.example.com';

print_r(get_headers($url));

print_r(get_headers($url, 1));

?>

上例的输出类似于:

Array

(

[0] => HTTP/1.1 200 OK

[1] => Date: Sat, 29 May 2004 12:28:13 GMT

[2] => Server: Apache/1.3.27 (Unix)  (Red-Hat/Linux)

[3] => Last-Modified: Wed, 08 Jan 2003 23:11:55 GMT

[4] => ETag: "3f80f-1b6-3e1cb03b"

[5] => Accept-Ranges: bytes

[6] => Content-Length: 438

[7] => Connection: close

[8] => Content-Type: text/HTML

)

Array

(

[0] => HTTP/1.1 200 OK

[Date] => Sat, 29 May 2004 12:28:14 GMT

[Server] => Apache/1.3.27 (Unix)  (Red-Hat/Linux)

[Last-Modified] => Wed, 08 Jan 2003 23:11:55 GMT

[ETag] => "3f80f-1b6-3e1cb03b"

[Accept-Ranges] => bytes

[Content-Length] => 438

[Connection] => close

[Content-Type] => text/html

)

get_headers 是用来取得远程服务器的响应头信息的.用返回的第一个数组再加上正则就可以判断远程地址是否为200正常网页

2,用curl CURLOPT_NOBODY参数只抓取header头信息

curl函数真是个好东西,curl参数里有一项可以配置只抓取远程网页的header头信息

如下代码,加红的地方是关健,他指定了curl抓的内容中包含header头,并且不要body内容.

function get_header($url){

$ch  = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_HEADER, true);

curl_setopt($ch, CURLOPT_NOBODY,true);

curl_setopt($ch, CURLOPT_RETURNTRANSFER,true);

curl_setopt($ch, CURLOPT_FOLLOWLOCATION,true);

curl_setopt($ch, CURLOPT_AUTOREFERER,true);

curl_setopt($ch, CURLOPT_TIMEOUT,30);

curl_setopt($ch, CURLOPT_HTTPHEADER, array(

'Accept: */*',

'User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)',

'Connection: Keep-Alive'));

$header = curl_exec($ch);

return $header;

}

php 获取header头信息并显示网址,php 获取远程网址header头信息的方法相关推荐

  1. ESP32存储配网信息+LED显示配网状态+按键清除配网信息(附源码)

    文章目录 1.非易失性存储库(NVS)(知识点内容照抄 荻夜文章) 2.增加LED表示状态和按键重新配网 2.1LED表示联网的状态 2.2 按键清除配网信息,并重启系统,再次配网 3.将存储.LED ...

  2. vue 动态获取的图片路径不显示_Vue 动态图片加载路径问题和解决方法

    最近在做一个树形结构的组件,使用了Vue和element UI中el-tree组件.因为树中每个节点都需要显示一个图标图片,并且需要根据后台传入的数据类型动态地显示,所以图片的路径需要动态地加载.下面 ...

  3. 百旺红字发票信息表显示服务器返回为空,红字发票信息表状态详细说明

    红字发票信息表的状态共16种,分别是: 1. [未发送]:填写且保存,但未点击"发送"或"检测"按钮之前的状态. 2. [待查证]:销方税务机关开具<红字 ...

  4. SAP系统和微信集成的系列教程之六:如何通过OAuth2获取微信用户信息并显示在SAP UI5应用中

    这是Jerry 2020年的第87篇文章,也是汪子熙公众号总共第269篇原创文章. 本系列的英文版Jerry写作于2017年,这个教程总共包含十篇文章,发表在SAP社区上. 系列目录 (1) 微信开发 ...

  5. js ajax获得对象怎么放到td上,jquery通过AJAX从后台获取信息并显示在表格上,并支持行选中...

    不想用Easyui的样式,但是想要他的表格功能,本来一开始是要到网上找相关插件的,但是没找到就开始自己写,没想到这么简单. 后台代码:(这个不重要) public ActionResult GetDi ...

  6. 爬取斗鱼LOL主播人气数据,并显示排行榜 [网络爬虫] [应用案例][请求头][模块]

    您的"关注"和"点赞",是信任,是认可,是支持,是动力- 如意见相佐,可留言. 本人必将竭尽全力试图做到准确和全面,终其一生进行修改补充更新. 文章目录 1 爬 ...

  7. php curl post 下载文件,Curl提交POST请求到一个网址 如何获取返回的文件名

    Curl提交POST请求到一个网址 网址会返回一个文件 如果输出会输出这个文件的内容 如何获取返回的文件名 或者如何把这个文件保存呢 function liansuo_post($url,$data) ...

  8. <渗透测试学习指南> 信息收集(三)获取目标应用版本等详细信息

    转载请注明作者和出处: 本章将讲述如何获取目标系统信息.端口信息等详细信息 上一章我们讲到了获取目标真实IP及子域名信息的几种典型方法,但是单靠真实IP和子域名还无法让我们顺利的完成一项渗透测试任务, ...

  9. 用WMI获取远程机器操作系统的详细信息

    使用WMI获取远程机器操作系统的详细信息 大杂烩-.NET 代码主题部分的OperatingSystem类,是使用工具(Management (WMI) Extensions for Visual S ...

最新文章

  1. 第十六届智能车竞赛比赛进行中 - 参赛队员提出的问题
  2. 用py2exe打包后的程序一闪而过
  3. php5.4 mysql connect_php5.4 Call to undefined function mysql_connect()
  4. 多元线性回归分析matlab实验报告,利用MATLAB进行多元线性回归.ppt
  5. C语言 实现登录注册功能
  6. 乘基取整法是什么_数字逻辑电路-学习指南
  7. Oracle 收购Sun之后的演义:IBM 和SAP何去何从
  8. 软件测试总结--02缺陷报告
  9. Hibernate反射DAO模式
  10. Oracle问题小记五:服务启动-索引-子查询-分页存储过程
  11. python实现求解字符串集的最长公共前缀
  12. 学创客机器人编程材料费贵吗_创客机器人课程容易学习吗
  13. c语言课程设计超市收银系统,C语言超市收银系统.pdf
  14. 关于sip协议-3PCC-SIPP工具相关及报错
  15. 走进C++程序世界-------类的定义和使用(数据成员和方法成员,析构函数,构造函数,内联实现)
  16. 年前辞职,年后找工作
  17. 微信扫码小绿盒支持支付宝+微信收款教程
  18. 关于Allan方差分析陀螺仪误差的几个摘要
  19. 第112章 Caché 函数大全 $ZPOSITION 函数
  20. 【学习打卡04】可解释机器学习笔记之Grad-CAM

热门文章

  1. CSS | 如何达到监听页面滚动的效果?
  2. 学习编程语言的第一步,认识什么是计算机!!!
  3. 任务调度:全网最全 xxl-job任务触发流程
  4. 历史总是在重演,AI寒冬或再来
  5. java调用rapidminer_基于RapidMiner开发问题和解决
  6. 基于Springboot中小餐厅点餐管理系统设计
  7. 【Canvas】JavaScript用Canvas制作美丽的对称图案
  8. OBS studio黑屏解决办法
  9. 什么是序列化与反序列化
  10. 在电脑上运行安卓app