爬PHP网站文件,蜘蛛来访爬取链接详情导出TXT文件(php脚本)
蜘蛛来访爬取链接详情导出TXT文件(php脚本)
偶然间看到群友发的,试了下还挺好用。该PHP脚本可以实现判断蜘蛛来访访问的链接等和显示蜘蛛IP等等挺好玩的。
不喜勿喷。
PHP脚本代码如下:
$useragent = addslashes(strtolower($_SERVER['HTTP_USER_AGENT']));
if (strpos($useragent, 'msn')!== false){$bot = 'msn';}
elseif (strpos($useragent,'baiduspider') !== false){$bot = 'Baidu';}
elseif (strpos($useragent,'sogou spider') !== false){$bot = 'Sogou';}
elseif (strpos($useragent,'sogou web') !== false){$bot = 'Sogou web';}
elseif (strpos($agent,'Bytespider') !== false){$bot = 'Bytespider';}
elseif (strpos($useragent,'YisouSpider') !== false){$bot = 'YisouSpider';}
elseif (strpos($useragent,'360Spider') !== false){$bot = '360Spider';}
elseif (strpos($useragent,'bot') !== false){$bot = '其它蜘蛛';}
if(isset($bot)){
$fp = @fopen( $_SERVER['DOCUMENT_ROOT']."/bot.txt",'a');
fwrite($fp,date('Y-m-d H:i:s')."\t".$_SERVER["REMOTE_ADDR"]."\t".$bot."\t".'http://'.$_SERVER['SERVER_NAME'].$_SERVER["REQUEST_URI"]."\r\n");
fclose($fp);
}
?>
博主以苹果CMS V10版本来说明使用教程,复制上面展示的PHP脚本代码放到苹果CMS根目录的 index.php 文件最顶部处即可(其他程序自测)
如图
找到根目录的这个文件打开复制上面的脚本
放完后首先他会自动生成一个 bot.txt 文件。其他就不用管理,当有人或者有蜘蛛来访的时候该脚本会自动输出日志写入到 bot.txt 文件里。如下图演示
本文标题:蜘蛛来访爬取链接详情导出TXT文件(php脚本)
本文链接:https://www.lengxi.net/?id=369
作者授权:除特别说明外,本文由 冷曦 原创编译并授权 冷曦博客 - 源码之家 刊载发布。
版权声明:本文不使用任何协议授权,您可以任何形式自由转载或使用。
爬PHP网站文件,蜘蛛来访爬取链接详情导出TXT文件(php脚本)相关推荐
- 如何爬一个网站的数据-免费爬取网站的任意数据软件
如何爬一个网站的数据?爬取网络数据大家称之为网络爬行 收集页面以创建索引或集合.另一方面,网络抓取下载页面以提取一组特定的数据用于分析目的,例如,产品详细信息.定价信息.SEO 数据或任何其他数据集. ...
- 将 a.txt 文件中的单词与 b.txt 文件中的单词交替合并到 c.txt 文件 中
package again;import java.io.*;/* 1.编写一个程序,将 a.txt 文件中的单词与 b.txt 文件中的单词交替合并到 c.txt 文件 中,a.txt 文件中的单词 ...
- 自定义语义分割数据集(划分训练集与验证集)、并且将一个文件夹下的所有图片的名字存到txt文件
目录 1.划分训练集.验证集与测试集 2.文件名称保存为txt 3.文件移动 4. 将数据集保存为.pkl格式以及读取.pkl格式文件 我们可以借助Pytorch从文件夹中读取数据集,十分方便,但是P ...
- java导出txt文件列对齐
转自这里,测试有效 最近做项目有一个需要用到导出txt文件的地方,内容大概就是一个把list数据类型格式的数据导出到txt文件,但是txt的排版是一个令人头疼的事情,以往这样的一般都是导出excel. ...
- 在 web of science上到导出txt文件
在使用CiteSpace之前要先下载数据源,今天就来讲一讲从web of science上导出txt文件. 1.首先登陆web of science,没有注册的先注册 2.在选择数据库下拉框中选择we ...
- a标签下载文件,js/jq创建a标签导出Excel文件
a标签下载文件,js/jq 创建a标签导出Excel文件 1.设置dom(html) <button type="button" class="layui-btn ...
- 在CNKI上导出TXT文件
在使用CiteSpace之前要先下载数据源,今天就来讲一讲从CNKI上导出txt文件. 1.从学校官网进入中国知网CNKI,单击高级检索 2.输入关键字,可以选择组合输入,单击搜索 3.在每页显示处选 ...
- Python爬虫系列:爬取小说并写入txt文件
导语: 哈喽,哈喽~都说手机自带的浏览器是看小说最好的一个APP,不须要下载任何软件,直接百度就ok了. 但是小编还是想说,如果没有网,度娘还是度娘吗?能把小说下载成一个.txt文件看不是更香吗?这能 ...
- 五分钟写一个小爬虫,爬取小说并写入txt文件
先上代码: #-*- coding:UTF-8 -*- import requests from lxml import html url='http://www.shuge.net/html/111 ...
- 爬虫(9)-python爬虫爬取电子书存储在txt文件中
文章目录 1.分析主页面 2.分析电子书主页面 3.分析正文界面 4.存储 5.全部代码+解析 6结果展示 7.总结 本文以笔趣阁网站为例,爬取网站上的电子书并存储在本地记事本中. 网站地址:http ...
最新文章
- ProgreassBar 60秒走完,
- 初三女生学计算机专业,江西中专初三毕业学计算机专业适宜女生吗
- c# 两个list比较_C#刷遍Leetcode面试题系列连载(1) 入门与工具简介(VS Code amp; VS)...
- [视频教程] 如何在docker环境下的纯净ubuntu系统中安装最新版nginx
- 关于CS1061报错(XX不包含XXX的定义,并且找不到类型为XX的第一个参.....)的一种可能的解决的办法...
- python接口自动化(七)--状态码详解对照表(详解)
- 5.4监听socket
- vue 地图使用navigator_初识ABP vNext(6):vue+ABP实现国际化
- 微信小程序消息推送(java)
- 迪普应用防火墙产品线
- 铜陵学院计算机程序设计大赛,ACM程序设计大赛
- wireshark:包重组
- 网络编程---I/O多路转接之select
- 人体红外传感器(HC_SR051)实现 人体感应灯
- linux系统编程界面实验报告,操作系统实验报告-Linux操作使用编程.doc
- 三子棋 C语言【详解】
- 创建jira sprint_如何在Excel中创建高级sprint燃尽图
- Linux的入门学习
- java内存溢出监控_Java内存溢出和死锁的监控与分析
- Ubuntu-查看ubuntu系统的版本信息
热门文章
- web工程引用其他java工程_并读取spring配置文件_SpringBoot项目实战(8):四种读取properties文件的方式...
- 微信开发errcode:40125
- 电话销售的6个关键成功因素
- python实现分层随机抽样算法_python分层随机抽样
- 曙光超级计算机用的芯片是国产吗,真正中国芯片龙头是中科曙光
- Intellij idea注册激活码(2017年2月15日亲测可用于最新版)
- 用计算机做雕塑的,做电脑雕刻工资怎样
- 支教日记软件测试,烟酒行销售实习日志(74页)-原创力文档
- ps如何保存透明图片
- 511遇见易语言取屏幕分辨率和设置屏幕分辨率