蜘蛛来访爬取链接详情导出TXT文件(php脚本)

偶然间看到群友发的,试了下还挺好用。该PHP脚本可以实现判断蜘蛛来访访问的链接等和显示蜘蛛IP等等挺好玩的。

不喜勿喷。

PHP脚本代码如下:

$useragent = addslashes(strtolower($_SERVER['HTTP_USER_AGENT']));

if (strpos($useragent, 'msn')!== false){$bot = 'msn';}

elseif (strpos($useragent,'baiduspider') !== false){$bot = 'Baidu';}

elseif (strpos($useragent,'sogou spider') !== false){$bot = 'Sogou';}

elseif (strpos($useragent,'sogou web') !== false){$bot = 'Sogou web';}

elseif (strpos($agent,'Bytespider') !== false){$bot = 'Bytespider';}

elseif (strpos($useragent,'YisouSpider') !== false){$bot = 'YisouSpider';}

elseif (strpos($useragent,'360Spider') !== false){$bot = '360Spider';}

elseif (strpos($useragent,'bot') !== false){$bot = '其它蜘蛛';}

if(isset($bot)){

$fp = @fopen( $_SERVER['DOCUMENT_ROOT']."/bot.txt",'a');

fwrite($fp,date('Y-m-d H:i:s')."\t".$_SERVER["REMOTE_ADDR"]."\t".$bot."\t".'http://'.$_SERVER['SERVER_NAME'].$_SERVER["REQUEST_URI"]."\r\n");

fclose($fp);

}

?>

博主以苹果CMS V10版本来说明使用教程,复制上面展示的PHP脚本代码放到苹果CMS根目录的 index.php 文件最顶部处即可(其他程序自测)

如图

找到根目录的这个文件打开复制上面的脚本

放完后首先他会自动生成一个 bot.txt 文件。其他就不用管理,当有人或者有蜘蛛来访的时候该脚本会自动输出日志写入到 bot.txt 文件里。如下图演示

本文标题:蜘蛛来访爬取链接详情导出TXT文件(php脚本)

本文链接:https://www.lengxi.net/?id=369

作者授权:除特别说明外,本文由 冷曦 原创编译并授权 冷曦博客 - 源码之家 刊载发布。

版权声明:本文不使用任何协议授权,您可以任何形式自由转载或使用。

爬PHP网站文件,蜘蛛来访爬取链接详情导出TXT文件(php脚本)相关推荐

  1. 如何爬一个网站的数据-免费爬取网站的任意数据软件

    如何爬一个网站的数据?爬取网络数据大家称之为网络爬行 收集页面以创建索引或集合.另一方面,网络抓取下载页面以提取一组特定的数据用于分析目的,例如,产品详细信息.定价信息.SEO 数据或任何其他数据集. ...

  2. 将 a.txt 文件中的单词与 b.txt 文件中的单词交替合并到 c.txt 文件 中

    package again;import java.io.*;/* 1.编写一个程序,将 a.txt 文件中的单词与 b.txt 文件中的单词交替合并到 c.txt 文件 中,a.txt 文件中的单词 ...

  3. 自定义语义分割数据集(划分训练集与验证集)、并且将一个文件夹下的所有图片的名字存到txt文件

    目录 1.划分训练集.验证集与测试集 2.文件名称保存为txt 3.文件移动 4. 将数据集保存为.pkl格式以及读取.pkl格式文件 我们可以借助Pytorch从文件夹中读取数据集,十分方便,但是P ...

  4. java导出txt文件列对齐

    转自这里,测试有效 最近做项目有一个需要用到导出txt文件的地方,内容大概就是一个把list数据类型格式的数据导出到txt文件,但是txt的排版是一个令人头疼的事情,以往这样的一般都是导出excel. ...

  5. 在 web of science上到导出txt文件

    在使用CiteSpace之前要先下载数据源,今天就来讲一讲从web of science上导出txt文件. 1.首先登陆web of science,没有注册的先注册 2.在选择数据库下拉框中选择we ...

  6. a标签下载文件,js/jq创建a标签导出Excel文件

    a标签下载文件,js/jq 创建a标签导出Excel文件 1.设置dom(html) <button type="button" class="layui-btn ...

  7. 在CNKI上导出TXT文件

    在使用CiteSpace之前要先下载数据源,今天就来讲一讲从CNKI上导出txt文件. 1.从学校官网进入中国知网CNKI,单击高级检索 2.输入关键字,可以选择组合输入,单击搜索 3.在每页显示处选 ...

  8. Python爬虫系列:爬取小说并写入txt文件

    导语: 哈喽,哈喽~都说手机自带的浏览器是看小说最好的一个APP,不须要下载任何软件,直接百度就ok了. 但是小编还是想说,如果没有网,度娘还是度娘吗?能把小说下载成一个.txt文件看不是更香吗?这能 ...

  9. 五分钟写一个小爬虫,爬取小说并写入txt文件

    先上代码: #-*- coding:UTF-8 -*- import requests from lxml import html url='http://www.shuge.net/html/111 ...

  10. 爬虫(9)-python爬虫爬取电子书存储在txt文件中

    文章目录 1.分析主页面 2.分析电子书主页面 3.分析正文界面 4.存储 5.全部代码+解析 6结果展示 7.总结 本文以笔趣阁网站为例,爬取网站上的电子书并存储在本地记事本中. 网站地址:http ...

最新文章

  1. ProgreassBar 60秒走完,
  2. 初三女生学计算机专业,江西中专初三毕业学计算机专业适宜女生吗
  3. c# 两个list比较_C#刷遍Leetcode面试题系列连载(1) 入门与工具简介(VS Code amp; VS)...
  4. [视频教程] 如何在docker环境下的纯净ubuntu系统中安装最新版nginx
  5. 关于CS1061报错(XX不包含XXX的定义,并且找不到类型为XX的第一个参.....)的一种可能的解决的办法...
  6. python接口自动化(七)--状态码详解对照表(详解)
  7. 5.4监听socket
  8. vue 地图使用navigator_初识ABP vNext(6):vue+ABP实现国际化
  9. 微信小程序消息推送(java)
  10. 迪普应用防火墙产品线
  11. 铜陵学院计算机程序设计大赛,ACM程序设计大赛
  12. wireshark:包重组
  13. 网络编程---I/O多路转接之select
  14. 人体红外传感器(HC_SR051)实现 人体感应灯
  15. linux系统编程界面实验报告,操作系统实验报告-Linux操作使用编程.doc
  16. 三子棋 C语言【详解】
  17. 创建jira sprint_如何在Excel中创建高级sprint燃尽图
  18. Linux的入门学习
  19. java内存溢出监控_Java内存溢出和死锁的监控与分析
  20. Ubuntu-查看ubuntu系统的版本信息

热门文章

  1. web工程引用其他java工程_并读取spring配置文件_SpringBoot项目实战(8):四种读取properties文件的方式...
  2. 微信开发errcode:40125
  3. 电话销售的6个关键成功因素
  4. python实现分层随机抽样算法_python分层随机抽样
  5. 曙光超级计算机用的芯片是国产吗,真正中国芯片龙头是中科曙光
  6. Intellij idea注册激活码(2017年2月15日亲测可用于最新版)
  7. 用计算机做雕塑的,做电脑雕刻工资怎样
  8. 支教日记软件测试,烟酒行销售实习日志(74页)-原创力文档
  9. ps如何保存透明图片
  10. 511遇见易语言取屏幕分辨率和设置屏幕分辨率