php怎么防止爬虫,PHP语言学习之php 防止爬虫设置
本文主要向大家介绍了PHP语言学习之php 防止爬虫设置,通过具体的内容向大家展示,希望对大家学习php语言有所帮助。php 防止爬虫设置
php代码如图所示:
//获取UA信息
$ua = $_SERVER[‘HTTP_USER_AGENT‘];
//将恶意USER_AGENT存入数组
$now_ua
= array(‘FeedDemon ‘,‘BOT/0.1 (BOT for JCE)‘,‘CrawlDaddy
‘,‘Java‘,‘Feedly‘,‘UniversalFeedParser‘,‘ApacheBench‘,‘Swiftbot‘,‘ZmEu‘,‘Indy
Library‘,‘oBot‘,‘jaunty‘,‘YandexBot‘,‘AhrefsBot‘,‘MJ12bot‘,‘WinHttp‘,‘EasouSpider‘,‘HttpClient‘,‘Microsoft
URL Control‘,‘YYSpider‘,‘jaunty‘,‘Python-urllib‘,‘lightDeckReports
Bot‘);
//禁止空USER_AGENT,dedecms等主流采集程序都是空USER_AGENT,部分sql注入工具也是空USER_AGENT
if(!$ua) {
header("Content-type: text/html; charset=utf-8");
die(‘李世龙原创 采集者木有小JJ!‘);
}else{
foreach($now_ua as $value )
//判断是否是数组中存在的UA
if(eregi($value,$ua)) {
header("Content-type: text/html; charset=utf-8");
die(‘请勿采集本站,采集的木有小JJ!‘);
}
}
如果是vps,那非常简单,使用curl -A 模拟抓取即可,比如:模拟宜搜蜘蛛抓取:
本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标编程语言PHP频道!
php怎么防止爬虫,PHP语言学习之php 防止爬虫设置相关推荐
- r语言remarkdown展示图_R语言学习笔记--R bookdown图表设置中英文双标题
一. 测试文档,该文档修改自 bookdown 的官方中文模板. 该方案可以实现同时生成pdf和html两种格式的文件,pdf文件中实现双标题,html文件可正常生成单个标题. 二. 结合 CTEX ...
- 视频教程-桫哥-GOlang基础-Go语言实战:并发爬虫-Go语言
桫哥-GOlang基础-Go语言实战:并发爬虫 多年互联网从业经验: 有丰富的的企业网站.手游.APP开发经验: 曾担任上海益盟软件技术股份有限公司项目经理及产品经理: 参与项目有益盟私募工厂.睿妙影 ...
- 基于python语言,使用爬虫和深度学习来预测双色球(二、模型训练与测试)
在上一篇博文中(基于python语言,使用爬虫和深度学习来预测双色球(一.数据的准备)),我们完成了数据的准备,通过爬虫的方式将2003年至今的每一期的中奖数据保存到了txt文件中,那么我们现在就开始 ...
- R语言学习笔记(八)--读写文件与网络爬虫
R语言学习笔记(八) 1 工作路径 2 保存R对象 3 Scan函数 3-1 从控制台读取数据 3-2 从txt文件读取数据 3-3 从url读取数据 4 按行读写文本文件 5 读取文本文件(txt. ...
- Python学习教程:Python爬虫抓取技术的门道
Python学习教程:Python爬虫抓取技术的门道 web是一个开放的平台,这也奠定了web从90年代初诞生直至今日将近30年来蓬勃的发展.然而,正所谓成也萧何败也萧何,开放的特性.搜索引擎以及简单 ...
- Java网络爬虫该如何学习
文章目录 引言 怎么入门网络爬虫 课程特色 学完本课程能收获什么 引言 互联网以及移动技术的飞速发展,使得全球数据量呈现前所未有的爆炸式增长态势.例如,用户在互联网上的搜索数据.交易数据.评论数据.社 ...
- python 网页版笔记_系统学习下python网络爬虫 笔记一
系统学习下python网络爬虫的知识 1.爬虫的定义 Web Spider,把互联网定义为一个蜘蛛网,网络蜘蛛通过网页的链接地址来寻找网页. 具体过程:从网站的某一个网页(通常是首页)开始,读取网页的 ...
- R语言学习系列之本地数据获取
R语言学习系列之本地数据获取 任何数据分析工作之前,都得把数据先读取进来你才能进行后续的分析工作.所以本文简要介绍在R中如何对本地文件进行获取,希望可以给刚刚接触R语言的同学一点启发. 一.控制台的输 ...
- python爬虫群_(招募截止)『Python爬虫小分队』学习群第三期招募
一个月多月没有更新文章了,这次一上来就是广告,还是硬广 .感谢大家记得,还有不少同学在问第三期什么时候开,这就来了- 一.不是程序员而会编程为你的工作带来了哪些优势? 这是知乎上的一个问题.总结一下知 ...
最新文章
- Fast Flux技术——本质就是跳板,控制多个机器,同一域名指向极多的IP(TTL修改为0),以逃避追踪...
- aspx后台调用前台jquery_Jquery Ajax调用aspx页面方法
- mfc messagebox 非模态_進博尋寶記:當進博遇見非遺?愛上中國傳統文化--財經-
- 第四节:Task的启动的四种方式以及Task、TaskFactory的线程等待和线程延续的解决方案
- 哈希桶 entry_聊一聊面试常问的几大哈希算法问题,这些你都会了嘛??
- 敏捷开发免费管理工具——火星人预览之六:我的空间,我的通知
- 折叠屏究竟是不是智能手机的未来?| 畅言
- 学生优化--文本框限制
- 用JavaScript写的贪吃蛇游戏(很简单,很详细)
- 抠取头发丝(用PS cc)
- [0]SWM181-从零开发华芯微特MCU
- 国家职业资格计算机调试维修技师试题,电工国家职业资格三级(高级)理论试题...
- vite postcss
- 韩国李世龙19岁当爹 与洪瑛琦姐弟恋开花结果
- JVM:如何查看并设置jvm参数+jinfo+查看详细的jvm参数java-XX
- Google宣布收购摩托罗拉移动
- 麦田音乐节,只等你来
- [网络安全学习篇50]:Web架构安全分析
- elasticsearch做如何进行日志采集
- 一款好看的导航网源码 全静态页面带特效