本文主要向大家介绍了PHP语言学习之php 防止爬虫设置,通过具体的内容向大家展示,希望对大家学习php语言有所帮助。php 防止爬虫设置

php代码如图所示:

//获取UA信息

$ua = $_SERVER[‘HTTP_USER_AGENT‘];

//将恶意USER_AGENT存入数组

$now_ua

= array(‘FeedDemon ‘,‘BOT/0.1 (BOT for JCE)‘,‘CrawlDaddy

‘,‘Java‘,‘Feedly‘,‘UniversalFeedParser‘,‘ApacheBench‘,‘Swiftbot‘,‘ZmEu‘,‘Indy

Library‘,‘oBot‘,‘jaunty‘,‘YandexBot‘,‘AhrefsBot‘,‘MJ12bot‘,‘WinHttp‘,‘EasouSpider‘,‘HttpClient‘,‘Microsoft

URL Control‘,‘YYSpider‘,‘jaunty‘,‘Python-urllib‘,‘lightDeckReports

Bot‘);

//禁止空USER_AGENT,dedecms等主流采集程序都是空USER_AGENT,部分sql注入工具也是空USER_AGENT

if(!$ua) {

header("Content-type: text/html; charset=utf-8");

die(‘李世龙原创 采集者木有小JJ!‘);

}else{

foreach($now_ua as $value )

//判断是否是数组中存在的UA

if(eregi($value,$ua)) {

header("Content-type: text/html; charset=utf-8");

die(‘请勿采集本站,采集的木有小JJ!‘);

}

}

如果是vps,那非常简单,使用curl -A 模拟抓取即可,比如:模拟宜搜蜘蛛抓取:

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标编程语言PHP频道!

php怎么防止爬虫,PHP语言学习之php 防止爬虫设置相关推荐

  1. r语言remarkdown展示图_R语言学习笔记--R bookdown图表设置中英文双标题

    一. 测试文档,该文档修改自 bookdown 的官方中文模板. 该方案可以实现同时生成pdf和html两种格式的文件,pdf文件中实现双标题,html文件可正常生成单个标题. 二. 结合 CTEX ...

  2. 视频教程-桫哥-GOlang基础-Go语言实战:并发爬虫-Go语言

    桫哥-GOlang基础-Go语言实战:并发爬虫 多年互联网从业经验: 有丰富的的企业网站.手游.APP开发经验: 曾担任上海益盟软件技术股份有限公司项目经理及产品经理: 参与项目有益盟私募工厂.睿妙影 ...

  3. 基于python语言,使用爬虫和深度学习来预测双色球(二、模型训练与测试)

    在上一篇博文中(基于python语言,使用爬虫和深度学习来预测双色球(一.数据的准备)),我们完成了数据的准备,通过爬虫的方式将2003年至今的每一期的中奖数据保存到了txt文件中,那么我们现在就开始 ...

  4. R语言学习笔记(八)--读写文件与网络爬虫

    R语言学习笔记(八) 1 工作路径 2 保存R对象 3 Scan函数 3-1 从控制台读取数据 3-2 从txt文件读取数据 3-3 从url读取数据 4 按行读写文本文件 5 读取文本文件(txt. ...

  5. Python学习教程:Python爬虫抓取技术的门道

    Python学习教程:Python爬虫抓取技术的门道 web是一个开放的平台,这也奠定了web从90年代初诞生直至今日将近30年来蓬勃的发展.然而,正所谓成也萧何败也萧何,开放的特性.搜索引擎以及简单 ...

  6. Java网络爬虫该如何学习

    文章目录 引言 怎么入门网络爬虫 课程特色 学完本课程能收获什么 引言 互联网以及移动技术的飞速发展,使得全球数据量呈现前所未有的爆炸式增长态势.例如,用户在互联网上的搜索数据.交易数据.评论数据.社 ...

  7. python 网页版笔记_系统学习下python网络爬虫 笔记一

    系统学习下python网络爬虫的知识 1.爬虫的定义 Web Spider,把互联网定义为一个蜘蛛网,网络蜘蛛通过网页的链接地址来寻找网页. 具体过程:从网站的某一个网页(通常是首页)开始,读取网页的 ...

  8. R语言学习系列之本地数据获取

    R语言学习系列之本地数据获取 任何数据分析工作之前,都得把数据先读取进来你才能进行后续的分析工作.所以本文简要介绍在R中如何对本地文件进行获取,希望可以给刚刚接触R语言的同学一点启发. 一.控制台的输 ...

  9. python爬虫群_(招募截止)『Python爬虫小分队』学习群第三期招募

    一个月多月没有更新文章了,这次一上来就是广告,还是硬广 .感谢大家记得,还有不少同学在问第三期什么时候开,这就来了- 一.不是程序员而会编程为你的工作带来了哪些优势? 这是知乎上的一个问题.总结一下知 ...

最新文章

  1. Fast Flux技术——本质就是跳板,控制多个机器,同一域名指向极多的IP(TTL修改为0),以逃避追踪...
  2. aspx后台调用前台jquery_Jquery Ajax调用aspx页面方法
  3. mfc messagebox 非模态_進博尋寶記:當進博遇見非遺?愛上中國傳統文化--財經-
  4. 第四节:Task的启动的四种方式以及Task、TaskFactory的线程等待和线程延续的解决方案
  5. 哈希桶 entry_聊一聊面试常问的几大哈希算法问题,这些你都会了嘛??
  6. 敏捷开发免费管理工具——火星人预览之六:我的空间,我的通知
  7. 折叠屏究竟是不是智能手机的未来?| 畅言
  8. 学生优化--文本框限制
  9. 用JavaScript写的贪吃蛇游戏(很简单,很详细)
  10. 抠取头发丝(用PS cc)
  11. [0]SWM181-从零开发华芯微特MCU
  12. 国家职业资格计算机调试维修技师试题,电工国家职业资格三级(高级)理论试题...
  13. vite postcss
  14. 韩国李世龙19岁当爹 与洪瑛琦姐弟恋开花结果
  15. JVM:如何查看并设置jvm参数+jinfo+查看详细的jvm参数java-XX
  16. Google宣布收购摩托罗拉移动
  17. 麦田音乐节,只等你来
  18. [网络安全学习篇50]:Web架构安全分析
  19. elasticsearch做如何进行日志采集
  20. 一款好看的导航网源码 全静态页面带特效

热门文章

  1. 浅谈sql之连接查询
  2. 查看Android 系统发送的广播
  3. cobalt strike
  4. 20140708testC
  5. Postgresql:本地化支持
  6. [转载] python type() 判断数据类型
  7. Ubuntu、CentOS、redHat的区别与联系
  8. 路由算法之LS算法和DV算法全面分析
  9. sanic set up
  10. dataGridView相关问题