相信大家在分析百度蜘蛛日志的时候经常会发现一个问题,就是百度蜘蛛经常会抓取一些不存在的目录,比如:我网站没有这些目录,但是百度蜘蛛一直在抓取,或者你会发现百度蜘蛛在抓取自己的隐私目录,或者说php文件,这个是为什么哪?今天就为大家进行详细解析,讲解对应的解决办法,本篇文章干货较多,建议仔细阅读。

1,如果蜘蛛只抓取首页,打死不抓取内页,是什么情况!

很简单,

2,如果百度蜘蛛抓取一些隐私文件,例如php、zip、rar什么情况!

对于这种情况,你要去判断当前这个IP是不是假蜘蛛文件,因为现在很多IP会自动更改自己的UA,跟百度蜘蛛一样,你无法从蜘蛛日志中分辨,你可以去识别下IP,通过ip138看看是不是蜘蛛IP,如果不是,果断屏蔽掉,如果太多,按照IP段进行屏蔽。

3,如果百度蜘蛛抓取一些隐私目录,真蜘蛛的情况下,怎么处理。

如果你确认是真的百度蜘蛛,百度可能是在抓取你的页面内部程序,考察你用的程序的版本,等,这些百度都会有分辨策略的,一般来讲,自己编写的程序,百度都会优先给予高评分,是这样的。我们为了防止蜘蛛抓取我们的隐私目录,我们一般都会用robots.txt进行屏蔽,记住:生效时间24小时左右。

4,如果蜘蛛抓取一些不存在的目录,一些不存在的文件,怎么办?

首先依然是判断是否是真蜘蛛,如果是真蜘蛛,百度抓取一些不存在的目录,是因为,你这个

另外还有一种情况,如果你把其他的站点301到你当前的

5,蜘蛛抓取,301、304,、200、403、404、444状态码怎么办?

首先我们要明白,301状态码,就是重定向,如果你的顶级域名,例如daidaiseo.com-》www.daidaiseo.com当百度抓取daidaiseo.com上面的资源时,就会出现

而抓取304状态码是为什么那?如果你在日志上看到了304状态码,则表示,你的资源一直都没有变化,属于静态页面资源,304状态码,对于网站的影响比较小,一般来讲是做了百度cdn,有缓存,就容易出现304状态码,但只要你每天给百度提交资源,时时保持更新,就没事。

403是权限问题,禁止访问,是你

文章来源:代代

php 判断百度蜘蛛抓取,百度蜘蛛抓取不存在目录 对应的解决方法相关推荐

  1. android 百度地图闪退,Android使用百度地图出现闪退及定位时显示蓝屏问题的解决方法...

    使用百度地图出现闪退 一般情况下出现闪退是在AndroidManifest.xml文件中未在application标签中配置 android:name="com.baidu.lbsapi.A ...

  2. php 让百度蜘蛛抓取403,百度蜘蛛抓取不存在目录 对应的解决方法

    相信大家在分析百度蜘蛛日志的时候经常会发现一个问题,就是百度蜘蛛经常会抓取一些不存在的目录,比如:我网站没有这些目录,但是百度蜘蛛一直在抓取,或者你会发现百度蜘蛛在抓取自己的隐私目录,或者说php文件 ...

  3. fiddler抓取不了PC端微信小程序的包解决方法

    fiddler抓取不了微信小程序的包 最近突然遇到微信抓取不到小程序包,之前都是好的,但突然就凉凉了,经过不懈的查找终于在某个大佬的文章找到解决方法.原址在这里:https://mbd.baidu.c ...

  4. 使用kali破解WiFi抓不住包问题和No such BSSID available.问题的解决方法----airodump-ng、aireplay-ng

    本篇是上帖(Kali破解wifi最基础版)的解决方案,上篇所提到的命令不再赘述 今天强制使设备下线抓握手包时出现了这个错误 百度了下都是说信道的问题,那我也试试.顺便说一下其他的小问题 之前扫描网络的 ...

  5. 百度云加速 ajax,使用百度云加速后网站打开速度慢、广告不显示的解决方法

    最近发现自己的博客打开很慢,通过ie浏览器打开速度还可以,使用任何第三方浏览器打开都超级慢,以为是HTML代码元素导致,一番比对后没有发现不是HTML5代码问题,但是在头部发现一串javascript ...

  6. 百度云盘上传显示服务器异常,百度网盘常见问题之网络异常,这里有最全面的解决方法...

    很多人都会选择用百度网盘来存放资料或者下载文件.但是很多用户最近都反映一个问题,就是自己在登录的时候或者在下载文件的时候,百度网盘会提示网络异常.那么,百度网盘网络异常怎么办?为了帮助用户们更愉快地使 ...

  7. 百度网盘 网页版、pc版 都登陆不进去的解决方法

    1.把路由器关掉,整个电源关掉. 2.三分钟后再启动,这时候路由器会给电脑重新分配IP地址,电脑的IP地址已经被刷新. 3.重新登陆百度网盘即可 亲测可行. 参考地址:为什么电脑pc客户端百度云网盘登 ...

  8. Python爬取mn52网站美女图片以及图片防盗链的解决方法

    防盗链原理 http标准协议中有专门的字段记录referer 一来可以追溯上一个入站地址是什么 二来对于资源文件,可以跟踪到包含显示他的网页地址是什么 因此所有防盗链方法都是基于这个Referer字段 ...

  9. Python中使用逻辑与运算符“and”判断两个比较条件是否满足时编辑器提示“Simplify chained comparison ”的解决方法

    Python中使用逻辑与运算符"and"判断两个比较条件是否满足时编辑器提示"Simplify chained comparison ", 如下图所示: 这是提 ...

  10. idea git拉取文件变蓝色,将蓝色变成白色的解决方法

    解决:git提交,IDEA中发现有的文件名变成蓝色,检查自己也没有更改代码,将蓝色变成白色的解决方法 1.在IDEA中下方打开Terminal,输入git status查看文件,回车后会发现显示的正是 ...

最新文章

  1. 布尔(bool)值需注意事项
  2. C++_typedef名字
  3. Windows 服务入门指南
  4. linux 视频相关资源
  5. 关系查询处理 查询优化 论文_每日论文33:关系数据库中的关键词查询结果动态优化...
  6. 20000赫兹的声音试听下载_好听又不贵,DLC球顶双面镀铍动圈:七赫兹i99
  7. oracle 删除空间不足,oracle表空间扩容、创建、删除(解决表空间不足问题)
  8. 《C++ Primer》2.11节练习
  9. Mysql调优你不知道这几点,就太可惜了
  10. cf1月超级翻盘_CF1月超级翻牌活动地址 2020年CF超级翻盘活动全攻略
  11. php里面像素怎么表示,php检索图片像素最接近的色值位置
  12. 移动魔百和M302A-ZN-S905L2_蓝牙语音正常_线刷免费固件包
  13. 微信小程序 使用cookie
  14. 基于java民航售票管理系统源码(java毕业设计)
  15. fwr310刷openwrt_迅捷FWR310无线路由器的刷机
  16. 服务器虚拟化 魔力象限,Magic Quadrant for x86 Server Virtualization (魔力象限x86服务器虚拟化).pdf...
  17. 苹果电脑(mac)的快捷键大全
  18. [SP1839]The Bookcase
  19. UVALive6578-Trending Topic
  20. 国家自然科学基金成果填写经验

热门文章

  1. UE5实现HTC Vive VR功能
  2. 利用python合并csv文件
  3. 市场上提供源码的商城系统有哪些?
  4. 古剑奇谭ol服务器位置,古剑奇谭ol大区选择 去哪个区好各大区分析
  5. 新西兰计算机最好大学排名,2017新西兰大学计算机专业排名TOP10经典院校一览
  6. Kotlin 中的 by lazy
  7. Fedora 30 将默认启用 DNF-best 模式
  8. HDU-不定积分-求一条直线与抛物线所围成的面积
  9. C# 使用ZXing.net生成一维码(带数字与不带数字)、二维码(带logo与不带logo)
  10. 泛泰A870 Recovery KitKat 合集