1、百度蜘蛛:Baiduspider
网上的资料百度蜘蛛名称有BaiduSpider、baiduspider等,都洗洗睡吧,那是旧黄历了。百度蜘蛛最新名称为Baiduspider。日志中还发现了Baiduspider-image这个百度旗下蜘蛛,查了下资料(其实直接看名字就可以了……),是抓取图片的蜘蛛。
常见百度旗下同类型蜘蛛还有下面这些:Baiduspider-mobile(抓取wap)、Baiduspider-image(抓取图片)、Baiduspider-video(抓取视频)、Baiduspider-news(抓取新闻)。
注:以上百度蜘蛛目前常见的是Baiduspider和Baiduspider-image两种。
2、谷歌蜘蛛:Googlebot
这个争议较少,但也有说是GoogleBot的。谷歌蜘蛛最新名称为“compatible; Googlebot/2.1;”。还发现了Googlebot-Mobile,看名字是抓取wap内容的。
3、360蜘蛛:360Spider,它是一个很“勤奋抓爬”的蜘蛛。
4、SOSO蜘蛛:Sosospider,也可为它颁一个“勤奋抓爬”奖的蜘蛛。
5、雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!
名称中带“Slurp”和空格,名称有空格robots里名称可以使用“Slurp”或者“Yahoo”单词描述,不知道有效无效。
6、有道蜘蛛:YoudaoBot,YodaoBot(两个名字都有,中文拼音少了个U字母读音差别很大嘎,这都会少?)
7、搜狗蜘蛛:Sogou News Spider
搜狗蜘蛛还包括如下这些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,
(参考一些网站的robots文件,搜狗蜘蛛名称可以用Sogou概括,无法验证不知道有没有效)
看看最权威的百度的robots.txt ,http://www.baidu.com/robots.txt 就为Sogou搜狗蜘蛛费了不少字节,占了一大块领地。
“Sogou web spider;Sogou inst spider;Sogou spider2;Sogou blog;Sogou News Spider;Sogou Orion spider”目前6个,名称都带空格。
线上常见"Sogou web spider/4.0" ;“Sogou News Spider/4.0” ;“Sogou inst spider/4.0” 可以为它颁个“占名为王”奖。
8、MSN蜘蛛:msnbot,msnbot-media(只见到msnbot-media在狂爬……)
9、必应蜘蛛:bingbot
线上(compatible; bingbot/2.0;)
10、一搜蜘蛛:YisouSpider
11、Alexa蜘蛛:ia_archiver
12、宜sou蜘蛛:EasouSpider
13、即刻蜘蛛:JikeSpider
14、一淘网蜘蛛:EtaoSpider
“Mozilla/5.0 (compatible; EtaoSpider/1.0; http://省略/EtaoSpider)”
根据上述蜘蛛中选择几个常用的允许抓取,其余的都可以通过robots屏蔽抓取。如果你暂时空间流量还足够使用,等流量紧张了就保留几个常用的屏蔽掉其它蜘蛛以节省流量。至于那些蜘蛛抓取对网站能带来有利用的价值,网站的管理者眼睛是雪亮的。
另外还发现了如 YandexBot、AhrefsBot和ezooms.bot这些蜘蛛,据说这些蜘蛛国外噶,对中文网站用处很小。那不如就节省下资源

各大搜索引擎蜘蛛名称相关推荐

  1. 搜索引擎蜘蛛给网站带来的危害,有效指引爬虫对应的措施(最准确搜索引擎蜘蛛名称)...

    原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://jimmyli.blog.51cto.com/3190309/1183766 搜索 ...

  2. 百度蜘蛛最新UA及各大搜索引擎蜘蛛爬虫UA汇总

    一淘模板(56admin.com)给大家汇总各大搜索引擎蜘蛛爬虫的UA,对我们进行某些程序编写十分有用,例如网页判断客户端来源时,UA是常用的标准之一. 本文收集了各大搜索引擎的蜘蛛爬虫UA,以便需要 ...

  3. 抓取一个连续的网页_搞懂各大搜索引擎蜘蛛的抓取规则,快速获得排名!

    搜索引擎平台的抓取规则: 百度.360.搜狗等搜索引擎抓取规则对比! 蜘蛛抓取规则:深度优先和广度优先 深度优先: 深度优先策略即一条道走到黑,当沿着一个路径走到无路可走时,再返回来走另一条路. 深度 ...

  4. 各大搜索引擎蜘蛛IP地址大全

    百度搜索引擎蜘蛛IP地址大全 220.181.38.177 220.181.19.* 159.226.50.* 202.108.11.* 202.108.22.* 202.108.23.* 202.1 ...

  5. 蜘蛛搜索引擎_各大搜索引擎的蜘蛛特点

    我们在做SEO时,需要对各个搜索引擎的爬行蜘蛛有一个很好的了解认知,才能更好的去做好SEO优化,就如你要去谈业务,各大客户的一些身份信息需要了解一样. 下面每日学点SEO就给大家整理了各大搜索引擎蜘蛛 ...

  6. WordPress搜索引擎蜘蛛统计分析插件:Spider Analyser

    一般我们做个人站长的朋友,就很喜欢自己的站被蜘蛛爬,这样我们就需要去看我们的百度站长工具/360站长工具-.. 这里我想推荐一款插件:"Spider Analyser – WordPress ...

  7. 搜索引擎蜘蛛的基本原理及工作流程

    搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也叫机器人(bot).搜索引擎蜘蛛访问网站页面时类似于普通用户使用浏览器,蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到 ...

  8. 2019年最新出搜索引擎蜘蛛网页爬虫大全

    2019年最新出搜索引擎蜘蛛网页爬虫大全分享,各大seo引擎搜索的蜘蛛会一次又一次访问爬取我们站点的文章内容,也会耗费一定的站点流量: 有时候就必须屏蔽一些蜘蛛浏览我们的站点,文章尾部会讲解决方案: ...

  9. 蜘蛛搜索引擎_「SEO工具」如何利用爱站工具去分析各搜索引擎蜘蛛情况?

    想做好网站的SEO优化我们更多的是要做好SEO数据的监测和分析,市面上有很多分析工具,也有一些有条件的SEO技术公司会自己去开发一些SEO分析软件来进行辅助SEO优化,虽然很多人有用过爱站工具去分析搜 ...

最新文章

  1. java trace优化_使用Arthas trace定位并优化接口响应慢的问题.md
  2. React 的 PureComponent Vs Component
  3. Qt中的QFontDialog
  4. 题目1:学生成绩档案管理系统(实验准备)
  5. Redis源码分析(零)学习路径笔记
  6. Provisioning Services 7.8 入门系列教程之十一 通过版本控制自动更新虚拟磁盘
  7. android+残留软件包名,关于使用pm hide伪卸载系统软件的一些包名
  8. 流行软件包管理器中存在多个安全缺陷
  9. struts国际化java_Struts2 的国际化实现方式示例
  10. 2019.1.15 作业
  11. 管家婆打印报错——进程无法访问
  12. 金融工程 | 远期与期货的运用
  13. ❤️❤️❤️Unity废柴看过来,手把手教你做植物大战僵尸(十四)—— 游戏胜利和失败界面
  14. Linux设置服务器定时重启
  15. 如何在Win10中隐藏一个磁盘盘符
  16. 倍福ADS通讯(一)——ADS通讯简介
  17. 社交电商+新零售=社交新零售,没思路的创业者看过来
  18. 从Nginx到Pandownload,程序员如何避免面向监狱编程
  19. 谷歌学术(google scholar)个人主页的论文信息不准确怎么办?
  20. JQuery点击按钮 数字递增递减

热门文章

  1. 五种永久免费 内网穿透傻瓜式使用
  2. 数独-图片定位分割数字
  3. Kafka SASL/PLAIN 环境构建(Docker版)
  4. 哈理工OJ 1986 大悲咒(简单递推)
  5. 【打卡】许可证密钥格式(简单)
  6. JS:关于邮箱的正则表达式及规则
  7. 算法面试必备-----数据分析常见面试题
  8. html做成小程序,微信小程序——简单静态网页的制作
  9. linux下rsync命令,Linux下rsync命令用法
  10. oracle 没有锁 ora00054,ORA-00054锁等待问题