2019独角兽企业重金招聘Python工程师标准>>>

robots .txt文件Disallow和Allow设置顺序的不同会产生不一样的效果。

拿个robots .txt语法的例子 :

(1)搜索引擎可以访问/www/seo的文件夹或者URL
User-agent: *
Allow : /www/seo
Disallow : /www/

(2)顺序改变后
User-agent: *
Disallow : /www/
Allow : /www/seo
这样遵守robots规则的搜索引擎就访问不到/www/seo这个路径了。

robots .txt几个语法 命令 解释 :

1> User-agent: *【定义搜索引擎。一般情况下,网站里面都是:User-agent: *,这里*的意思是所有,表示定义所有的搜索引擎。比如,我想定义百度,那么就是User-agent: Baiduspider;定义google,User-agent: Googlebot】

2> Disallow 【禁止爬取】

3> Allow 【允许】

4> $ 结束符【Disallow: .aspx$ 这句话就是屏蔽所有的以.aspx结尾的文件,不管它前面是什么样子】

5> * 【0或多个任意字符。Disallow: *?* 这个是屏蔽所有带“?”的文件,可以这样屏蔽所有的动态路径】

总结来说就是robots.txt 这个文件里语法的顺序是从上到下匹配 ,先允许后禁止。另外注意:User-agent,Allow,Disallow的“:”后面有一个字符的空格。

总结+复习..

转载于:https://my.oschina.net/yonghan/blog/468312

robots.txt文件的Disallow和Allow行的区别相关推荐

  1. 什么是robots.txt文件?

    一.什么是robots.txt文件? 搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息. 您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中 ...

  2. robots.txt文件详解

    我们知道,搜索引擎都有自己的"搜索机器人"(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库. 对于网站管理 ...

  3. 织梦根目录感染abc.php,织梦SEO优化:织梦dedecms根目录下robots.txt文件设置详解! - 张俊SEO...

    对于dedecms这个建站程序,我想大多数站长都曾经用过,他功能之强大,几乎能秒杀一切内容管理系统,而且所有页面都能生成静态的html文件,对于SEO优化也是相当有优势的,说道SEO优势,就不得不提到 ...

  4. 什么是robots.txt文件

    一.什么是robots文件 Robots.txt文件是网站跟爬虫间的协议,对于专业SEO并不陌生,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问 ...

  5. 搜索引擎蜘蛛及网站robots.txt文件详解

    搜索引擎都有自己的"搜索机器人"(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库. 对于网站管理者和内容提 ...

  6. robots.txt文件的解析及过滤

    什么是robots.txt文件? robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不能被搜索引擎 ...

  7. 关于网站根目录下面robots.txt文件的作用

    谈到robots.txt文件,首先我们必须了解什么是robots协议,Robots协议(也称为爬虫协议.机器人协议等)的全称是"网络爬虫排除标准"(Robots Exclusion ...

  8. zblog php robots,zblog的robots.txt怎么写?zblog的robots.txt文件示例下载

    robots.txt对于比较seo的站长来说是一个很重要的东西,经常有朋友再问zblog的robots怎么写?本文就来详细说明下. 首先来解释下robots.txt是什么?robots.txt有什么作 ...

  9. robots.txt文件里面怎样屏蔽蜘蛛

    robots.txt文件,是每个网站都可以用来跟,遵循robots协议的搜索引擎蜘蛛,进行对话的一段代码. 我们先来看一个列子,让搜索引擎抓取所有的内容,代码如下: User-agent: * All ...

最新文章

  1. Java根据模板创建excel文件
  2. 【Centos 8】【Centos 7】腾讯云服务器 安装 docker
  3. 服务器新建文件命令,云服务器中新建文件夹命令
  4. c语言入口参数和出口参数,麻烦帮忙指出一下这个函数的入口参数和出口参数呀!...
  5. ASO关键词优化如何提升APP榜单排名,aso 关键词优化工具
  6. 【期刊推荐】JCR2区数学算法优化类重点SCI期刊征稿中~
  7. python列表创建操作_python列表操作
  8. android跳转到rn界面,第五章 RN与Native—由原生页面跳转到Rn页面;在Rn页面调用Android Native组件和Native数据...
  9. 【颜色科学】RGB和XYZ颜色空间的转换
  10. 大数据应用之啤酒尿布
  11. 加密字符 【问题描述】 在情报传递过程中,为了防止情报被截获,往往需要用一定的方式对情报进行加密。简单的加密算法虽然不足以完全避免情报被破译,但仍然能防止情报被轻易识别
  12. Hologres 助力飞猪双11实时数据大屏秒级响应
  13. Openstack之Keystone组件解析
  14. 《上古5》置业 周详诀巧风向标
  15. Python全局解释器锁(GIL)
  16. 使用VS code 连接远程linux服务器 —— VSCODE clangd插件 |CSDN创作打卡
  17. BlockingQueue
  18. 品质为先,服务不停,广州流辰信息公司恪守初心,匠心为民!
  19. 什么是std::string...?怎么用
  20. stm32F407 打开 FPU(浮点运算处理器)

热门文章

  1. SAP各模块优缺点和发展简析
  2. 我的世界基岩版json_我的世界基岩版1.12指令大全 中国版指令大全列表
  3. matlab保存nii_Matlab实现NIfTI(ANALYZE)核磁共振图像读写
  4. 程序员找工作遇到的“了解、熟悉、精通”的三种技能要求实际上是这样的标准!
  5. 新番 | 万万没想到,Hulu有一天也开始推新番了
  6. Oracle数据库:子查询、单行子查询,多行子查询,in,any,all语句,子查询的练习案例
  7. 计算机设计辅助 CAD 试题汇编,计算机辅助设计试题汇编-第二单元
  8. 基于区块链的去中心化存储(区块链存储)的工作流程
  9. 电子书寻找方法汇总2
  10. reactjs simple text editor