2019独角兽企业重金招聘Python工程师标准>>> hot3.png

豆瓣网的robots.txt中有Crawl-delay、Visit-time、Request-rate,好多人搞不清楚这是什么含义,因为平时大家用的最多的是User-agent和Disallow。不会写的新手们可以参考下http://www.douban.com/robots.txt

内容如下:
========================================================
User-agent: *
Disallow: /subject_search
Disallow: /amazon_search
Disallow: /forum/
Disallow: /new_subject
Disallow: /service/iframe
Disallow: /j/
Disallow: /link2/
Sitemap: http://www.douban.com/sitemap_index.xml
Sitemap: http://www.douban.com/sitemap_updated_index.xml

User-agent: Slurp
User-agent: Sosospider
Crawl-delay: 5
Visit-time: 0100-1300
Request-rate: 40/1m 0100 - 0759
Request-rate: 12/1m 0800 - 1300

========================================================

下面来解释下含义:

robots.txt文件中各项目的格式为: :
常用的field有Allow, Disallow, Request-rate, Visit-time, User-agent, Robot-version等.robots.txt文件中的注释以'#'开始.可以为独立的一行,也可以一行的后面部分.下面对每一个field,也叫directive进行一一介绍:

1. User-agent: The value of this field is the name of the robot the record is describing access policy for.
例子:User-agent: *
在这里*代表,any robot that has not matched any of the other records

2. Disallow: 指定不能访问我URL
例子: Disallow: /foo.html #foo.html不能访问
Disallow: #该目录下所有URL都可访问
Disallow: / #该目录下所有URL都不可以访问

3. Allow: 用来指定能访问的URL, 这个在当指定所有URL为不可访问,然后可以用这个排除特殊的一些. 这时候比较方便.
例子: Allow: / #允许访问所有URL

>>>> 一般的网站基本用到这些,下面用的就不多了,所以好多人看不懂,一般大型网站用的比较多,大家可以学习下。

4. Robot-version: 用来指定robot协议的版本号
例子: Robot-version: Version 2.0

5.Crawl-delay:雅虎YST一个特定的扩展名,可以通过它对我们的抓取程序设定一个较低的抓取请求频率。您可以加入Crawl-delay:xx指示,其中,“XX”是指在crawler程序两次进入站点时,以秒为单位的最低延时。

6. Visit-time:只有在visit-time指定的时间段里,robot才可以访问指定的URL,否则不可访问.
例子: Visit-time: 0100-1300 #允许在凌晨1:00到下午13:00访问

7. Request-rate: 用来限制URL的读取频率
例子: Request-rate: 40/1m 0100 - 0759 在1:00到07:59之间,以每分钟40次的频率进行访问
Request-rate: 12/1m 0800 - 1300 在8:00到13:00之间,以每分钟12次的频率进行访问

另外还有一点:robots.txt文件里还可以直接包括在sitemap文件的链接。就像这样:
Sitemap: http://www.seohua.net/sitemap.xml (此处请填写XML地图的绝对路径,即完整URL,如果按习惯填写Sitemap: /sitemap.xml,提交给Google网站管理员工具后会提示:检测到无效的 Sitemap 网址;语法错误。
XML地图必须在网站根目录下才有效。)

相关日志
网址重定向的方法
301重定向
301与302转向的区别

影响Google排名的因数总结

更多相关链接

http://www.chedong.com/blog/archives/001195.html

http://oss.org.cn/?action-viewnews-itemid-64848

http://ying.hopto.org/wp/2007/02/190/

转载于:https://my.oschina.net/zhangdapeng89/blog/42745

ROBOTS.TXT在SEO优化中的运用(ROBOTS.TXT SEO优化实战)相关推荐

  1. 多个txt导入oracle数据库中,将多个txt文件导入到ORACLE

    iamlaosong文 将文本文件导入到数据库,如果不需要对文件进行处理,用sqlldr导入不仅方便,而且速度快.下面这个导入脚本,通过循环生成每个文本文件导入的控制文件,其中X'09'表示分隔符是T ...

  2. 网站SEO优化中导航对用户体验的重要性

    在网站SEO优化中,用户体验也是优化人员非常重视的,帮助用户更快的找到有价值的信息以及给用户留下更好的印象,从而给网站带来更多的流量和用户转化.想让用户对网站有更多的好感,就要看网站是否有足够优秀的导 ...

  3. 网络部署过程中_郑州萤火云SEO网络优化:SEO过程中的容易犯的错误

    网站终于做好了,接下来要做的就要把网站发布出去.使用尽可能多的方法将网站推广出去,最大限度的让更多的人知道你网站,来获取更多流量才是关键.但如果你用了错误的SEO方法,将会适得其反,轻则引起用户反感, ...

  4. 网络推广专员带大家了解网站优化中长尾词的特征与优势!

    在网站优化过程中,网络推广专员认为长尾关键词的优化也是帮助网站增强实力,并吸引到更多的用户和流量大的一个方达并,并且长尾关键词可以有效的减少核心关键词的竞争,提高转化率,下面网络推广专员就给大家详细的 ...

  5. 网页优化中,网站页面结构该注意什么?

    网站页面结构即网页内容布局,网站页面结构的创建就是要对网页的内容进行规划布局,合理的网站页面结构总是很受搜索引擎蜘蛛的欢迎,网站页面结构也能直接影响页面的用户体验及相关性,还能影响网站整体结构及页面被 ...

  6. matlab对拓扑的处理,Matlab的图形处理器并行计算及其在拓扑优化中的应用

    Journal of Computer Applications 计算机应用,2016,36(3):628-632,652 ISSN 1oo1.9081 C0DEN JYIIDU 2016-03一l0 ...

  7. META的SEO优化中方法技巧

    Meta的SEO优化中方法技巧,Meta标签是用来描述网页属性的一种语言,标准的Meta标签可以便于搜索引擎排序,提高搜索引擎网站权重排名.要想网站做的更符合搜索引擎标准就必须了解meta标签,下面由 ...

  8. 网络推广专员教大家网站SEO优化中锚文本的使用技巧

    网站优化中有许多细节需要网络推广专员中优化人员们的更多注意,其中之一就是描文本.其实,锚文本就是给一个关键词加上一个链接跳转到需要的页面,广泛的应用到网站的方方面面,应用的好能有效促进网站收录,帮助提 ...

  9. 网站SEO优化中该如何解决网站改版问题?

    随着互联网的发展越来越快,网站建设也正在日新月异的变化,很多网站为了能够满足更多用户的需求,也就意味着很多网站正在面临着改版,但网站在改版之后又该如何保证网站的排名稳定?用户与搜索引擎的影响降到最小, ...

  10. 网站SEO优化中导入链接有哪些作用?

    导入链接包括外链和友情链接,通过这些链接的建设使网站获得更高的权重,对于目标关键词的排名也是有所提升.做好导入链接的优化,也是很多优化人员的目标,那么在网站SEO优化中,导入链接又有哪些作用呢?接下来 ...

最新文章

  1. 机器学习模型部署都有哪些坑?剑桥研究者梳理了99篇相关研究
  2. Keepalived+lvs+httpd之负载均衡
  3. weather_在Weather App中使用Android Location API –搜索城市
  4. 手机桌面隐藏大师_受够了内置主题?扒一扒Windows 10隐藏主题
  5. shell中的Here Document
  6. 年终盘点 | 七年零故障支撑 双11 的消息中间件 RocketMQ,怎么做到的?
  7. 4、spring核心AOP
  8. android百度地图sdk定位权限,Android:使用百度地图SDK实现定位:下载SDK、申请密钥、动态获得Android权限...
  9. Web前后端笔记-vue cli及java进行AES加解密
  10. 很漂亮个人主页自带音乐源码
  11. CSS 选择器优先级
  12. 收藏一些常用下载地址
  13. [译] 构建流畅的交互界面
  14. GB/T 8567-2006《计算机软件文档编制规范》中与需求有关的文档包
  15. ISO 37301:2021《合规管理体系 要求及使用指南》国际标准解读及相关标准
  16. 人工智能可以产生自主意识吗?
  17. gitter 卸载_最佳Gitter频道:转到
  18. 5V和USB供电 的隔离电路
  19. iOS用Sketch制作APP下拉刷新的GIF动画
  20. 自控力读书笔记 第六章 “那又如何”:情绪低落为何会使人屈服于诱惑?

热门文章

  1. react 引入html文件_React最快速上手教程
  2. 海岸鸿蒙高锰酸盐指数浓度,水中高锰酸盐指数的检测步骤
  3. 用户计算机安全管理,关于加强用户计算机安全管理工作的通知
  4. 3Dshader之球形环境映射(sphere environment mapping)
  5. Matlab提取ABAQUS后处理文件inp中的节点数
  6. navtab触底 小程序_微信小程序TAB切换效果
  7. C++函数参数传递--值传递和地址传递
  8. java cookie共享_cookie共享
  9. 语言压缩zip win_主流压缩软件挨个尝试后,我选择了没有短板的全能压缩Bandizip...
  10. python表格处理_python如何处理表格?