有的时候我们的网站可能还在调试阶段,或者只对部分告知用户或内部人使用,可能不想让搜索引擎抓取我们的网站,以下介绍几种屏蔽搜索引擎的抓取:

1.在网站的根目录下创建robots.txt,添加内容:

User-agent:*    Disallow:/ 禁止某一搜索引擎,如百度:

User-agent:baiduspider  Disallow:/

各大搜索引擎代号:

google蜘蛛: googlebot

百度蜘蛛:baiduspider

yahoo蜘蛛:slurp

alexa蜘蛛:ia_archiver

msn蜘蛛:msnbot

有道蜘蛛:YodaoBot和OutfoxBot

搜狗蜘蛛:sogou spider

SOSO蜘蛛:sosospider

360:PeopleRank

2.在网站单页的<head></head>之间添加Meta信息:

<Meta name=”robots” content=”INDEX,FOLLOW”>

CONTENT=INDEX,FOLLOW:可以抓取本页,而且可以顺着本页继续索引别的链接

CONTENT=NOINDEX,FOLLOW:不许抓取本页,但是可以顺着本页抓取索引别的链接

CONTENT=INDEX,NOFOLLOW:可以抓取本页,但是不许顺着本页抓取索引别的链接

CONTENT=NOINDEX,NOFOLLOW:不许抓取本页,也不许顺着本页抓取索引别的链接。

还可以用以下语句禁止搜索引擎为页面建立快照:

<Meta name=”robots” content=”INDEX,FOLLOW,noarchive”>

3.在网站的根目录下建一个.htaccess文件,这样比robots更加严密(仅适合技术人员),文件内容:

RewriteEngine on

RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [NC]

RewriteRule .* - [F]

转载于:https://www.cnblogs.com/ItcastZc/p/4118579.html

网站屏蔽搜索引擎的方法相关推荐

  1. 各大网站屏蔽搜索引擎抓取分析

    2019独角兽企业重金招聘Python工程师标准>>> 前面转载了一篇关于淘宝屏蔽百度的文章,但是那是其他人的看法,还是想发表一下 自己的看法,当然由于本人对屏蔽爬虫内幕了解不是很多 ...

  2. 网站推广-搜索引擎推广方法

    搜索引擎推广是指利用搜索引擎.分类目录等具有在线检索信息功能的网络工具进行网站推广的方法.由于搜索引擎的基本形式可以分为网络蜘蛛型搜索引擎(简称搜索引擎)和基于人工分类目录的搜索引擎(简称分类目录), ...

  3. 新闻集团下周将推iPad报纸 网站屏蔽搜索引擎

    [b]腾讯科技讯[/b] 据国外媒体报道,消息人士透露,新闻集团掌门鲁珀特·默多克(Rupert Murdoch)与苹果掌门史蒂夫·乔布斯(Steve Jobs)将于1月19日在旧金山现代艺术博物馆为 ...

  4. 搜索引擎只能抓取html文件,通过robots屏蔽搜索引擎抓取网站内容

    robots协议屏蔽搜索引擎抓取 Robots协议(也称为爬虫协议.机器人协议等)的全称是"网络爬虫排除标准"(Robots Exclusion Protocol),网站通过Rob ...

  5. 博客屏蔽搜索引擎只是个笑话!!

    博客屏蔽搜索引擎只是个笑话!!最近SEOWHY论坛里有些人以"听说"."据说"."传言"之类的话来传播一个谣言,就是有些博客屏蔽搜索引擎.因 ...

  6. 网站SEO优化的方法

    网站SEO优化的方法: 1.url静态化和规范化:url中都去掉了index.php这样的后缀网址形式,目的就是让网站的层级更浅,获得的权重更高 代码中可以使用urlrewrite重写. 2.域名30 ...

  7. url动态追加参数_领高舆情优化:SEO网站URL优化的方法!

    摘要:领高舆情优化在前几篇文章当中,分享过很多关于网站收录的内容,今天我们就来说说网站URL优化的几点注意要点. 领高舆情优化:SEO网站URL优化的方法! 一.url目录层级不要太多 我们知道目录层 ...

  8. 10种网站数据的采集方法

    10种AI训练数据采集工具排行榜 10种网站数据的采集方法 1.目前常用的10种网站数据 2.如何写Python爬虫: 3.人生第一个 爬虫代码示例: 另外: 10种网站数据的采集方法 如何收集网站数 ...

  9. 2022年网站快速排名优化 方法是什么?

    目前,为了取得更好的宣传效果,必须合理运用各种网络营销手段,在网上进行宣传,扩大宣传范围,获得更多的流量. 在众多的互联网普及方式中,网站的普及是大多数人最喜欢的普及方式,如果能够利用搜索引擎优化技术 ...

  10. 推广网站的26种方法

    推广网站的26种方法 <script> var $tag=''; var $tag_code='1ab45b5672ffa519c31f86e5106a799c'; </script ...

最新文章

  1. webpack中loader加载器(打包非js模块)
  2. wex5 教程 前端UI编译原理与记事本编辑
  3. ​vSphere 性能优化方法总结
  4. 自动化用例设计原则+web自动化框架
  5. linux查看内存_【001】一文带你全面掌握Linux系统体系结构
  6. 论文赏析[EMNLP18]用序列标注来进行成分句法分析
  7. Flutter拓展 在Android studio中导入Flutter项目报错
  8. Python数据分析报告
  9. <statement> or DELIMITER expected, got ‘id‘
  10. 天龙八部科举答题问题和答案(全3/8)
  11. session 对象的绑定、解绑和钝化、活化
  12. 使用certbot完成证书的自动发放
  13. english words
  14. python复制word段落_使用python将整个word文档(包括表)复制到另一个
  15. 华为ensp ospf综合实验
  16. jquery系列之-ajaxSubmit()提交表单示例
  17. eclipse总是运行之前的代码,控制台只显示原先的结果
  18. 算法工程师(机器学习/深度学习)Offer的准备流程
  19. 网络抓包-抓包工具tcpdump的使用与数据分析
  20. 芋道 Spring Boot 热部署入门

热门文章

  1. TCP 拥塞控制算法
  2. Centos6.5 安装配置 Apache +mysql +php 操作文档
  3. 通过Web.config中的configSections配置自己系统的全局常量
  4. 如何创建和使用Web服务(转)
  5. 新站快速收录同时也提高内页的收录
  6. 纯c++实现之滚动窗口
  7. 高清电视开播:大多用户仍难跨入
  8. 《OSPF和IS-IS详解》一2.4 理解内部BGP
  9. 使用Apktools反编译apk应用
  10. Codeforces Round #371 (Div. 2)