这其实不只是针对于discuz这个程序建的网站,针对所有的网站都有效。网站的根目录有一个robots.txt文件。这个就相当于一个协议。它告诉搜索引擎,你可以抓取我网站里的哪些内容。所以,想要禁止搜索引擎抓取网站内容,就得在这个文件里进行操作。

先看一下discuz默认的robots.txt内容:

User-agent: *

Disallow: /api/

Disallow: /data/

Disallow: /source/

Disallow: /install/

Disallow: /template/

Disallow: /config/

Disallow: /uc_client/

Disallow: /uc_server/

Disallow: /static/

Disallow: /admin.php

Disallow: /search.php

Disallow: /member.php

Disallow: /api.php

Disallow: /misc.php

Disallow: /connect.php

Disallow: /forum.php?mod=redirect*

Disallow: /forum.php?mod=post*

Disallow: /home.php?mod=spacecp*

Disallow: /userapp.php?mod=app&*

Disallow: /*?mod=misc*

Disallow: /*?mod=attachment*

Disallow: /*mobile=yes*

Disallow的意思就是不允许抓取。好了,我们最终把上面的代码改成下面内容:

User-agent: *

Disallow: /

这样就是网站根目录下的所有内容都不允许抓取。

disallow: /api.php,dz论坛如何禁止搜索引擎抓取任何内容?相关推荐

  1. 如何让搜索引擎抓取AJAX内容

    2019独角兽企业重金招聘Python工程师标准>>> 越来越多的网站,开始采用"单页面结构"(Single-page application). 整个网站只有一 ...

  2. 搜索引擎只能抓取html文件,通过robots屏蔽搜索引擎抓取网站内容

    robots协议屏蔽搜索引擎抓取 Robots协议(也称为爬虫协议.机器人协议等)的全称是"网络爬虫排除标准"(Robots Exclusion Protocol),网站通过Rob ...

  3. 搜索引擎是如何抓取网站内容的

    编者按:站长朋友们,今后定期都将在这里跟大家分享一些有关搜索引擎工作原理及网站运营相关的内容,今天先简单介绍一下关于搜索引擎抓取系统中有关抓取系统基本框架.抓取中涉及的网络协议.抓取的基本过程三部分. ...

  4. 阻止搜索引擎抓取网站的工具_使用PHP将抓取的网站转变为搜索引擎

    阻止搜索引擎抓取网站的工具 In the previous part of this tutorial, we used Diffbot to set up a crawljob which woul ...

  5. 各大网站屏蔽搜索引擎抓取分析

    2019独角兽企业重金招聘Python工程师标准>>> 前面转载了一篇关于淘宝屏蔽百度的文章,但是那是其他人的看法,还是想发表一下 自己的看法,当然由于本人对屏蔽爬虫内幕了解不是很多 ...

  6. SEO优化篇 - 搜索引擎抓取href=#!锚点

    . 由于我们在处理单页应用的时候页面是不刷新的,所以会导致我们的网页记录和内容很难被搜索引擎抓取到. 搜索引擎抓取页面首先要遵循http协议,可是#不是协议内的内容. 而实际上也是这样,我们没有见过搜 ...

  7. 百度VS淘宝 (淘宝网正式向百度宣战:淘宝网将屏蔽百度的搜索引擎抓取)

    昨天,淘宝网正式向百度宣战:淘宝网将屏蔽百度的搜索引擎抓取. 听到这个消息后我非常震惊,看来互联网这场电子商务大战正在拉开帷幕. 首先说淘宝 1.马云的决定 首先说马云,马云采用屏蔽搜索引擎这招狠棋应 ...

  8. scrapy 搜索关键字_解析搜索引擎抓取网站目标关键词原理

    一个网站有几百甚至几千个关键词,怎么让搜索引擎知道网站的目标关键词是什么呢? 解析搜索引擎抓取网站目标关键词原理 一.网站标题(Title),网站标题是搜索引擎最重视的部分,通常情况下,无论网站是否存 ...

  9. html 禁止百度抓取,禁止百度收录方法是什么?

    小编:我们都知道robots.txt文件中的协议是用来告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取的.如为了禁止百度收录网站的某些特地的页面,除robots.txt外,我们还可以用Meta robo ...

最新文章

  1. java多线程 sleep()和wait()的区别
  2. linux mysql忘记root_linux下mysql-5.6忘记root密码,重置root密码详细过程
  3. 提高 TDD 效率的一些小诀窍
  4. python——变量的类型、不同类型变量的计算、变量的输入以及格式化输出
  5. 原生支付url参数错误_小程序支付
  6. 将PostgreSQL数据库扩展到每个月12亿条记录的经验教训
  7. 前端结构解析系列之二:凯旋门结构
  8. Redis入门到精通-姜海强-专题视频课程
  9. 游戏筑基开发之字符串、字符指针、字符数组的相关知识梳理(C语言)
  10. 软件测试_Loadrunner_APP测试_性能测试_脚本优化_脚本回放
  11. 猫/路由器/网关/交换机的作用与区别
  12. 基于R语言绘制标准化平均差(Standardized mean difference SMD)可视化图(1)
  13. forward和redirect的区别是什么?
  14. 计算机sumifs函数怎么操作,excel中SUMIFS函数的公式语法及使用方法教程
  15. java实现xls转换为xlsx
  16. springboot项目中redis客户端(Jedis、Lettuce、Redisson)
  17. mongodb-更新操作符
  18. DateUtils.offsetDay
  19. http数字请求 (错误请求聚合)
  20. 谷歌算法快讯0519:近日排名变化频繁,排名或许回温?

热门文章

  1. Mathmatica9 注册不了
  2. 【日语】编程相关日语词汇
  3. 【内网渗透】域横向PTHPTKPTT哈希票据传递
  4. matlab ode45例子,matlab的ode45
  5. matlab程序中ode45,关于matlab中ode45的问题
  6. 使用Telerik的登陆模板实现DoubanFm的登陆(WP7)
  7. Anaconda安装完python文件.py不显示黄蓝图标
  8. C#调用存储过程带输出参数或返回值分类(转)
  9. ElasticSearch索引模块
  10. 在ubntu下安装Sublime text