我们分析网站日志时会发现搜索引擎的蜘蛛有时候来访很频繁,但是就不抓取内容页面,如果没有经验的SEO人员会一头雾水,甚至会觉得是搜索引擎的问题。

其实有一大半还是网站自身存在问题,如果蜘蛛来访频率不低,那肯定就是内容页面有以下这八点问题。

一、网站结构混乱堵塞。

网站结构如果是比较混乱,会造成搜索引擎的蜘蛛爬取消耗过大而放弃,尤其是内容页面中有动态URL调用就会制造网络堵塞的现象。

比如:网站层级过深、页面重复率高、网站需要重复调用多级文件、动态读取太频繁且过深,等等。

二、内容文章太口水话。

不要为了原创而口水原创,这是没有意义的,如果文章大多数都是没有丝毫价值的内容,很容易造成搜索引擎负面印象,不去碰指定的URL特征链接。

比如:小几百字的原创文章,从头到尾就是个类似简单的介绍,甚至题不对文,有的甚至连图片都是盗取的。

三、网站没有ICP备案。

如果网站没有备案,那在国内所有搜索引擎当中都很难被抓取收录,百度好点,这是国内政策原因,也是网络生态的趋势。

比如:企业网站就算是正规的,有实体公司地址,也每天保持原创更新,那也是照样很难抓取。

四、网站访问速度比较慢。

网站的打开访问速度如果不理想,蜘蛛是无法完全分析页面内容的,而且也会直接影响爬取频率和准确性。

比如:网站打开速度需要3秒以上,页面打开了但是资源读取缓慢。

五、网站存在多级域名使用。

如果网站不是大品牌,而用了多个二级域名使用,这会较大的稀释掉权重,也很容易给搜索引擎一种不靠谱和不稳定的感觉。

比如:不同静态文件用不同的二级域名区分读取,动态页面又是单独一个二级域名等等。

六、被假蜘蛛误导和消耗资源。

现在有很多冒充搜素引擎的假蜘蛛会频繁爬取网站页面,轻则文章被采集,重着消耗光了服务器资源让真蜘蛛不想来了。

比如:网站权重不是很高,又没有主动提交URL地址,但是文章发布后能在1小时内就有蜘蛛来爬取,而且停留时间较长。

七、网站用了CDN缓存设置不对。

CDN缓存是一把双刃剑,很多新人不知道如何调控CDN配置,导致因为CDN广泛的IP地址让网站在搜素引擎那处于频繁更新IP的问题。

比如:CDN缓存时间不合理,缓存文件丢失和异常,回源设置错误,等等。

八、网站存在不合格的问题。

搜索引擎对网站的考核是比较严格的,随着技术的革新会越来越严谨。

比如:网站采集文章、不正当手法运营和优化、作弊SEO操作、网站排版差、广告过多,等等。

如果网站出现有蜘蛛比较频繁的来访,但是就不抓取收录,就先从以上八点开始自查解决。

搜索引擎蜘蛛抓取不到网站内容页面的原因总结相关推荐

  1. html元素不让蜘蛛抓取,屏蔽网站后台禁止搜索引擎蜘蛛抓取的方法

    搜索引擎爬取网页内容的工具我们都称之为搜索引擎蜘蛛,如果希望屏蔽蜘蛛抓取某个页面到搜索引擎服务器中,可以通过robots.txt文件来限制蜘蛛抓取.很多朋友希望屏蔽网站后台禁止搜索引擎蜘蛛抓取,又不希 ...

  2. 搜索引擎蜘蛛抓取网页规则

    搜索引擎面对的是互联网万亿网页,如何高效抓取这么多网页到本地镜像?这便是网络爬虫的工作.我们也叫它网络蜘蛛,做为站长,我们每天都在与它亲密接触. 一,爬虫框架 搜索引擎蜘蛛抓取网页规则 三联 上图是一 ...

  3. 搜索引擎蜘蛛抓取配额是什么?

    一月份时,Google新的SEO代言人Gary Illyes在Google官方博客上发了一篇帖子:What Crawl Budget Means for Googlebot,讨论了搜索引擎蜘蛛抓取份额 ...

  4. 蜘蛛爬取网页服务器卡死,总结搜索引擎蜘蛛抓取不到页面的原因及改善措施

    在诊断过程中,我们会遇到这样的问题.有些网页内容很好,用户可以正常访问.然而,搜索引擎蜘蛛只是不能正常访问和抓取它们,导致搜索结果覆盖率不足,这是百度等搜索引擎和网站的损失.百度称之为"抢夺 ...

  5. 搜索引擎蜘蛛抓取主要依据用户的四种行为

    网站想要在搜索引擎中拥有席位就必须吸引蜘蛛的抓取,而面对庞大的互联网来说,蜘蛛是没办法保证它的爬行可以遍布整个互联网数据的,因此怎样吸引蜘蛛的抓取也显得尤为重要.那么在与日俱增的互联网数据中蜘蛛是根据 ...

  6. 服务器处理蜘蛛抓取网页的过程,搜索引擎蜘蛛抓取页面过程图解

    学习seo的人经常在网上看到一句话:搜索引擎蜘蛛跟浏览器差不多,都是抓取页面.那么到底哪些一样哪些不一样?Ethan就通过浏览器帮助大家理解搜索引擎蜘蛛怎样抓取页面. 首先看一张图,是用firebug ...

  7. 系统检测到您正在使用网页抓取工具访问_SEO优化:搜索引擎蜘蛛抓取异常,原来是这个原因!...

    有一些网页内容优质,用户也可以正常访问,但是搜索引擎蜘蛛却无法正常访问并抓取,造成搜索结果覆盖率缺失,对搜索引擎对站点都是一种损失,百度把这种情况叫"抓取异常".对于大量内容无法正 ...

  8. 全文搜索引擎有哪些?_搜索引擎工作原理是什么?seo蜘蛛抓取会受到哪些因素影响?...

    seo优化就是搜索引擎优化,就是对网站进行各方面调整,使其更符合搜索引擎的算法要求,从而得到更多的流量及转化,所以做seo必须要多搜索引擎有更多的认识和了解.搜索引擎有哪些功能模块?它的工作原理是什么 ...

  9. 网站推广收录少?网站推广专员浅析可能是蜘蛛抓取出现问题

    从事过网站优化相关工作的人士都了解,企业网站想要在搜索引擎中获取良好的排名,没有充足的收录量作为基础很难实现.在网站优化期间,网站收录量有太多可影响因素,那么针对收录量偏低的网站来说,如果是搜索引擎蜘 ...

最新文章

  1. 面试:BigDecimal一定不会丢失精度吗?
  2. transformer bert 入门
  3. cocos2dx 响应windows键盘事件
  4. 打通前后端,这款效能提升开源“神器”你一定要了解
  5. 初探内核之《Linux内核设计与实现》笔记下
  6. 7. Document write() 方法
  7. 计算机网络复习-互联网概述
  8. 自己制作博客园打赏功能
  9. 计算机窗口显示桌面,Windows Server 2012 R2在桌面上显示计算机/网络图标
  10. 数据库mysql去重_MySQL数据库去重 SQL解决
  11. java代码对图片缩放
  12. Opencv -- 13像素值统计及平均值和方差的意义
  13. 打开dashboard报错:xcelsius已经停止工作
  14. java 每天执行一次_java定时器每隔5秒执行一次任务要怎么编写?
  15. 用STM32F103完成对SD卡的数据读取
  16. 如何查询微博主页地址是什么?
  17. R语言用quantstrat包获取股票、债券、基金、黄金、原油、指数、外汇和全球经济数据
  18. 这次,AMD又将数据中心标准提高了一大截
  19. 噢,我这该死的魅力,国潮新锐品牌「二某某」她来了她来了
  20. LeetCode 三维形体的表面积

热门文章

  1. 挖掘视频网站【优酷】上被截断的视频的地址--001
  2. linux指令_周东海
  3. Android Drawable图标生成工具
  4. 大神来看看我写的构造函数及闭包
  5. C++输入一行数字存放到数组
  6. cont_c指令_SFB41_CONT_C输入和输出参数
  7. 次世代游戏建模制作工作流程 1
  8. Cookie在前端写还是后端?
  9. mysql卸载如何彻底删除6_如何彻底卸载删除MySQL
  10. WebStorm--常用插件