搜索引擎蜘蛛抓取不到网站内容页面的原因总结
我们分析网站日志时会发现搜索引擎的蜘蛛有时候来访很频繁,但是就不抓取内容页面,如果没有经验的SEO人员会一头雾水,甚至会觉得是搜索引擎的问题。
其实有一大半还是网站自身存在问题,如果蜘蛛来访频率不低,那肯定就是内容页面有以下这八点问题。
一、网站结构混乱堵塞。
网站结构如果是比较混乱,会造成搜索引擎的蜘蛛爬取消耗过大而放弃,尤其是内容页面中有动态URL调用就会制造网络堵塞的现象。
比如:网站层级过深、页面重复率高、网站需要重复调用多级文件、动态读取太频繁且过深,等等。
二、内容文章太口水话。
不要为了原创而口水原创,这是没有意义的,如果文章大多数都是没有丝毫价值的内容,很容易造成搜索引擎负面印象,不去碰指定的URL特征链接。
比如:小几百字的原创文章,从头到尾就是个类似简单的介绍,甚至题不对文,有的甚至连图片都是盗取的。
三、网站没有ICP备案。
如果网站没有备案,那在国内所有搜索引擎当中都很难被抓取收录,百度好点,这是国内政策原因,也是网络生态的趋势。
比如:企业网站就算是正规的,有实体公司地址,也每天保持原创更新,那也是照样很难抓取。
四、网站访问速度比较慢。
网站的打开访问速度如果不理想,蜘蛛是无法完全分析页面内容的,而且也会直接影响爬取频率和准确性。
比如:网站打开速度需要3秒以上,页面打开了但是资源读取缓慢。
五、网站存在多级域名使用。
如果网站不是大品牌,而用了多个二级域名使用,这会较大的稀释掉权重,也很容易给搜索引擎一种不靠谱和不稳定的感觉。
比如:不同静态文件用不同的二级域名区分读取,动态页面又是单独一个二级域名等等。
六、被假蜘蛛误导和消耗资源。
现在有很多冒充搜素引擎的假蜘蛛会频繁爬取网站页面,轻则文章被采集,重着消耗光了服务器资源让真蜘蛛不想来了。
比如:网站权重不是很高,又没有主动提交URL地址,但是文章发布后能在1小时内就有蜘蛛来爬取,而且停留时间较长。
七、网站用了CDN缓存设置不对。
CDN缓存是一把双刃剑,很多新人不知道如何调控CDN配置,导致因为CDN广泛的IP地址让网站在搜素引擎那处于频繁更新IP的问题。
比如:CDN缓存时间不合理,缓存文件丢失和异常,回源设置错误,等等。
八、网站存在不合格的问题。
搜索引擎对网站的考核是比较严格的,随着技术的革新会越来越严谨。
比如:网站采集文章、不正当手法运营和优化、作弊SEO操作、网站排版差、广告过多,等等。
如果网站出现有蜘蛛比较频繁的来访,但是就不抓取收录,就先从以上八点开始自查解决。
搜索引擎蜘蛛抓取不到网站内容页面的原因总结相关推荐
- html元素不让蜘蛛抓取,屏蔽网站后台禁止搜索引擎蜘蛛抓取的方法
搜索引擎爬取网页内容的工具我们都称之为搜索引擎蜘蛛,如果希望屏蔽蜘蛛抓取某个页面到搜索引擎服务器中,可以通过robots.txt文件来限制蜘蛛抓取.很多朋友希望屏蔽网站后台禁止搜索引擎蜘蛛抓取,又不希 ...
- 搜索引擎蜘蛛抓取网页规则
搜索引擎面对的是互联网万亿网页,如何高效抓取这么多网页到本地镜像?这便是网络爬虫的工作.我们也叫它网络蜘蛛,做为站长,我们每天都在与它亲密接触. 一,爬虫框架 搜索引擎蜘蛛抓取网页规则 三联 上图是一 ...
- 搜索引擎蜘蛛抓取配额是什么?
一月份时,Google新的SEO代言人Gary Illyes在Google官方博客上发了一篇帖子:What Crawl Budget Means for Googlebot,讨论了搜索引擎蜘蛛抓取份额 ...
- 蜘蛛爬取网页服务器卡死,总结搜索引擎蜘蛛抓取不到页面的原因及改善措施
在诊断过程中,我们会遇到这样的问题.有些网页内容很好,用户可以正常访问.然而,搜索引擎蜘蛛只是不能正常访问和抓取它们,导致搜索结果覆盖率不足,这是百度等搜索引擎和网站的损失.百度称之为"抢夺 ...
- 搜索引擎蜘蛛抓取主要依据用户的四种行为
网站想要在搜索引擎中拥有席位就必须吸引蜘蛛的抓取,而面对庞大的互联网来说,蜘蛛是没办法保证它的爬行可以遍布整个互联网数据的,因此怎样吸引蜘蛛的抓取也显得尤为重要.那么在与日俱增的互联网数据中蜘蛛是根据 ...
- 服务器处理蜘蛛抓取网页的过程,搜索引擎蜘蛛抓取页面过程图解
学习seo的人经常在网上看到一句话:搜索引擎蜘蛛跟浏览器差不多,都是抓取页面.那么到底哪些一样哪些不一样?Ethan就通过浏览器帮助大家理解搜索引擎蜘蛛怎样抓取页面. 首先看一张图,是用firebug ...
- 系统检测到您正在使用网页抓取工具访问_SEO优化:搜索引擎蜘蛛抓取异常,原来是这个原因!...
有一些网页内容优质,用户也可以正常访问,但是搜索引擎蜘蛛却无法正常访问并抓取,造成搜索结果覆盖率缺失,对搜索引擎对站点都是一种损失,百度把这种情况叫"抓取异常".对于大量内容无法正 ...
- 全文搜索引擎有哪些?_搜索引擎工作原理是什么?seo蜘蛛抓取会受到哪些因素影响?...
seo优化就是搜索引擎优化,就是对网站进行各方面调整,使其更符合搜索引擎的算法要求,从而得到更多的流量及转化,所以做seo必须要多搜索引擎有更多的认识和了解.搜索引擎有哪些功能模块?它的工作原理是什么 ...
- 网站推广收录少?网站推广专员浅析可能是蜘蛛抓取出现问题
从事过网站优化相关工作的人士都了解,企业网站想要在搜索引擎中获取良好的排名,没有充足的收录量作为基础很难实现.在网站优化期间,网站收录量有太多可影响因素,那么针对收录量偏低的网站来说,如果是搜索引擎蜘 ...
最新文章
- 面试:BigDecimal一定不会丢失精度吗?
- transformer bert 入门
- cocos2dx 响应windows键盘事件
- 打通前后端,这款效能提升开源“神器”你一定要了解
- 初探内核之《Linux内核设计与实现》笔记下
- 7. Document write() 方法
- 计算机网络复习-互联网概述
- 自己制作博客园打赏功能
- 计算机窗口显示桌面,Windows Server 2012 R2在桌面上显示计算机/网络图标
- 数据库mysql去重_MySQL数据库去重 SQL解决
- java代码对图片缩放
- Opencv -- 13像素值统计及平均值和方差的意义
- 打开dashboard报错:xcelsius已经停止工作
- java 每天执行一次_java定时器每隔5秒执行一次任务要怎么编写?
- 用STM32F103完成对SD卡的数据读取
- 如何查询微博主页地址是什么?
- R语言用quantstrat包获取股票、债券、基金、黄金、原油、指数、外汇和全球经济数据
- 这次,AMD又将数据中心标准提高了一大截
- 噢,我这该死的魅力,国潮新锐品牌「二某某」她来了她来了
- LeetCode 三维形体的表面积