在过去的一段时间里,大家一度对收录和索引的概念非常模糊,百度工程师也曾“粗暴”地说过“收录和索引是一回事”。但实际工作中,发现,其实收录和索引都有其各自的重要意义,并不能含糊地混为一谈,于是制作了这样一张图,让大家快速了解搜索引擎的主要工作过程;

搜索引擎工作原理:

首先蜘蛛(spider)通过页面上在超级链接关系,不断的发现新的URL并抓取;

其次将爬行在数据存储原始页面数据库;

再次进行页面分析,对页面进行初步分析(比如:标题、页面权重、链接深度等)对内容进行质量分析;

在页面分析的基础上,对有价值的内容建立索引;

最后匹配用户检索内容,用户检索关键词后 ,排名程序调用索引库数据,计算排名显示给用户;

了解到搜索引擎基础工作原理,就更好的方便去我们去了解收录与索引的区别了;

1,收录和索引分别指什么

收录:页面被Baiduspider发现、分析过,其实就是指抓取于、存储及页面分析的过程;

索引:Baiduspider经初步分析后认为有意义,做建库处理;

2, 收录和索引的关系

包含关系,先收录才可以建索引,收录量大于索引量。是通往收录的大门;

3, 收录和索引的意义

收录意义1:收录是索引的前提,站点需要保持服务器稳定(参考抓取、抓取)、robots正确,为Baiduspider抓取铺平道路;

收录意义2:Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换;

索引意义1:只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量);

索引意义2:新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中;

4, 如何查询收录量和索引量目前百度未提供查询收录的工具,任何第三方提供的所谓收录查询都是不靠谱儿的。站长可以通过LOG日志分析估算收录,注意真假Baiduspider()真实索引量只能通过百度站长平台索引量工具查询目前有第三方开发的工具可以辅助分析索引中页面的引流能力,如http://site.itseo.net(第三方工具,仅供参考)

反向索引和自增索引区别_深度解析 百度收录与百度索引有什么区别?相关推荐

  1. 分布式和微服务区别_深度解析spring cloud分布式微服务的实现

    分布式系统 微服务就是原来臃肿的项目拆分为多个模块互不关联.如:按照子服务拆分.数据库.接口,依次往下就更加细粒度,当然运维也就越来越难受了. 分布式则是偏向与机器将诺大的系统划分为多个模块部署在不同 ...

  2. 苹果几最好用_深度解析安卓手机和苹果手机到底有哪些区别,哪种手机最好用...

    " 安卓阵营手机和苹果手机一直是手机界多年的竞争对手.由于安卓系统是开源的系统,任何厂家都能使用它.而导致安卓系统全球碎片化的主要原因是大部分国产品牌手机都没有安装谷歌服务,对于外国人的来说 ...

  3. ldo和dcdc功耗_深度解析DCDC和LDO各自的原理和区别

    LDO:LOW DROPOUT VOLTAGE LDO(是low dropout voltage regulator的缩写,整流器)低压差线性稳压器,故名思意,为线性的稳压器,仅能使用在降压应用中.也 ...

  4. mysql使用联合唯一索引会影响查询效率吗_想进大厂,这些Mysql索引底层知识你是必须知道的。...

    前言 上一篇总结了Mysql的锁机制,通过读者的反映和阅读量显示,总体还是不错的,感兴趣的可以阅读一下[]. 写了那么多的Mysql文章,有读者问我是不是dba,工作真的需要掌握那么深吗.我想说的是: ...

  5. MySQL深度解析笔记(事务和索引)

    文章目录 简单了解MySQL的架构体系 事务(只用InnoDB才支持事务) 事务四大特性及原理 原子性实现原理:Undo log(回滚日志) 持久性实现原理:Redo log(前滚日志/重做日志) 隔 ...

  6. 百度收录量、索引量、Site值等问题小结

    1.收录量.索引量.Site值 很多人分不清以上三者的关系,我整理了一张图: 先有收录,它是百度蜘蛛在用户网站搜索到的页面,收录量是所有收录的页面的数量. 索引是在收录的基础上,经过一定的优化算法变成 ...

  7. iVMS-4200 Vs区别_杏林早报 | 西芹、水芹、旱芹...功效有区别,吃对才真降血压!...

    打开音乐,开启早报唠嗑的一天~ 昨天说了芹菜能降血压. 祛湿浊.补血安神, 但芹菜有好几种,吃哪个效果更好呢? 今天就来好好说说. (↑ 芹菜种类图) 芹菜其实有很多的品种, 比如根芹.白芹.红芹.空 ...

  8. python中superclass是什么_深度解析并实现python中的super(转载,好文)

    大神半个月的成绩,让我看的叹为观止,建议看原帖地址,会让你对Python的描述符有更强的认识. 原文链接:https://blog.csdn.net/zhangjg_blog/article/deta ...

  9. 完整的连接器设计手册_深度解析特斯拉的电池快充连接器技术|附视频

    推荐:GSAuto联盟|三电技术专家委员会,初期仅对主机厂.Tirl1等公司新能源汽车三电研发管理制造方面人员.大学及科研机构等新能源汽车三电研究人员,现已招募480+人,主要分布在50+主机厂.50 ...

最新文章

  1. 使用Django开发REST 接口
  2. 深度学习推理时融合BN,轻松获得约5%的提速
  3. jfinal获取url链接上面传来的string类型的值_每个公司都会用的短 URL 服务,怎么设计与实现?...
  4. C语言实现基数排序Radix sort算法之一(附完整源码)
  5. ADO和DAO的区别
  6. H5页面随机数字键盘支付页面
  7. ML.NET 示例:图像分类模型训练-首选API(基于原生TensorFlow迁移学习)
  8. 在Cloudfoundry上部署RESTful服务
  9. 2021年春季学期期末统一考试 国际公法 试题
  10. 编译rocksdb源码导致的部署失败
  11. python入门之玩转列表我的菜单_我的Python成长之路---第一天---Python基础(作业2:三级菜单)---2015年12月26日(雾霾)...
  12. 378. 有序矩阵中第K小的元素
  13. 服务器centos安装mysql_centos下安装mysql服务器的方法
  14. Mac 下 Eclipse 添加 Dynamic Web Project 并配置 Tomcat
  15. jQuery学习笔记03
  16. 计算机将在1分钟重启,Win10开机经常提示将在一分钟后自动重启如何处理
  17. 无线摄像头服务器关闭,监控摄像头服务器停止
  18. CPU压力测试工具cpuburn
  19. 名词性从句引导词的基本用法
  20. 多重积分matlab

热门文章

  1. 评估人-自主系统团队通信的方法(1)
  2. android微信群聊功能,微信安卓内测更新,这个群聊功能等了8年
  3. 【原创】关于联想Y400适配器和电池同时使用无法开机的问题
  4. 实现智能家居控制系统
  5. Development模式是如何运作的?
  6. webrtc入门:8.coturn流程
  7. 多谢您―skycc群发软件
  8. 深度学习分布式训练框架 horovod (3)
  9. IOS13图标尺寸_更新iOS13后,我的5台iPhone都废了
  10. trunk端口配置错误导致环路