通过《SEO新手入门系列2022(二):SEO 101》这篇文章已经简单的介绍了什么是SEO,和搜索引擎,这一篇文章来详细的介绍下搜索引擎的工作原理,搜索引擎的工作顺序大致是:抓取网页(Crawing)建立索引(Indexing),排名显示(Ranking)

就像在前一篇文章提到的,搜索引擎就是一个问答机器,他们去挖掘,理解,组织网上能发现的任何信息,然后把他们以相关的方式组织起来,再返回给使用者,为了能把你的网站展现给用户之前,最重要的一件事就是你的网站能够被搜索引擎发现 ,否则在SEPRs(搜索引擎结果页)是不会有你网站信息的。

搜索引擎是怎么工作的?

就如SEO小也开头说的,搜索引擎想把网站信息提供给用户,需要完成三个主要任务:

  • 爬取网站(Crawing)会有很多蜘蛛程序,顺着URL一个网站一个网站的爬取网站内容。
  • 创建索引(Indexing)对蜘蛛爬取的内容进行分类,创建相关索引,并储存在数据库中。
  • 建立排名(Ranking)为可能的问题建立相关性排名,相关性最高的内容排在靠前的位置。

当然其中的技术实现是非常复杂的,作一名SEO新人,可能占时不需要深究这些问题,SEO小也在大学毕业的时候,作的毕业设计就是搜索引擎,当然那时候是使用第三方的索引分词库,我们大部分时间只要配置规则就可以,更深入的内容我会另写些篇文章来分享。

搜索引擎抓取(Crawing)

搜索引擎要想把相关内容展示给用户,第一步做的就是派出他的小弟——搜索引擎爬虫(蜘蛛),他们会不停的抓取互联网上新的内容,或者更新数据库中旧的内容,内容的形式多种多样,有可能是网页,PDF文件,MP3音频文件,什么形式都有,但是他们都是通过URL去找到这些内容的。

搜索引擎一开始会有一些种子URL,这些URL都是一些质量比较高的链接地址,而且蜘蛛们就会顺着这些地址不断的往下抓取,在这个过程中,新发现的链接又会被作为新一轮爬取任务的种子URL,直到没有新的链接可以爬取。

搜索引擎索引(Indexing)

建立索引是一个非常复杂的过程,这个过程涉及的内容比较多的是计算机方面的内容,有算法,有地理环境,有社会学研究等等因素,搜索引擎会根据很多参数去控制这些内容的分类,但是最重要的一点,就是这些内容的相关性,相关性越高,被分在同一个分类的可能性就越高,建立索引是为了后期能快速展现给用户作准备,也是为排名提供数据基础。

搜索引擎排名(Ranking)

用户在搜索引擎输入框输入他的关键词,搜索引擎会用惊人的效率在他庞大的索引数据库中找到相关的内容,并按内容的相关性和一些其它的参数来对内容进行排序,这个过程就是搜索引擎排名,靠前的内容,在搜索引擎看来就是和用户的问题相关性越高的回答。

如果我们不想让搜索引擎把一些内容展示给用户,这也是可以办到的,但是大多数情况下我们不会这么做,搜索引擎优化的目的就是为了让用户看到我们,并能让搜索引擎优先展示我们想给用户看的内容。

搜索引擎能找到你么?

就像前面说的,如果要让自己的网站出现在SERPs中,那前提就是让网站被搜索引擎蜘蛛爬取和索引,如果你已经有了网站,你可以使用site命令来查看自己网站被收录的情况,就拿SEO小也为例,在谷歌搜索框输入site:www.seozen.top你可以看到如下类似的结果:

可以看到SEO小也已经有135个网页已经被谷歌收录,这个结果是经常会变动的,能看到一个大概的数据,并不是特别的精准,还有很多没有显示的网页,用一些关键词也是能搜索到。如果想看更精准的结果,可以使用Google Search Console在收录功能中查看,这就相当于我们百度的站长平台,但是SEO小也个人觉得比百度站长的作用要大的多,所以SEO小也一般只会看GSC的数据,很少去看百度站长平台的数据,以后也会专门写几篇文章来介绍。

如果你使用site命令找不到网站的收录,那有可能是下面几种原因:

  • 网站是新站,搜索引擎还没有收录。
  • 网站没有外部导入链接,可以到一些平台发一些外链。
  • 网站目录结构太深,太复杂,让搜索引擎爬虫抓取的效率太低。
  • 网站可能包含一些阻止搜索引擎爬虫的代码,如noindexnofollow
  • 网站可能被搜索引擎处罚,因为一些作弊或者垃圾广告等。

我们有时候把精力太多的放在如何让搜索引擎抓取内容,却忽略如何不让搜索引擎不要爬取一些内容,比如说一些重复的页面,一些搜索参数,还有比如说公司的联系方式,留言等,这些内容被收录意义并不大,而且还会让搜索引擎不知道具体哪个界面是你最想展示给用户的,所以这时候我们就要告诉搜索引擎,哪些资源他不要花时间去爬取,这就要robots.txt文件出场了,这篇SEO教程先到这。

SEO新手入门系列2022(三):搜索引擎工作原理相关推荐

  1. SEO新手入门系列2022(六):站内SEO内容篇

    这是<SEO新手入门系列2022>中的第六篇文章,前面几篇文章主要是介绍了SEO中的基础知识部份,关于什么是SEO,搜索引擎的工作原理,关键词挖掘等,从这篇开始就要实际分享一些内容,SEO ...

  2. SEO新手入门系列2022(二):SEO 101

    这是<SEO新手入门系列教程>的第二篇文章,一看标题就应该清楚这篇文章讲的是SEO基础知识,没有任何高大上的东西,如果对SEO基本概念有了解的朋友可以跳过不需要看,但是如果你是半路出家的S ...

  3. SEO新手入门系列2022(一):SEO金字塔

    seo小也最近打算翻译一些优秀的SEO优化文章,在MOZ上看到SEO入门系列,觉得写的不错,所以就打算翻译成中文,希望对SEO新人有一定帮助,这个系列文章翻译自:https://moz.com/beg ...

  4. SEO新手入门系列2022(五):挖掘关键词

    前面已经说完搜索引擎的工作原理,现在就和SEO小也一起来学习下SEO最重要的一部分内容,SEO关键词,很多朋友在选择目标关键词的时候没有头绪,有时候选的关键词和网站的内容也不合适,导致搜索引擎导流来的 ...

  5. SEO新手入门系列2022(七):站内SEO优化

    前一篇文章主要围绕站内内容优化,这篇文章继续说一些站内SEO优化方法.其实想要做好站内优化,就要先把一些基础优化做好,基础的优化占到了站内优化比例90%左右,最多不到10%是属于有点技术难度的高级SE ...

  6. SEO新手入门,SEO零基础入门教程,新手做SEO怎么做

    seo的作用是对网站进行seo优化,可以给网站带来大量的搜索引擎流量.但是想要做好网站优化也有难度,尤其是对于seo新手来说,因为缺乏理论和实战,所以seo新手需要多加练习.那么具体seo新手入门应该 ...

  7. DotA新手入门系列 新手生存篇

    DotA新手入门系列 新手生存篇 Dota是一局对抗游戏,玩者的目的虽然是击毁敌方的主建筑,但推进的过程必须通过人与人的对抗来实现.说白了,也就是对敌方的杀戮. 新手,就好象是没有上过战场的新兵.你拥 ...

  8. php关键词分词搜索 最多匹配的排在最前面_百度搜索引擎工作原理,做Seo的建议看一看 - 蜘蛛池博客...

    原出处:蜘蛛池博客 原文链接:百度搜索引擎工作原理,做Seo的建议看一看 - 蜘蛛池博客 从事SEO(搜索引擎优化)工作的人可以比喻成搜索引擎的贴身管家,作为一名合格称职的管家必须要了解所服务对象的习 ...

  9. Rust 新手入门系列课程 | Databend 社区

    01<Rust 入门基本原理 >| Vol. 25 分享主题:<Rust 入门基本原理>| Vol. 25 分享讲师: 苏林 分享时间: 周日晚上 2021-12-12 20: ...

最新文章

  1. ios开发text kit_IOS开发入门之TextKit详解
  2. linux调用函数和case,Shell篇(3)-单双引号 ,函数及case语句用法
  3. 事务回滚什么意思 try_Spring事务管理(一)快速入门
  4. 标准的软件开发是怎样的?
  5. html mysql 数据列表_html的列表加载数据库
  6. 同一域内部署多台notes server
  7. 为什么要使用McAfee Endpoint Security?
  8. Java基础知识总结(2022最新版一)|CSDN创作打卡
  9. 【echarts柱状图最大高度】echarts柱状图限制柱子最大高度方法
  10. 标准差 php,标准偏差怎么算
  11. 声纹识别开源框架python_GitHub - yeyupiaoling/VoiceprintRecognition-Tensorflow: 使用Tensorflow实现声纹识别,博客地址:...
  12. 锐龙r75800H和酷睿i71165G7 选哪个好
  13. html实现在线聊天,利用HTML5实现电脑端微信聊天窗口界面
  14. 信号处理--常用术语
  15. 作为使用者如何应对JCenter远程仓库停止维护
  16. @media only screen and
  17. LINUX Beyond-Compare 4
  18. 销 售 具 备 10 条
  19. 使用记录35_开通微信小游戏虚拟支付
  20. 怎么用feign远程调用别人的接口_Feign - HTTP接口调用- 单独使用 - 实战

热门文章

  1. Assertion 断言
  2. md5模块和hashlib模块
  3. 科目需要分配到成本对象
  4. R语言相关性分析和相关性分析可视化常用方法汇总
  5. 计算机专业转行做英语老师,做了三年英语老师后,我想转行了
  6. Univariate Statistics and Methodology using R
  7. 几张图看懂高级经理人与普通管理者的区别
  8. 设计模式之访问者模式(Visitor)
  9. 个人永久性免费-Excel催化剂功能第17波-批量文件改名、下载、文件夹创建等
  10. python快递费用计算用包裹重量和目的地计算_Python爬取指定重量的快递价格