WEB前端-搜索引擎工作原理与SEO优化
一、搜索引擎工作原理
搜索引擎的工作分为三个节点,即爬行,索引,和检索
1、爬行
搜索引擎具有网路爬虫或蜘蛛来执行爬网,每次抓取工具访问网页时,它都会复制该网页并将其网址添加到索引中。
在 “蜘蛛” 抓取网页内容,提炼关键词的这个过程共,就存在一个问题: “蜘蛛” 能否看懂。如果网站内容是 flash 和 js ,那么她是看不懂的。相应的如果网站内容是其他语言,那么她便能看懂,她的语言即SEO
2、索引
此阶段,爬网程序会创建搜索引擎的索引。索引就像一本巨大的书,其中包含爬虫找到的每个网页的副本。如果任何网页发生更改,则抓取工具会使用新内容更新图书。
3、检索
这是搜索引擎以特定顺序提供最有用和最相关答案的最后阶段
二 、SEO 简介
全称:Search English Optimization,搜索引擎优化,即为了提升网页在搜索引擎自然搜索结果中的收录数量以及排序位置而做的优化。
1、SEO 的分类
- 白帽SEO :起到了改良和规范网站设计的作用,使网站对搜索引擎和用户更加友好,并从搜索引擎中获取合理的流量。
- 黑帽SEO :利用和放大搜索引擎缺陷来获取更多用户的访问量
2、白帽SEO 的使用
- 对网站的标题、关键字、描述精心设置,反应网站的定位,让搜索引擎明白网站是做什么的;
- 网站内容优化:内容与关键字的对应,增加关键字的密度;
- 在网站上合理设置Robot.txt 文件;
- 生成针对搜索引擎友好的网站地图;
- 增加外部链接,到各个网站上宣传;
三、前端SEO 优化
通过网站的结构布局设计和网页代码优化,使前端页面既能让浏览器用户能够看懂,也能让“蜘蛛”看懂
1、网站结构布局优化
- 控制首页链接数量
对于中小型企业网站,建议首页链接在100个以内,链接的性质可以包含页面导航、底部导航、锚点文字链接等 - 扁平话的目录层次
尽量让“蜘蛛”只跳转3次,就能到达网站内的任何一个页面 - 导航优化
导航应该尽量采用文字方式,也可以搭配图片导航,但 标签务必添加 alt 和 title 属性,告诉搜索引擎导航的定位
<img src="" alt="" title="">
其次,在每一个网页上应该加上面包屑导航
对用户而言,可以让用户了解当前所处的位置,形成更好的位置感,并方便用户操作;
对蜘蛛而言,能够清楚的了解网站结构,同时还增加了大量的内部链接,方便抓取,降低跳出率。
- 结构布局的规范优化
a、页面头部:logo 及主导航,以及用户的信息
b、页面主体:左边面包屑导航及正文;右边放热门文章及相关文章,既增强了页面相关性,也增强页面的权重
c、页面底部:版权信息和友情链接
注意:分页导航推荐写法:“1 2 3 4 5 6 7 8 9 10 下拉框/输入框”,这样“蜘蛛”能够根据相应页码直接跳转,下拉框直接选择页面跳转
- 控制页面的大小
一个页面最好不要超过100k,太大,页面加载速度慢,用户体验不好,并且一旦超时,“蜘蛛”也会离开
2、网页代码优化
(1) title
标题,强调重点即可,尽量做到每个页面的
<title>英雄联盟全新官方网站-腾讯游戏</title>
(2) meta keywords
关键词,列举出几个页面的重要关键字即可
<meta name="Keywords" content="英雄联盟,lol,lol新手礼包,lol攻略,lol视频,lol视频攻略,英雄资料,英雄联盟战争学院,明星解说视频,101战争学院,英雄,攻略,WCG,点亮图标,赛事">
(3) meta description
网页描述,高度概括网页内容的关键词,每个页面也要有所不同
<meta name="Description" content="英雄联盟官方网站,海量风格各异的英雄,丰富、便捷的物品合成系统,游戏内置的匹配、排行和竞技系统,独创的“召唤师”系统及技能、符文、天赋等系统组合,必将带你进入一个崭新而又丰富多彩的游戏世界。">
(4) 标签语义化
比如:h1-h6是用于标题类的,<nav>标签是用来设置页面主导航的等
(5) a 标签
页内链接,要加“title” 属性加以说明,让访客和 “蜘蛛” 知道;
外部链接,链接到其他网站的,则需要加上 el="nofollow" 属性,避免“蜘蛛”爬了外部链接之后,就不回了
(6) 正文标题要用 h1 标签:
“蜘蛛” 认为它最重要,若不喜欢<h1>的默认样式可以通过CSS设置
(7) br
<p>第一行文字<br/>第二行文字<br/>第三行文字
</p>
(8) caption
表格应该使用 <caption> 表格标题标签
(9) img 应使用 “alt” 属性加以说明
(10) strong 和 em : 需要强调时使用
<strong>标签在搜索引擎中能突出关键词<em>标签强调效果仅次于 <strong>而 <b>、<i>标签: 只是用于显示效果时使用,在 SEO 中不起效果
(11) 避免使用 和 ©
空格符 应用 CSS 进行设置版权符 © 可以直接使用输入法打“©”
(12) 少用 iframe 框架,因为“蜘蛛”一般不会读取其中的内容
(13) 少用 display: none;
对于不想显示的文字内容,应当设置 z-index 或设置到浏览器显示器之外。因为搜索引擎会过滤掉 display:none 中的内容
原文连接
WEB前端-搜索引擎工作原理与SEO优化相关推荐
- php关键词分词搜索 最多匹配的排在最前面_百度搜索引擎工作原理,做Seo的建议看一看 - 蜘蛛池博客...
原出处:蜘蛛池博客 原文链接:百度搜索引擎工作原理,做Seo的建议看一看 - 蜘蛛池博客 从事SEO(搜索引擎优化)工作的人可以比喻成搜索引擎的贴身管家,作为一名合格称职的管家必须要了解所服务对象的习 ...
- 搜索引擎工作原理笔记
搜索引擎的工作过程大体可以分为三个阶段: 1.对网页进行抓取建库 搜索引擎蜘蛛通过抓取页面上的链接访问其他网页,将获得的HTML代码存入数据库 2.预处理 索引程序对抓取来的页面数据进行文字提取.中文 ...
- 图解搜索引擎工作原理
做SEO的,如果不懂搜索引擎的工作原理是很难恰当开展工作的.前几天给学生讲SEO课程中的搜索引擎工作原理时,很多同学表示不太懂.后来我画了搜索引擎主要工作流程的示意图给大家,很多同学表示"懂 ...
- Web缓存的工作原理
Web缓存的工作原理 所有的缓存都是基于一套规则来帮助他们决定什么时候使用缓存中的副本提供服务(假设有副本可用的情况下,未被销毁回收或者未被删除修改).这些规则有的在协议中有定义(如HTTP协议1.0 ...
- 一些零碎知识(域名、DNS、浏览器、动态静态页面、web应用系统工作原理)
域名: http://localhost:8080/practice(胡写的,用于说明问题) http:表明当前请求是http协议,所有的Java Web应用程序都是基于HTTP协议,HTTP全称Hy ...
- java gc的工作原理、如何优化GC的性能、如何和GC进行有效的交互
java gc的工作原理.如何优化GC的性能.如何和GC进行有效的交互 一个优秀的Java 程序员必须了解GC 的工作原理.如何优化GC的性能.如何和GC进行有效的交互,因为有一些应用程序对性能要求较 ...
- Web服务器的工作原理
了解WEB服务器的工作原理和相关概念是后台开发人员的必修课,这篇文章来自 : Web服务器的工作原理 很多时候我们都想知道,web容器或web服务器(比如Tomcat或者jboss)是怎样工作的?它们 ...
- 360、搜狗、必应搜索引擎排名规则与SEO优化怎么做?
上周五,一个微信好友问我什么时候写一篇必应SEO,其实我在做搜索也有关注必应排名,所以就来分享下,顺带也分享下360和搜狗的. 大纲如下: 1.为什么要关注除百度外其它搜索引擎? 2.360搜索引擎排 ...
- Google搜索引擎工作原理简介
实在是写不出来高质量的原创文章,今天再次转载一篇网络上看到的文章吧,叫Google搜索引擎工作原理简介,其中比较详细的介绍和分析了google搜索引擎相关工作机制,下面是原文内容: 这篇文章是基于Go ...
最新文章
- VC 文件操作大全,打开,保存,复制,删除,查找等
- 苹果部分机器将转向美国国内生产
- 最长有效括号—leetcode32
- 入门深度学习,其实并不难!
- Monster Hunter(2020南京M)
- 博士导师总结目标检测、卷积神经网络和OpenCV学习资料(教程/PPT/代码)
- 6个用好大数据的秘诀
- ios7学习之路七(隐藏虚拟键盘,解决键盘挡住UITextField问题)
- cadence allegro - 焊盘命名规则 -unfinished -unfinished-unfinished
- 用Qt实现一个桌面弹幕程序(六)-- -- 桌面客户端实现②
- Synopsys Formality 2018操作流程
- Practical Machine Learning with H2O.2016.12
- ShowWindow(SW_SHOWNORMAL)
- 手把手教你做一个数据图表生成器(附源码)...
- c语言菜单即功能,C语言 菜单专题
- 纪念2019年高教社杯全国大学生数学建模竞赛
- 用HTML5解析SWF演示,没有Flash插件照样播放Flash视频
- 不区分大小写的“包含(字符串)”
- 人工智能实验:动物专家系统python实现
- 计算机在言语康复的应用,一种儿童嗓音言语矫治的计算机技术