在修改的码的同时我阅读并参考了一下其他搜索系统的算法。

由于目前我们的任务进度略快,给我们留下的修改时间还有一些,我准备对match算法进行进一步的修改。

参考了网上一遍关于百度搜索的文章。

发现了一些值得参考的地方,如下。

。。。

舍弃一些枢纽字: 寻找出那些搜索时很少用到的枢纽字:!!

A:在英文里,在搜索引擎大小写是没有区别的。

B:拼写错误的枢纽字是没用的,但是找到一个常常泛起拼写错误码的词可以额外埠进步你的访问量

C:去除那些停用的词,在英文里有“the, for , a ,” 等。中文里有“的,地,你,我”等。

D:没有人会用“最好的”,“疯狂的”等词语进行搜索。假如你的网站里有类似的词,最好把他去除。

选择最佳枢纽字:

假如你按照上述所说,你一定列出了一大堆的枢纽字。尽管,你已经去除了一些没人使用的。但是对于你来说仍是太多了。现在是时候进入枢纽字优化的最后一步了。

提示:
试着用剩余的枢纽字在搜索引擎中进行搜索,不要把焦点放在最流行的枢纽字上。有时候,次枢纽字排名起来仍是比较轻易的。由于最流行的枢纽字会存在着更多的竞争对手,而次枢纽字反之。在选择枢纽字时的技巧是找出枢纽字需求与枢纽字竞争的平衡点,即所选枢纽字竞争不是很激烈。

title 标签
title 标签可能是你网页中最重要的标签,它是你网页中最先看到的部门。把它放在description 与 keyword前。在这个标签中最好是加上你网站的枢纽字,title标签在搜索引擎的搜索中据有非常重要的地位。最好是把它放在其他meta标签前,这更有利于你网站的排名。(留意:有些搜索引擎会按title标签的字母的优先权进行排名,尽量在你的title中使用开始的字母)title标签是人们在搜索引擎中第一个看到有关你网站的描述,所以尽量把它弄得简朴、明了。让人一看就知道你的网站是关于什么的。

Description标签

Description标签就在title后面,该标签可以是一小段(一个或者两个句子)。用于描述你网站。与title标签一样,这也是人们在搜索引擎列表中链接到你网站的点击。这些描述将鼓动人们去浏览你的网站而不是你竞争对手的。(描述不能太夸张。不然,当访问者到你网站发现内容根本不是你说的那个样子,那么他很快就会退出去。)良多搜索引擎答应描述的字数在150个左右,所以你要保证你的描述在150以下,否则搜索引擎会自动把多余的部门剪去从而造成你网站的描述的不完整。搜索引擎以为描述里的枢纽字远比网页中的内容要重要(似乎现在这种情况不是那么显著了)。真如上所述,这里提供了非常重要的信息:确定你的描述能准确的反映你网站的主题,尽量在描述中加入你主要的枢纽字,越靠meta的枢纽字意义越大。这样会突显你的枢纽字。
现在大多的搜索引擎(google除外)都会支持descriptin标签。假如你不使用的话你将会失去排名靠前的可能。

keyword 标签

比拟于description与title标签,keyword标签显得并不是那么重要了。有些搜索引擎把它完全地忽略,但是使用下准确的keyword标签对进步排名仍旧有效。

除了搜索引擎外,一般情况下人们是看不到的。keyword标签是一个躲藏的标签,向搜索引擎提供了一组与你的页面有关的的枢纽字或枢纽短语列表。你可以用相应的工具找出一系列合用于你网站的枢纽字。(留意:枢纽字标签中只能包括与你本页内容相关的枢纽字列表。所有在这里的枢纽字必需与页面的内容相联系。)

提示:在你每一个页面中组织相关的枢纽字,每个页面必需专注于不同的产品或者内容。在标签中列满枢纽字对于进步你网站的排名并没有好处。多个枢纽字间用逗号用隔,逗号表示是逻辑“或”的意思。空格表示逻辑“与”。这是正式在keyword标签中描述枢纽字必需的。尽管如斯,良多搜索引擎也会把枢纽字间以空格分开以达到能搜索出更相关的结果的目的。这样做的意义是,搜索引擎会把空格分开的枢纽字根据一定的方式自由组合。可以尝试用两种方法,看哪一种更加适合你。

枢纽字不宜以统一形式重复3-6次,一般这已经以为是最大的枢纽字重复数(似乎现在又发生了变化)。所以,尽量避免把你的枢纽字一次又一次地不断重复。这对于每一个搜索引擎来说是SPAM(枢纽字垃圾),你会因此而受到惩罚。大多数的搜索引擎会答应你在keyword标签中使用最多 1000个字符。通常,对每一个页面使用相关连的枢纽字会进步你网站的排名。一个很重要的因素是你枢纽字冗余度,假如你一个枢纽字是一个字符,而你的 keyword标签中有100个字符,那么你枢纽字的冗余度就为1%。搜索引擎将会利用相关的算法对你的枢纽字冗余度进行统计你网页中的每一个重要的词或短语。去除多余的枢纽字有利于进步你网站的排名。

基本搜索引擎优化策略:

为什么有的网站能在搜索引擎上排名很好,而有的却连找到找不到呢?这个秘密何在呢?正如免费搜索引擎上的指导方针所说,有五个因素你是必需铭记于心的:

1、 你网站的内容与主题。

2、 每页的枢纽字数。

3、 枢纽字放置的位置。

4、 点击量。

5、 链接数目。

1、 搜索引擎优化策略:网站内容

网站的实际内容是SEO策略的一个重要的因素。假如你想让你的网站在搜索结果中排得靠前,在你的网站中必需有实际的内容。搜索引擎的蜘蛛基本上是一个瞎子。他们只能对你网页内容进行判定你网站的质量,而不能从图片、flash动画上判定。在所有的页面中有充足的内容给搜索引擎进行索引是一个成功搜索引擎优化策略的基本需要。很轻易明白,为什么一个没什么内容的网站很难排上去。人们在查找信息的时候,老是但愿找到一个包括良多重要信息的网站。很天然,网页内容丰硕的网站要比那些网页内容还那么丰硕的网站排名要好得多。每个为他们的网站进行优化的站长请牢记:不要健忘更新你的网站。不管是搜索引擎仍是访问者都但愿看到比较新的信息。这是什么意思呢?这就要求你要收集大量的信息,专注于这领域的变化。

2、搜索引擎优化策略:枢纽字密度

枢纽字密度 (Keyword Density)是指在一个页面中,枢纽字(keyword)或枢纽字段(keyphrase)占所有该页面中总的文字的比例,该指标对搜索引擎的优化起到枢纽的作用。为天然进步在搜索引擎中的 排名位置,您网站中页面的枢纽字密度不能过高,也不要过低,一般在 1% 到 7% 较为合适。假如要达到 1% 的比例,那么您在均匀100 个文字中最好包含 1 个枢纽字或枢纽字段,假如在 1000 个文字中仅仅只包含 1 个枢纽字或枢纽字段,那么枢纽字密度就被稀释了。记住,您千万别把所有的枢纽字或枢纽字段堆积在一起,要不搜索引擎将人为是一种恶意行为(Spam), 直接降低您网站的排名位置。

3、 索引擎优化策略:凸起枢纽字

在有价值的地方放置枢纽字,当你统计完你的页面需要多少个枢纽字后,接下来就是考虑把你的枢纽字放在网页的什么地方。凸起枢纽字是吸引搜索引擎留意的一个最重要的因素。搜索引擎将会专注于你网页中某一部门的内容,处于这一关注部门的词语显得比其他部门的词语要重要得多。这就是所谓的“凸起枢纽字”。

搜索词处理

  用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索词进行处理,如中文特有的分词处理,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。

我接着会在舍弃枢纽字方面对算法进行改进。

转载于:https://www.cnblogs.com/DOOM-scse/archive/2012/11/02/2751964.html

Daily Report 2012.11.2 刘宇翔相关推荐

  1. Daily Report 2012.11.9 刘宇翔

    今天的任务并不多. 和李忠把展示页面的功能填满. 把匹配函数又进行了一些修改和修正. 之后的工作剩下的就很少了. 之后可能会帮助做其他没做好的模块. 转载于:https://www.cnblogs.c ...

  2. Daily Report 2012.11.06 刘宇翔

    今天对李忠修改过的match函数进行测试,修正bug,并进行优化. 将中文分词方法加入到算法中,提高了算法的精确度. 但中文分词方法加入到算法后,出现在一些新问题,对新出现的问题进行了修正和优化. 测 ...

  3. Daily Report 2012/11/09 陈伯雄(step 9)

    今天的工作是完成把之前建立的倒排索引和数据库搜索匹配模块嵌入到主体工程中,等待运行和测试. 但是,现在的数据库搜索方法精度还不够,天真把每个关键词一视同仁地处理了,这样的后果可能回造成用户搜索体验不佳 ...

  4. Daily Scrum 2012/11/08

    @TeamSH-IT 今天经完成了之前在数据定义存在一些问题.sui老师经过小组之间的交流,完成了对数据定义的最终版.周末将进行初步的整合和测试. 详细的完成情况: 组员 今天任务 明天任务 Hu R ...

  5. Daily Scrum: 2012/11/27

    成员 角色 今天工作 明天计划 王安然 PM, Dev 讨论决定了AI的策略问题,编写了一部分ProfileManager类(304) 继续进行ProfileManager类的编写(304) 黄杨 P ...

  6. [转]结队编程——软件测试报告 10061178 刘宇翔 10061148 彭笑东

    软件测试报告 结队成员: 10061178 刘宇翔 10061148 彭笑东 测试软件:微软必应词典客户端 版本:1.6.2.0 (BETA) 环境:win7 旗舰版,x32,Intel(R) Cor ...

  7. 还款每个月90.85元, 到 2012年10月,2012 11月 2256元,共 5799.25元

    还款每个月90.85元, 到 2012年10月,2012 11月 2256元,共 5799.25元

  8. mysql基本操作 [http://www.cnblogs.com/ggjucheng/archive/2012/11/03/2752082.html]

    创建表 简单的方式 CREATE TABLE person ( number INT(11), name VARCHAR(255), birthday DATE ); 或者是 CREATE TABLE ...

  9. 关于驰骋表单引擎中字段扩展设置对文本框Pop窗体返回值的升级说明 2012/11/13...

    为什么80%的码农都做不了架构师?>>>    关于驰骋表单引擎中字段扩展设置对文本框Pop窗体返回值的升级说明 2012/11/13 现有功能: 以前版本仅支持自己定义url,返回 ...

最新文章

  1. ubuntu系统安装FTP
  2. linux之sed命令的用法
  3. jQuery快速入门专题
  4. (Linux 日常命令)[20171225]
  5. Log4J入门教程(三) maven构建
  6. C语言多项式乘法模拟,急!!!!c语言:求n次多项式的加法和乘法
  7. linux date输出到文件,Linux常用命令--ls、cd、date用法
  8. accdb 用户类型未定义_Python早期设计与开发:数字类型的设计缺陷
  9. oracle怎么自定义排序,查询时怎么根据一个自定义的函数来进行排序
  10. CSS(网页样式语言)基础,网页CSS设计样式基础知识点 小白教程
  11. 移动安全-iOS(三)
  12. Spring的数据库编程浅入浅出——不吹牛逼不装逼
  13. 多播报文的发送和接收
  14. 【面试】不容错过的12个深度学习面试问题
  15. 元素可视区client系列(附实例)
  16. Adobe Fireworks CS4 序列号(注册码)
  17. 黑白群晖为Plex添加证书,开启HTTPS访问
  18. golang语言环境搭建
  19. 库存数量控制中储备定额方法的改进与实现
  20. ROSLAUNCH 的.launch/XML 语法

热门文章

  1. java基础知识的一些细节问题
  2. php 返回josn 中文,php返回json数据中文显示不友好的问题的解决办法
  3. apk ionic 破损_ionic3-android打包完美解决
  4. python3socket非阻塞在linux里无效_利用Python中SocketServer实现客户端与服务器间非阻塞通信方法介绍...
  5. 安卓7.0海信定制版新增功能
  6. GDAL对空间数据的管理
  7. JavaScript——this与箭头函数
  8. Arcgis Javascript那些事儿(十)--发布网络分析服务
  9. Apache中配置ASP.NET环境
  10. java中类模型_java中的数据模型类