• 单词多形态(Word Stemming)

  单词多态,主要是关系到单词的词根( stem of a word )和通过这个词根变化出来的多个词的过程(Word Stemming),比如,works, 词根是work,可以变成Worker,Workers,Working,Worked等。搜索引擎可以利用这个特点进行词根匹配搜索。但它不是指“近义词”。

  • 断词(Word Truncation)

  断词是取单词的一部分加上通配符进行搜索。比如:Wor* 可以搜索出Work,Worker,Working等等的单词。

  • 近义词(Synonyms)
近义词非常容易理解,就是意义相近,或者意义相同但叫法不同。比如“知了”和“蝉”等。
据了解,Google不支持Word Stemming和Word Truncation。百度也有不少新的语法,可能大家都不知道,可以多去了解一下,比如用“-”号表示排除等。

(博客中都为原创,引用请注明出处,风焰庄主)

转载于:https://www.cnblogs.com/fyan888/archive/2007/09/14/SearchEngineer.html

搜索引擎中用到的一些拆词方式解析相关推荐

  1. sphinx+coreseek+php扩展--用php程序实现中文拆词

    ##################### 一  mariadb 安装 ##############                     使用的是yum安装 略 ################# ...

  2. ElasticSearch 6.3版本(ES)查询人名关键字不拆词查询

    ElasticSearch 6.3版本(ES)查询关键字不拆词查询:类似mysql 的 like 语句. mysql的sql语法类似如下,采用大量like和locate语法,进行模糊查询,导致查询一个 ...

  3. Android网络之数据解析----SAX方式解析XML数据

    ​[声明] 欢迎转载,但请保留文章原始出处→_→ 生命壹号:http://www.cnblogs.com/smyhvae/ 文章来源:http://www.cnblogs.com/smyhvae/p/ ...

  4. 前端html继承的方式,好程序员web前端教程之JS继承实现方式解析

    好程序员 web 前端教程 之JS 继承实现方式解析 , JS 是 Web 前端三要素之一,也是每一个初学前端的同学遭遇的第一条拦路虎.很多人反应 JS 学习不易,各类知识点概念及应用常常让人抓耳挠腮 ...

  5. 网络营销外包对于搜索引擎策略性调整网络营销外包专员如何解析

    对于长期从事网站优化行业的站长而言,每天最重要的事情就是通过搜索网站关键词获取检索结果,当搜索引擎算法有相关策略性调整时,站长可及时发现,通过这些策略性调整分析为网站所带来的变化和影响.那么搜索引擎在 ...

  6. POI以SAX方式解析Excel2007大文件(包含空单元格的处理) Java生成CSV文件实例详解...

    http://blog.csdn.net/l081307114/article/details/46009015 http://www.cnblogs.com/dreammyle/p/5458280. ...

  7. web程序前后台功能实现_好程序员web前端教程之JS继承实现方式解析

    好程序员web前端教程之JS继承实现方式解析,JS是Web前端三要素之一,也是每一个初学前端的同学遭遇的第一条拦路虎.很多人反应JS学习不易,各类知识点概念及应用常常让人抓耳挠腮.在接下来的北京Web ...

  8. springboot实现条形码_Springboot转发重定向实现方式解析

    1.转发 方式一:使用 "forword" 关键字(不是指java关键字),注意:类的注解不能使用@RestController 要用@Controller @RequestMap ...

  9. 【DotNet加密方式解析】-- 好文收藏

    索引: 目录索引 By -- 彭泽 一. DotNet加密方式解析--散列加密 笔记: 散列加密种类: 1.MD5  128位 2.SHA-1  160位 3.SHA-256  256位 4.SHA- ...

最新文章

  1. 安卓constraintLayout中app:srcCompat设置的图片显示不出来
  2. 重装华为服务器系统软件,服务器系统重装软件
  3. 改变NumericStepper控件上下箭头的外观.
  4. 敏捷软件开发:原则、模式与实践(C#版)
  5. 什么是SAP CRM的Custom Transaction Context
  6. C ++或Java,高频交易哪个更快?
  7. Linux重置Mysql密码_解决MySQL for Linux错误 ERROR 1045 (28000): Access denied for user ‘root‘@‘localhost
  8. Python3 安装 mysql-python 与ImportError: No module named 'ConfigParser'报错解决方法
  9. ltp-ddt的makefile结构
  10. JAVA-SWING:生成透明JTable的改进1
  11. python集成学习算法_python: 一句话说机器学习算法和调参-集成学习篇
  12. 安装包制作工具 SetupFactory 详解
  13. 泛函分析 04.01 有界线性算子 - 有界线性算子与有界线性泛函
  14. 问遍大佬,看遍百文,呕心沥血整理出的一线最值得加入的互联网大厂,必收藏
  15. 【视频编码】【Vue】【明星开源项目】| Chat · 预告
  16. ​神经结构搜索中的遗传算法
  17. iosepub阅读器_epub格式电子书阅读器 iOS版
  18. 【BFS】lydsy3161 孤舟蓑笠翁
  19. 短短六年时间冲到二奢品类第一,妃鱼如何做到的?
  20. HTML的简单页面加密代码

热门文章

  1. 资源向导之 quot;APUEquot;
  2. 记一次AD域域管理员密码更改导致某系统群集管理器故障排查解决过程
  3. 【02】查询优化的技术范围
  4. .NET - Diving into System Programming - Part 2[转贴]
  5. 问题 D: 自动拨出电话的程序
  6. 图像金字塔:高斯金字塔vs拉普拉斯金字塔
  7. Linux下的squid代理服务器——正向代理、反向代理(cdn加速)
  8. Oracle期末考试总复习资料
  9. 加权回归估计_比率估计与回归估计
  10. Paradigm 已对 NFT 艺术品铸造和收藏协议 ZORA 进行投资