自动补全,英文叫autocomplete,好像也叫智能提示,就是用户在输入框敲一个字符会弹出下拉列表提示候选词给用户,方便用户输入,提升用户体验。

网上多是JS如何实现,用ajax请求拿到数据就可以了,这里分享一下后台实现的一些思路。如果对性能和效果要求不高的话,可以直接在数据库中用like的方式去匹配候选词集合;或者在一个检索系统上也可以通过查询前缀来facet结果,例如在solr中,可以直接URL上用select?fl=id,name&rows=0&q=*:*&facet=true&facet.field={$title}&facet.mincount=1&facet.prefix={$input}方式进行查询,其中{$input} 是你需要自动提示的前缀,{$title}是对某个字段进行提示。

如果对性能要求高,可以用solr的suggest component,其中用的就是lucene-suggest的Lookup实现,其中有好几种实现,都是要从solr的索引数据中遍历词表构建相应数据结构,配置可以到http://www.solr.cc/blog/?p=1025看下。

但几种实现都没有拼音提示中文的,如果需要按我们拼写习惯实现一些提示,可能就要自己动手了。对一个词语例如”上海”,我们需要对shanghai任意一个前缀都能匹配到,那么很容易就想到,对拼音建立一个字典树,那么任意前缀串都能找回这个完整的拼音串,当然也包括其他的可能,当我们找回这个拼音串,就可以找回原来的中文来。所以构建检索库的顺序是:

1. 中文拼音串转换,“上海”->shanghai ,“北京”-> beijing,“伤害”-> shanghai ……,于是我们可以得到“shanghai”->[上海, 伤害, 商海...], “beijing”-> [北京, 背景...] 这样的映射表M。

2.拼音串建立字典树T,可以直接利用lucene-suggest的Lookup的实现,比如FSTCompletion。

3. 对任意一个英文串,先到字典树T上查找出所有的原始拼音,然后到映射表M中找回中文,根据需要进行一些排序,比如这个query被查过的次数等等我们想要的排序方式。

如果是中文串,可以直接进行第2步, 或者转换成拼音后再做。中文词也可以进行一些辅音抽取比如北京也允许用bj搜。

如果只有头一两个字符,可能会在T上找到很多很多原串出来,所以字典树最好也能进行一些排序,FSTCompletion中就有权重设置,按中文长度越短的权重越大。

取出几十个前缀之后再在M中找回中文再排序,这个过程每次都要进行似乎比较浪费,能不能省掉?其实每次的结果都是固定的,只要在建立字典树的时候预先把排序做好了就可以了,比如shanghai 在其所有子串上都有一个[上海, 伤害, 商海...]排序好的列表,shang在其所有子串有一个[上级,商品,上海...]这样的。这样的话只要查到任何一个拼音前缀都能立马返回结果,提高效率。不过在实现上要稍微注意否则容易出错:对任一个拼音,其前缀串都跟着一个列表的引用,如果遇到重复的,就重新生成一个列表替换前面所有的引用,比如shanghai的所有8个前缀串都是[上海],但是有个新词shang 那么前5个串变成[上, 上海], 而shanghai的shangh,shangha,shanghai还是原来的。这个空间消耗也不小,所有可能的前缀至少要跟着一个引用,如果字符串多,那么生成大量的引用需要也非常占空间,字典树的实现也很消耗空间。在试过几种办法以后目前最省的办法,还是拼音串直接用hash查,value是这些诸如[上, 上海] 列表的引用,(64位JVM上引用是8字节,实际value是存一个int下标更省,key查询用trove高性能高节约) 。搞得有点复杂了,但查询性能肯定没问题。如果还想简单点,直接把“上海”分开成成shanghai, shangha,...s 之类的碎片进行lucene或solr索引也成。其实那1.2.3步性能也很够用了,还简单点

转载:http://blog.csdn.net/lgnlgn/article/details/8816218

php solr 智能提示,solr 自动补全(智能提示)原理与实现相关推荐

  1. Xcode6中Swift没有智能提示和自动补全功能

    今天在学习Swift的过程中,编写代码,发现没有智能提示和自动补全功能,一阵不适应,在网上溜达了下,找到了解决办法,测试可行 中文系统新建工程,copyright里有日期,2014年,"年& ...

  2. 华为快应用IDE:代码智能提示及自动补全

    代码编辑工具的代码智能提示/自动补全功能几乎是所有代码编写工具具备的基础功能. 华为快应用IDE自然不能少了如此便利的功能,Template模板.Script脚本.Style样式.Pair-Tages ...

  3. vs代码自动补全快捷键html,VSCode 自动补全(智能提示)

    自动补全(智能提示) 由于以前微软推出了typescript语言,结合tsd文件,用visual studio写typescript代码是至关爽的,智能提示的功能很是nb.html 这个功能理所应当也 ...

  4. VS Code Python 代码智能提示(自动补全)编译环境设置踩坑记录

    VS Code Python 编译环境设置踩坑记录 本菜鸡非常喜欢VS code的简洁风格,而且跟原来再用的VS2017相比简直不要太快,前段时间电脑重装之后又要在windows系统上重新搭建整套环境 ...

  5. 字符串匹配数据结构 --Trie树 高效实现搜索词提示 / IDE自动补全

    文章目录 1. 算法背景 2. Trie 树实现原理 2.1 Trie 树的构建 2.2 Trie树的查找 2.3 Trie树的遍历 2.4 Trie树的时间/空间复杂度 2.5 Trie 树 Vs ...

  6. Visual Assist x 无法自动补全Snippet提示的解决方法

    Visual Assist x 无法自动补全Snippet提示的解决方法 参考文章: (1)Visual Assist x 无法自动补全Snippet提示的解决方法 (2)https://www.cn ...

  7. IDEA 设置代码提示或自动补全的快捷键

    IDEA 设置代码提示或自动补全的快捷键 (附IntelliJ IDEA常用快捷键) 修改方法如下: 点击 文件菜单(File) –> 点击 设置(Settings- Ctrl+Alt+S), ...

  8. 【IDEA快捷键】IntelliJ IDEA 设置代码提示或自动补全的快捷键 (附IntelliJ IDEA常用快捷键)-2018.12.18-#转#

    –[转]:原博主博客链接_@jiaxian17 IntelliJ IDEA 设置代码提示或自动补全的快捷键 (附IntelliJ IDEA常用快捷键) 修改方法如下: 点击 文件菜单(File) –& ...

  9. solr 6.5 suggest 自动补全(解决单个字符无结果问题)

    solr的日常搜索大家都比较熟悉,稍微提升点的搜索就涉及到了自动补全.下面就亲身测试,说一下自动补全,使用的为solr 6.5版本. 在原有的solr搜索基础上增加自动补全,首先修改solrconfi ...

  10. sublime text3 智能提示和自动补全

    智能提示插件:sublimecodeintel 自动补全: 首选项--设置-用户--在配置中增加 "auto_close_tags": true

最新文章

  1. 2018.6.8-岁岁年年人不同
  2. 框架:初识Mybatis
  3. ASP.NET MVC5+EF6+EasyUI 后台管理系统(51)-系统升级
  4. 使用webpack配置react并添加到flask应用
  5. 计算机网络讨论4,计算机网络实验四
  6. 【ES】Mac 下安装ES 报错 Failed to create native process factories for Machine Learning
  7. 步进电机s型加减速计算工具_21个有关伺服电机的问题想当工程师的你一定得知道...
  8. linux tcp文件分包_畅谈linux下TCP(下)
  9. java自学经历分享
  10. java实现基于关键字的文件夹(文件)的搜索、文件夹(文件)的复制、删除
  11. IDEA中对Git的常规操作
  12. python3实现校园网认证客户端
  13. 谷歌服务安装包_安卓手机安装谷歌服务框架和Google Play傻瓜式教程 100%好用
  14. Linux命令之文件与文件夹的拷贝
  15. web前端工程师岗位职责和要求
  16. 微信公众号发送客服消息---菜单消息,卡片消息
  17. java 退格符,Java退格键
  18. 德银天下港交所上市:市值39亿港元 陕汽集团是大股东
  19. windows server 2016添加开机启动项
  20. 【数据机构】最短路径之Dijkstra算法(迪克斯特拉算法)

热门文章

  1. 现成的icon 图标
  2. 新司机的黑裙战斗机 篇一:硬件选购及开箱装机
  3. 单片机学习:dq坐标系
  4. 有谁喜欢玩msn里面的西洋跳棋?
  5. GPS时间和UTC时间的区别
  6. 基于CubeMX+STM32F405RGT6+freeMODBUS_RTU的移植
  7. 正式对外开放!趣链区块链平台最新试用版都有哪些惊喜?
  8. android最好的游戏,7最好的本地多人游戏Android | MOS86
  9. Python继承初始化问题
  10. c语言与python的语法区别_来自python的C语言(基本语法),从,Python,看,基础,篇