http://blog.csdn.net/sqh201030412/article/details/51211551

首先看一下从淘宝输入搜索关键字获取到的一些数据信息:

第一张:使用拼音的全程来查询
可以看到提示的是匹配的转换的拼音的方式,看最后一个提示项
这里还有一个在指定分类目录下搜索的功能,难道后台还存储的类目的信息?
还有一个标签的信息要存储

第二使用首字母来匹配 这里看不出来 淘宝的东西太多了,首字母直接有了对应的全程

第三使用切断字母的匹配 看的出来 走的还是完全匹配的路径

第四使用汉字匹配的方法 :  这个没得说的 这是主功能了

第五使用 拼音加汉字的方式: 能够匹配到 使用全部的拼音时 这里能看出来是使用了转换的方法了
先将汉字转为拼音 在去匹配

第六 这里使用部分  这个没啥问题 转成拼音后  shouta*
第七 这里应该是先转成拼音 为 stao 看下面一张图搜索结果是吻合的,但是结果太少了,
这里淘宝因该使用了另外的搜索机制了.如果这种方法搜索到的数量不够,那么就使用查询模式
即 再放一个分词的字段用来查询, 我想是分成一个一个的模式 也就是搜索 s 套了
这里不需要考虑顺序了 词中含有这两个就可以了 就是下面的结果了


这里和上面说的是一个道理 从这里 大家应按能猜出来 搜索shtao是没有结果的,可以验证下 如果有兴趣

这里看到没有提示结果,就是没有了
按照猜测出来的两种搜索方式

淘宝处理
对于拼音加汉字问题 应该是使用了双重查询 ,保证汉字是正确匹配的(应该使用的是当个分词字段)
然后再进行汉字转为拼音后的过滤,
学到一点解决拼音加汉字搜索建议的解决方法
新添加一个字段使用完全分词模式即 分成一个 一个 用来做汉字匹配过滤查询
然后再用汉字转拼音查询  当数量不够时再使用一次检索查询 含有关键字即可 不要求位置在首位

下面是自己的搜索建议改造拼音加汉字的改写

1.添加一个汉字单个分词的字段
schema.xml中配置
<fieldtype name="ng1_1" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.NGramTokenizerFactory" minGramSize="1" maxGramSize="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldtype>

<!-- 单个分词 保证汉字正确性-->
<field name="word_n1" type="ng1_1" indexed="true" stored="false"/>

<copyField source="word" dest="word_n1"/>
2.代码中添加过滤部分
//这里添加过滤--要包含的汉字--使用filter增加查询速度
if(StringFilterUtils.filterAll(q)!=null && StringFilterUtils.filterAll(q).trim().length()>0){
query.set(CommonParams.FQ, BaseSuggestIndex.Fd.word_n1.name()+":"+StringFilterUtils.filterAll(q).trim());
}

对比搜索条件




未优化前

优化后

可以发现汉字输入不正确,就不能出来提示了 下面是一些输入正确的出来的结果

solr入门之参考淘宝搜索提示功能优化拼音加汉字搜索功能相关推荐

  1. solr入门之參考淘宝搜索提示功能优化拼音加汉字搜索功能

    首先看一下从淘宝输入搜索keyword获取到的一些数据信息: 第一张:使用拼音的全程来查询 能够看到提示的是匹配的转换的拼音的方式,看最后一个提示项 这里另一个在指定分类文件夹下搜索的功能,难道后台还 ...

  2. 淘宝cp210X提示“VeriFone USB Modem”无法匹配驱动

    淘宝cp210X提示"VeriFone USB Modem"无法匹配驱动 前段时间,在淘宝上买了cp210X usb转串口芯片,安装-调试板驱动CP210x-Windows-Dri ...

  3. solr入门之拼音加汉字方式的搜索建议自动补全的不高效实现

    今天思考实现了下字符加汉字的搜索建议的 实现--思想主要还是昨天的思想,不过这个方法使用的是匹配查询 ,查询速度可能不太理想 /*** * @描述:用于完成拼音加汉字 组合情况的搜索建议 ---尽量少 ...

  4. 【淘宝SEO技巧】淘宝宝贝标题关键字优化

    淘宝宝贝标题关键字优化技巧 今天我们来分析一下淘宝关键字优化技巧,掌握搜索排名规则对新手店铺来说是非常有用的,它可以帮你带来想不到的生意.现在我们来讲讲其中的做生意的学问.使用什么办法能使你的店铺增加 ...

  5. 大神文章:【转载】淘宝CDN大规模并发优化学习和点评

    淘宝CDN大规模并发优化学习和点评 2012-07-11 11:51:12 标签:cdn 网站加速 linux相关 老男孩IT培训 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作 ...

  6. 弘辽科技:淘宝店铺至关重要的优化技巧总结

    原标题<弘辽科技:淘宝店铺至关重要的优化技巧总结> 当我们在淘宝购物时,淘宝会有一个搜索机制,那么淘宝商家该如何好好利用这个搜索机制,从而实现店铺流量的最大化呢?毋庸置疑,做好淘宝优化对淘 ...

  7. 淘宝商品库MySQL优化实践的学习

    淘宝商品库MySQL优化实践的学习 淘宝商品库是淘宝网最核心的数据库之一,采用MySQL主备集群的架构,特点是数据量大且增长速度快,读多写少,对安全性要求高,并发请求高.由于MySQL最初的设计不是用 ...

  8. 【入门数据分析】淘宝用户行为分析

    前言 分析目的:本文基于淘宝1年的交易数据对其用户行为进行多角度分析,对相关问题进行解释并提供建议. 分析工具:MySQL.excel 主要模型:AARRR模型 一.分析问题和思路 本文采用淘宝电商的 ...

  9. 淘宝千人千面背后的秘密:搜索推荐广告三位一体的在线服务体系AI·OS

    简介:揭晓三位一体的在线服务体系AI·OS,及其技术架构演进,技术概况,云原生产品与实践. 作者:阿里巴巴搜索推荐事业部高级研究员 沈加翔 一.三位一体的在线服务体系AI·OS介绍 AI·OS(Art ...

最新文章

  1. selenium:学习资源
  2. 【C++】C/C++ 中的单例模式
  3. 17 软件源_9成职场人支持“准点下班”,2020年度职场报告:工作是最大焦虑源
  4. layui如何隐藏弹出层关闭的按钮
  5. LeetCode 题 - 58. 最后一个单词的长度 python解答
  6. Android开发笔记(九十三)装饰模式
  7. Sql语句优化-查询两表不同行NOT IN、NOT EXISTS、连接查询Left Join
  8. python数据导出excel_Python方法将DBF文件导出到Excel代码示例
  9. 三大国产操作系统,到底哪个最好用
  10. maven配置阿里源
  11. 如何取得AS400访问,一窥究竟
  12. OutLook使用技巧
  13. 分析 BAT 互联网巨头在大数据方向布局及大数据未来发展趋势
  14. Microsoft Visual SourceSafe 6.0 关联VS
  15. 5G注册流程分级详解
  16. 音视频编解码流程与如何使用 FFMPEG 命令进行音视频处理
  17. WPF入门一:搭建WPF的开发环境
  18. 一个设想:什么是真正的云,及利用树莓派和cloudwall打造你的真正云中心
  19. 计算机配件内存计入什么科目,机器配件应计入什么会计科目?
  20. WIN10企业版系统安装(KB12特供版:采用大白菜启动盘)

热门文章

  1. 用html3d静态相册带音乐,抖音上很火的H53D立体动态相册效果
  2. 微信支付 商家转账到零钱 Api 过程
  3. 实现平台化小程序语音红包
  4. Gh0st通信协议解析
  5. http服务器与cgi交互过程
  6. 如何更改电脑密码?(Windows10为例)
  7. 英雄联盟官网所有英雄图片爬取策略
  8. 复刻顶刊实证论文!思路梳理+全数据源+python代码
  9. Python-Django毕业设计幼儿英语学习平台的(程序+Lw)
  10. computed vue 不 触发_vue computed使用注意