简介:本文重点介绍"开放搜索"中的排序表达式的配置及特征性函数的应用

某新闻资讯平台,在内容搜索场景中需要满足业务多样化,个性化的需求,在query改写配置好后,希望在排序阶段进行优化,实现强大的相关性排序效果,提高用户点击率。今天会结合几个典型场景该如何来思考和设计排序因子,和大家详解特征性函数的应用

Query在开放搜索的执行流程

开放搜索排序表达式配置


接下来给大家分析几个常见的排序优化需求:

场景1:查询词和召回字段匹配程度排序优化
案例:当用户搜索“药品公司”,分词数量为2个:药品,公司,在召回结果包含的查询词分词个数相同情况下,如何把title“药品公司”排在“药品杭州分公司”的前面那?

开放搜索解决方案:应用排序相关性特征函数项field_match_ratio查询词的分词个数与召回字段的总词组字个数比值,比值越低,排序分越高.

详细用法:https://help.aliyun.com/document_detail/51287.htmlspm=a2c4g.11186623.6.626.64786ab8OOs7hM

场景2: 标签特征权重在“个性化”排序召回中的应用
案例: 当用户搜索"吃鸡",可能是游戏吃鸡内容搜索,也可以能是新闻内容搜索,如何把用户更感兴趣的游戏内容排到前面那?

开放搜索解决方案:匹配文档和请求中的标签tag_match 函数,用于对查询语句和文档做标签匹配,使用匹配结果对文档进行算分加权;
• 通过长时间的积累能获知每个用户的兴趣标签,可以和内容/商品标签对应,做到“个性化”排序
• 实现对用户感兴趣的帖子加权,把用户更感兴趣的内容/商品排到前面;
假设文档内容共有如下10类型的标签:
1-财经, 2-科技 ,3-体育 ,4-娱乐 ,5-时尚, 6-教育 ,7-旅游 ,8-游戏 ,9-科普 ,10-医疗
如果想将“8-游戏”标签的文档在前面展示,可设置tag_match函数



适用场景:此函数不仅试用于内容搜索场景,同样适用商品搜索场景,满足个性化商品排序
其他案例和用法:https://developer.aliyun.com/article/775488

场景3:根据查询词在title和body的紧密程度排序优化
案例:搜索"黑色幽默",意图是搜索title“周杰伦《黑色幽默》的歌曲”,但在数据库里有条文本body记录为“下雨了,天空是灰黑色的,即便幽默的人此时也比较烦闷”,导致这条记录也被召回,并且排序也比较靠前, 如何将title字段的紧密度在排序中起主导作用?

开放搜索解决方案:为了使这条不太相关的body记录排序靠后,title字段排序靠前, 可以使用fieldterm_proximity函数获取文档紧密程度的得分来实现. 此函数用来表示关键词分词词组在字段上的紧密程度,紧密度越高,排序分越高。精排公式写为:fieldterm_proximity(title)*10 + fieldterm_proximity(body)
详细用法:https://help.aliyun.com/document_detail/51281.html?spm=a2c4g.11186623.6.621.3c0938de1kdUfp

场景4:内容时效性
案例:用户对时间的敏感度越高,那么越希望得到新的内容,内容的时效性和整体的满意度直接相关,如何优化排序配置,满足内容排序的时效性敏感度?

开放搜索解决方案:运用函数timeliness--时效分,用于衡量文档的新旧程度, 值越大表示时效性越好
详细用法:https://help.aliyun.com/document_detail/51270.html?spm=a2c4g.11174283.6.636.121f5a19EWuQQM

场景5:关键词(分类、标题、作者)相关性排序优化
案例1:搜索“子女”,优化前排序结果“女装靴子/裤子/叶子”排在“预测子女性别”的前面,如何运用排序表达式优化把"子女"最相关的内容排序靠前那?
案例2: 在精排中对title和body进行文本算分,权重比为3:1

开放搜索解决方案:在精排中进行文本算分,关键词在字段上的文本匹配度-text_relevance函数,匹配度越高,分值越高,排序越靠前.
详细用法:https://help.aliyun.com/document_detail/51280.html?spm=a2c4g.11186623.6.635.287e42c3whTeg9


以上就是阿里云开放搜索内容行业"排序表达式及特征函数”的应用案例,如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~

https://free.aliyun.com/product/opensearch-free-trial

原文链接:https://developer.aliyun.com/article/779309?

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

内容搜索排序表达式的最佳实践相关推荐

  1. 排序字段设计_内容搜索排序表达式的最佳实践

    简介:本文重点介绍"开放搜索"中的排序表达式的配置及特征性函数的应用 某新闻资讯平台,在内容搜索场景中需要满足业务多样化,个性化的需求,在query改写配置好后,希望在排序阶段进行 ...

  2. 标签权重在个性化搜索排序中的最佳实践

    个性化搜索需要满足: • 具备较强的语义理解能力,精准命中搜索需求: • 满足搜索关键词和内容的多样性特点,可根据用户行为优化排序,实现个性化搜索: 例如: a. 搜索"吃鸡",可 ...

  3. 谷歌翻译结束了中国大陆业务;投资炼金术!用户投资交易辅助系统;矢量搜索应用指南与最佳实践;可调整参数的AI绘图插件;前沿论文 | ShowMeAI资讯日报

  4. 5万字长文:Stream和Lambda表达式最佳实践-附PDF下载

    文章目录 1. Streams简介 1.1 创建Stream 1.2 Streams多线程 1.3 Stream的基本操作 Matching Filtering Mapping FlatMap Red ...

  5. android最佳实践:网络 电池 压缩

    翻译此篇文章,总共加起来有6个小时.有些英文长句,里面包含的各种从句,需要借助翻译软件才勉强理解,但是其实文章中还是会有大量不是特别流畅的语言,有两个地方需要提高,一是写作的语言组织表达能力.二是一个 ...

  6. 社区论坛行业搜索最佳实践

    简介:社区内容通常包括UGC和PGC.由于关键词和内容多样性丰富.用词规范程度参差不齐,这就要求搜索引擎对关键词和内容进行智能语义分析,通过机器识别出用户查询的真正意图,找到最全面最相关的结果进行需求 ...

  7. 阿里飞猪个性化搜索排序探索实践

    导读:旅行类商品 ( 如机票.火车票.汽车票 ) 相对实物电商更加标品,用户决策因素更加单一,而行业内大多基于简单规则排序,如时间.价格或业务逻辑加权,难以满足用户的个性化出行需求.飞猪在过去一段时间 ...

  8. Transformer 在美团搜索排序中的实践

    美团搜索是美团 App 连接用户与商家的一种重要方式,而排序策略则是搜索链路的关键环节,对搜索展示效果起着至关重要的效果.目前,美团的搜索排序流程为多层排序,分别是粗排.精排.异构排序等,多层排序的流 ...

  9. 新零售行业搜索最佳实践

    简介:本文通过新零售客户案例带大家了解零售电商.生鲜电商线上业务搜索中的行业特性,以及如何通过开放搜索电商增强版解决方案构建智能搜索服务,快速实现各项指标的提升,为业务带来了更多新的机会. 客户背景 ...

最新文章

  1. 深入理解JVM读书笔记--内存管理
  2. 物联网产业链及市场分
  3. MIPS SDE简介
  4. MyCat学习:使用MySQL搭建主从复制(一主一从模式)
  5. 看完微信抢红包算法你就明白,为啥你不是手气最佳
  6. 一个简单的WPF字体选择器实现
  7. html如何获取消息实体的长度,50道js面试题 XXXXX
  8. ubuntu下oracle数据的导入,Ubuntu下Oracle10g的导入与导出
  9. idea64.exe.vmoptions 参数意义
  10. 云上直播性能优化及测试方案详解
  11. android+开发平板应用,Android平板应用开发教程
  12. 增强安全性、支持跨页逻辑关系设定的电信运营级EnableQ在线问卷调查引擎V1.60来了......
  13. Huffman编码之文件的解/压缩
  14. Mars3D开发教程学习步骤(不定时更新
  15. 全球顶尖公司的七大设计理念
  16. Veritas NetBackup8.1.1安装
  17. xssgame第九关至第十关
  18. 为什么在大多数OS中都引入”打开“这一文件系统调用?打开的含义是什么?...
  19. wkhtmltopdf乱码解决方案
  20. 看未来的企业是如何解决潜规则的

热门文章

  1. 四十、ETL工具的输入步骤
  2. 最真实的办公自动化案例!
  3. 5 款可替代 du 命令的工具!
  4. 危!我用python克隆了女朋友的声音!
  5. 又跌!6月全国程序员工资新统计,太扎心
  6. 面试项目亮点_怎样在面试中更好地介绍自己的项目经验?
  7. GAN生成对抗网络-CycleGAN原理与基本实现-图像转换-10
  8. [视频教程] 使用composer安装使用thinkphp6.0框架
  9. LeetCode 726. 原子的数量
  10. 自学linux指令分析-find