简介:社区内容通常包括UGC和PGC。由于关键词和内容多样性丰富、用词规范程度参差不齐,这就要求搜索引擎对关键词和内容进行智能语义分析,通过机器识别出用户查询的真正意图,找到最全面最相关的结果进行需求满足。本文和大家详细介绍如何通过“开放搜索”在社区论坛场景的应用,带来更多的业务转化,以提升整体业务收入。

案例背景

某技术社区作为国内的中文IT内容社区,致力于为中国软件开发者提供知识传播、在线学习、职业发展等全生命周期服务,旗下包括多款产品。

自开始接触阿里云开放搜索产品,在一年的时间里逐步上量,陆续接入PC端、移动端的多个平台,覆盖首页搜索、博客、下载、问答等细分业务的频道搜索。通过开放搜索,为旗下产品的用户提供高质量的搜索服务,并通过搜索能力的优化带来更多的业务转化,以提升整体业务收入。

内容搜索场景需求:

»更多的曝光机会——空结果率低;
»更好的搜索质量——搜索相关性高;
»更丰富的业务特征——结合业务特性调整搜索结果;
»更全面的配套功能——智能纠错、下拉提示等配套能力;
»更低的拥有成本——相较自建搜索引擎更低的TCO成本;
»更便捷的开发使用——上线周期短,降低搜索引擎开发、效果调优难度;

以某论坛社区为例,产品线覆盖多个平台,包含网页、APP、小程序等形式,同时业务上区分多个频道。随着业务的发展,首页综合搜索(后简称“主搜”)的流量越来越大,各种付费、引流业务接入,对搜索流量的运营变得更加重要,对主搜的业务诉求越来越多,需要聚合多个频道的内容,同时搜索结果相关性要求更加精准,在考虑文本相关性的前提下,要加入更多的商业因素考虑,如eCPM等。
成熟的搜索引擎涉及离线模块、在线模块、查询理解服务、算法平台等系统组成,所需大量开发、算法调优以及持续的复杂运维工作,由于人力有限,社区论坛经过多方竞品调研和产品试用,最终接入阿里云开放搜索。

开放搜索最佳实践


更符合IT行业的查询理解功能
在核心索引上配置使用针对IT行业定制了词权重模型,纠错模型,改写模型等,扩大召回结果,精准命中需求;

排序优化
- 排序表达式应用
支持制两轮相关性排序规则来准确控制搜索结果的排序。第一轮为基础排序(粗排),从命中的文档集合里海选出相关文档。第二轮为业务排序(精排),对粗排的结果做更精细筛选,支持任意复杂的表达式和特征函数应用,方便更准确控制排序效果,优化系统性能,提高搜索响应速度。定制CTR点击率预估模型,实现更智能的排序效果.

- 算法调优-人气模型
人气模型是淘宝搜索最基础的排序算法模型,计算量化出每个产品的静态质量及受欢迎的程度的值,将人气模型引入到排序表达式中,可构建更精细化的排序模型;

- 高级定制排序插件-Cava语言
更强的灵活性和定制能力:Cava提供了较表达式更加丰富的语法功能支持及时编译满足更多个性化的业务需求。

搜索引导功能

下拉提示
是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
下拉提示实现了基于用户文档内容的query智能抽取,可以通过中文前缀,拼音全拼,拼音首字母简拼查询以及汉字加拼音,分词后前缀,中文同音别字等查询下拉提示的候选query

业务价值

对比客户基于开源自建的服务CTR提升超过80%
• 经迭代,开放搜索返回的搜索结果首位点击率高于某D站内搜索服务的点击率,期间多日点击率高出3%

配置前后效果对比

以上就是社区论坛行业开放搜索最佳实践的内容。

原文链接:https://developer.aliyun.com/article/780957?

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

社区论坛行业搜索最佳实践相关推荐

  1. 新零售行业搜索最佳实践

    简介:本文通过新零售客户案例带大家了解零售电商.生鲜电商线上业务搜索中的行业特性,以及如何通过开放搜索电商增强版解决方案构建智能搜索服务,快速实现各项指标的提升,为业务带来了更多新的机会. 客户背景 ...

  2. 文娱行业搜索最佳实践

    内容搜索的价值主要体现在两个方面: 对用户而言,用户将搜索作为寻找内容的工具,目标是"搜的到,搜的准".用户更关心搜索结果的相关性.时效性和多样性. 对平台而言,搜索是内容消费.流 ...

  3. 基于MaxCompute+开放搜索的电商、零售行业搜索开发实践

    简介:搜索一直是电商行业流量来源的核心入口之一,如何搭建电商行业搜索并提升搜索效果,一直是电商行业开发者努力攻克的难题.基于传统数据库或开源引擎虽然能够搭建基础搜索服务,但随着商品数据的增多和业务流量 ...

  4. 阿里云全站加速在游戏行业的最佳实践

    在全民加速节第二场在线直播课堂中,阿里云CDN解决方案架构师研一进行了<全站加速在游戏行业中的最佳实践>主题分享,针对游戏行业中的一些特点和痛点,介绍阿里云全站加速产品的核心功能以及实现方 ...

  5. (流式、lambda、触发器)实时处理大比拼 - 物联网(IoT)\金融,时序处理最佳实践

    标签 PostgreSQL , 物联网 , 传感器 , lambda , 调度 , 实时 , 流式更新 , UPSERT , insert on conflict do update 背景 越来越多的 ...

  6. 腾讯云AI应用产品总监王磊:AI 在传统产业的最佳实践

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 背景:5月23-24日,以"焕启"为主题的腾讯"云+未来"峰会在广州召开,广东省各级政府机构领导.海 ...

  7. 腾讯云AI应用产品总监王磊:AI 在传统产业的最佳实践 1

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 背景:5月23-24日,以"焕启"为主题的腾讯"云+未来"峰会在广州召开,广东省各级政府机构领导.海 ...

  8. 京东云的云原生理念及 Serverless 最佳实践

    在云原生技术全面爆发之前,我们开发的应用可以被称为非云原生应用,非云原生应用并没有考虑到应用的弹性和规模性,甚至很多都不具备扩展性,当业务规模扩大时,特别依赖硬件的升级,进而带来了很多问题.云原生的出 ...

  9. 前沿分享|阿里云高级技术专家 王若(百润): 数据库游戏行业最佳实践

    简介:在游戏的开发和运营当中,数据库的使用场景非常多.面对游戏访问压力.游戏合服场景.游戏排行榜等场景, 阿里云为用户提供了最佳解决方案. 本文从三个方面来为大家介绍数据库游戏行业最佳实践: 游戏架构 ...

最新文章

  1. 使用Maven的assembly插件实现自定义打包
  2. 控制iOS的导航栏和状态栏的样式
  3. STL容器底层数据结构的实现
  4. 为ESXI 添加ISCSI存储设备 Linux服务器系统
  5. c# xls 复制一行_c# – 将excel工作簿中的第一行复制到新的Excel工作簿
  6. C/C++文件字符串处理
  7. python考试题目及答案-python面试真实笔试题,带答案(1-10题)
  8. hive xmlserde_各种数据格式的Hive建表语句
  9. 滴滴java开发面试题_最新Java面试题汇总,看完这些面试文章足够了
  10. python消息模块_python - psutil 系统信息模块
  11. 如何复现论文中的算法
  12. canvas画钟表demo
  13. 如何使用python刷博客浏览量---第一种方法
  14. SEO分析关键词策略
  15. 关于减肥的科学理解和准则
  16. iphone11没有锁屏声音_iphone11屏幕解锁按键音怎么关闭-互盾苹果恢复精灵
  17. 电脑Svchost.exe 进程占CPU100% 的解决办法
  18. 大数据优化服务 黑科技创造价值 智慧旅游来势猛
  19. 【微博技巧】绕开微博绑定手机注册微博
  20. USB3.0 、 Firewire S3200 、 eSATA

热门文章

  1. 值得学习练手的22个Python迷你程序(附代码)
  2. Python爬取京东笔记本电脑,来看看那个牌子最棒
  3. python获取当时文件目录_python获取文件目录
  4. 程序猿之歌 PHP,1024丨腾讯第一首程序员之歌【Code代码】
  5. python开发config层_Python全栈开发:configparser模块
  6. 我的世界光影mod怎么用_用“戏剧化”光影艺术 唤醒千年沉睡世界!
  7. stm32f4 输出pwm波_stm32的pwm输出代码及注释
  8. beego 快速入门
  9. springboot学习笔记1:springboot入门
  10. 会话技术(session/cookie)