深度学习核心技术精讲100篇(五十)-爱奇艺逗芽表情搜索分析与实践
前言
随着互联网时代的发展,表情包成为现在大家网上交流的必备工具,针对表情搜索的产品需求,经历了从ElasticSearch到Lucene再到结合语义的搜索实践之路。不同阶段的技术选型可能可以为大家提供一些中小体量业务垂直领域搜索的落地思路。
逗芽表情搜索
爱奇艺逗芽表情(https://douya.iqiyi.com)是一款通过视频AI算法算法,针对UGC、PGC等来源进行表情图片生产,并在爱奇艺内外部多渠道分发的创新产品。用户通过文字输入搜索好玩有趣的表情图片是逗芽的核心功能之一。
通过文字进行表情搜索常见的请求类别包括:
1. 实体名称,比如热门的明星名、角色名、影视剧名等,以及实体的别名与缩写;
2. 偏口语化的感情、动作描述,如“开心”,“抱抱”,“想睡了”等;
实体与动作的组合,如“加油蔡徐坤”,“虞书欣说的好”;
流行的梗、短语,如“奥力给”,“专业团队”,“我是谁我在哪”;
表达完整含义的句子,如“你好,很高兴认识你”。
深度学习核心技术精讲100篇(五十)-爱奇艺逗芽表情搜索分析与实践相关推荐
- 深度学习核心技术精讲100篇(十九)--GBDT(梯度提升树) 和 Resnet (残差网络)的原理
残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确:在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强.这 ...
- 深度学习核心技术精讲100篇(十五)-搜索引擎Indri系列之安装及使用
前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发. 安装 下 ...
- 深度学习核心技术精讲100篇(十四)-一文带你看懂GPflow的前世今生
什么是GPflow GPflow是一个高斯过程的工具包,接口部分由python实现,内部的部分计算则由Tensorflow实现. 主要特点有二个:一是使用变分推理作为近似方法,二是使用自动微分进行求导 ...
- 深度学习核心技术精讲100篇(十二)-DCGAN(对抗生成网络)算法应用及代码实现
前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法.原来背后有一个极为有意思的算法思想--对抗生成. 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN ...
- 深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能
前言 之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法--stacking.翻译成中文叫做模型堆叠,接下 ...
- 深度学习核心技术精讲100篇(十六)-搜索引擎Indri系列之如何建立索引 (Indexing)检索评价 (Evaluation)
前言 在为文档集建立索引时,需要执行IndriBuildIndex path-to-to-index_parameter_file.这里的index_parameter_file是xml格式的参数文件 ...
- 深度学习核心技术精讲100篇(十八)-巨量数据下美团是如何实现数据治理的?
背景 大数据时代的到来,让越来越多的企业看到了数据资产的价值.将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台. 但这里要特别强调一下,如果在大 ...
- 深度学习核心技术精讲100篇(五十八)- 如何量化医学图像分割中的置信度?
前言 在过去的十年里,深度学习在一系列的应用中取得了巨大的成功.然而,为了验证和可解释性,我们不仅需要模型做出的预测,还需要知道它在做出预测时的置信度.这对于让医学影像学的临床医生接受它是非常重要的. ...
- 深度学习核心技术精讲100篇(三十五)-美团餐饮娱乐知识图谱——美团大脑揭秘
前言 " I'm sorry. I can't do that, Dave." 这是经典科幻电影<2001: A Space Odyssey>里HAL 9000机器人说 ...
最新文章
- windows系统安装airflow模块(一)
- mysql统计不及格科目_SQL语句 统计各个学生的不及格科目数量及不及格率 ,2条语句...
- 《The Elements of User Experience》读书笔记
- Struts2 - Check Login Interceptor
- 基于Hadoop生态技术构建阿里搜索离线系统
- 【蓝桥杯】基础练习 十进制转十六进制
- tslib 编译移植步骤
- python迭代器和生成器_Python之迭代器和生成器
- Centos7.1 命令行与图形化界面登陆
- 无法访问虚拟机tomcat网页
- 相册权限_手机相册太乱?1分钟教你快速管理自己的照片,非常好用!
- 区域显示触发_Nature Communications:地幔数据显示可氧化的火山气体的减少可能触发了大氧化事件...
- Git master branch has no upstream branch的解决
- Linux命令学习手册-gpg命令
- python计算圆的体积_python计算圆周长、面积、球体体积并画出圆
- 蓝牙打印 设置打印样式_双编辑模式 打印自由更轻松!——海鸟贴纸打印机蓝牙按键版体验...
- 三人表决器程序c语言,“三人表决器”逻辑功能PLC程序设计(有梯形图 指令表)...
- 阿里云云计算工程师认证(ACP)分享
- linux命令行连接蓝牙音箱,有些Linux发行版用蓝牙连接天猫精灵和小爱音箱没声音...
- 为什么可以做Shopyy独立站
热门文章
- 【转载】struts应用在断网情况下启动报错解决办法(java/net/AbstractPlainSocketImpl.java:178:-1)...
- 初学java之菜单条,菜单,菜单项的设置
- asterisk-通道变量列表
- nginx+memcached+captcha_server实现验证码服务器
- IOS使用通知回调方法
- 请教于国富律师——怎样把灰鸽子病毒和灰鸽子程序区分开
- CSP认证201612-3	权限查询[C++题解]:模拟题、结构体、set、有点复杂
- 《现代操作系统》第4章读书笔记--文件系统(未完成)
- c语言调用shell命令一 popen使用以及获取命令返回值
- linux mysql 5.6.22_linux下MySQL5.6.2安装过程