阿里巴巴淘系技术与浙江大学深度合作,在多媒体领域顶会ACM Multimedia 2021举办直播中多模态商品识别workshop暨第二届淘宝直播商品识别大赛,共同推动电商直播场景中多模态商品检索识别的研究和AI技术在实际应用场景中的落地。

本次大赛邀请浙江大学教授庄越挺、悉尼科技大学教授杨易、天津大学教授韩亚洪等国内外知名学者,阿里巴巴淘系技术内容中台负责人吴桂林(梁舒)、内容算法负责人唐海红(飘雪)、多媒体算法负责人李晓波(篱悠)等企业技术专家,优秀一线青年研究员浙江大学汪晓晗博士和淘系技术燕保明博士为技术指导和评审,由大数据竞赛平台天池承办。

直播电商已经成为连接商品和消费者的重要方式,淘宝直播自上线以来连年保持高速增长,2020年带来的GMV更是超过人民币4000亿元。经过多年的不断创新和实践,淘系技术通过直播商品识别算法,实现淘宝直播过程中商品和直播讲解点的有效关联,让消费者可以通过点击商品跳转观看该商品的真人讲解,实现边看边买的沉浸式消费体验。目前,淘宝直播每日有数以万计的主播/直播使用该技术产品。

在实际应用中,直播间讲解商品多,视觉相似程度高,直播场景复杂度高,导致讲解过程中会存在商品形变、被遮挡、模糊等情况,给直播中视觉检索识别带来巨大的技术挑战。如何利用直播画面的理解,并且有效结合主播讲解的语音、商品的标题文本描述等多模态信息,进行多模态商品检索和识别,是非常值得研究并且需持续投入的课题。

为了推动行业直播的多模态商品识别技术发展,我们依托淘宝直播海量数据,开源了业界首个大规模的多模态视频商品检索数据集Watch and Buy (WAB)。该数据集包含70,000个由直播视频片段和对应讲解商品构成的匹配对,具有规模大、标注全、模态多、功能广的特点。我们抽取视频片段若干关键帧和商品的全部商品图进行了实例框级标注,商品id数达82,173个,标注图像数达1,042,178张,检测框实例1,654,780个。框级标注信息丰富多样,包括商品的检测框、类别、视角、展示方式、同款编号等。

除了视觉标注,我们还对主播讲解语音进行了人工文本转录,同时提供了商品的标题文本信息。该数据集可用于物体检测的算法、商品重识别算法、主播意图识别、跨模态检索和多模态检索等多种算法的研究。为了方便国际选手参赛,对数据集中的中文部分,我们提供了文本分词和预训练的词向量表示,大大降低了比赛选手的参赛限制。

首届淘宝直播商品识别大赛于2020年3月启动,共吸引到海内外近2000支队伍参加,涌现的优秀方案有效提升Baseline方案指标达20%,赛后优秀方案经过与作者团队的通力合作,优化后在淘宝直播场景上线。

淘宝直播商品识别大赛2021较与第一届,在赛题设计上特别优化并引导选手注重全类别的识别效果,特别是长尾的商品类别、视觉纹理简单商品的识别等,另一方面更加强调多模态信息(主播讲解语音、商品标题)等信息在精确识别视觉相似讲解商品中的重要性。相信本次大赛,能够促进选手在多模态商品识别大赛中提出新的方法和技术,持续激发视频多模态检索领域的技术创新研究。

  • Workshop主页:https://sites.google.com/view/wab2021

✿  拓展阅读

作者|淘系技术

编辑|橙子君

出品|阿里巴巴新零售淘系技术

淘宝直播商品识别大赛开幕,助力视频多模态商品检索技术再升级相关推荐

  1. 媒体智能-淘宝直播流媒体互动实践 | D2 分享视频+文章

    背景:今天给大家带来的分享主题是<媒体智能-淘宝直播流媒体互动实践>,内容分为5个部分,首先看看在淘宝直播的直播间里主播可以怎样给用户拜年:然后具体讲如何制作一个手势拜年的特效:接着介绍我 ...

  2. 上海交大牵手淘宝成立媒体计算实验室:推动视频超分等关键技术发展

    7月27日,上海交通大学电子信息与电气工程学院与阿里巴巴集团大淘宝技术宣布达成战略合作,共同成立上海交通大学电子信息与电气工程学院-淘宝(中国)软件有限公司媒体计算联合实验室(下称"联合实验 ...

  3. 淘宝直播连续3年增速150%以上 一年喊了2.27亿句“宝宝”

    过去一年,直播电商成为业内最为关注的潮流之一,更是成为消费者最新的购买方式,也带火了很多网红.据悉,过去1年淘宝直播间里喊了2.27亿句"宝宝".最新数据显示,淘宝直播连续3年增速 ...

  4. 淘宝直播2020年GMV4000亿,直播电商第一梯队出位还是出局?

    直播带货已成为近年来最热的"风口",不管是明星.主持人亦或是企业家纷纷加入直播带货行列,摇身一变立马变成带货达人,而直播带货也已成为电商升级的新突破口. 有人说淘宝直播不仅是让人上 ...

  5. 弘辽科技:淘宝直播客服应掌握的技巧有哪些?

    原标题<弘辽科技:淘宝直播客服应掌握的技巧有哪些?> 电商平台的发展壮大,衍生了许多与电商或是淘宝相关的职业.淘宝主播是很多人渴望的职业,因为觉得只要看着手机说话就行,但每个行业都是看似简 ...

  6. 淘宝直播怎么放小视频?能一直播放视频吗?

    要开淘宝直播的话,首先要确定直播内容,选好主播,然后准备好直播的工具,确定好直播的时间.而且还要对后台的操作很熟悉.那淘宝直播怎么放小视频? 不允许播放视频,而淘宝直播之间的内容要求是实时直播内容,不 ...

  7. 淘宝直播商品识别大赛

    赛题链接: https://tianchi.aliyun.com/competition/entrance/231772/information 开篇之前,感谢队友的倾情付出,以及不离不弃.把我队友的 ...

  8. 【天池大赛】淘宝直播商品识别

    点击我爱计算机视觉标星,更快获取CVML新技术 背景介绍 直播带货是淘宝连接商品和消费者的重要方式,买家在观看直播的过程对喜爱的商品进行购买. 在单场直播中,主播常常会对成百上千的商品进行展示.试用和 ...

  9. 多模态视频商品检索记录再刷新!第二届淘宝直播算法大赛完美落幕

    10月20-10月24日,多媒体方向学术盛会ACM Multimedia 2021 于中国成都正式召开.阿里巴巴淘系技术与浙江大学联合举办的直播中多模态商品识别Workshop暨第二届淘宝直播商品识别 ...

最新文章

  1. swift_040(Swift闭包声明与用途)
  2. 国货美瞳相继完成资本融资,网络推广下美瞳是否能成为下一个国货爆品?
  3. 王道408数据结构——第八章 排序
  4. maven 常量字符串过长_从基于Maven的Web应用程序获取版本字符串
  5. Synergy如果timeout的可能原因
  6. 关于QQ非会员发图限制
  7. 中国农业工作服行业市场供需与战略研究报告
  8. 反思 大班 快乐的机器人_幼儿园大班体育课教案《小熊斗怪兽》含反思
  9. tecplot 360 2018 R1 R2安装教程及软件百度云
  10. iOS安装包瘦身小记
  11. 数学基础知识总结 —— 2. 常用积分公式
  12. 电脑连接wifi后,显示 无Internet 安全
  13. 数据科学入门与细分数据领域盘点
  14. 中年妇女xxx_2019年国际妇女节庆祝活动
  15. windbg查阅资料(持续更新)
  16. 1353016-70-2,DBCO-acid, DBCO-COOH,Dibenzocyclooctyne-acid酸官能化的环辛炔衍生物
  17. pytorch中nn.Embedding和nn.LSTM和nn.Linear
  18. l1-norm loss l2-norm loss (l1范数和l2范数作为正则项的比较)
  19. 迅搜 php,XunSearch(迅搜) | 搜索
  20. 35岁研发经理,月薪5W+,每年涨薪6-8K,特别焦虑,网友评论区吵翻了

热门文章

  1. 分析DAT与MPG文件格式的区别
  2. Python爬全国邮政编码的程序
  3. 漏洞5万美元一个贵不贵?
  4. 我真的没读野鸡大学!是他们不好好起名字!
  5. iOS-AVPlayer的简单使用
  6. 以女大学生相亲为例,给你讲明白数据挖掘算法
  7. 计算机语言栏怎么打开,语言栏不见了怎么办,详细教您win7系统语言栏不见了怎么办...
  8. 简洁商务风公司产品介绍通用PPT模板
  9. 嵌入式培训机构背后不为人知的故事
  10. 使用COM简单操作IE