10月20-10月24日,多媒体方向学术盛会ACM Multimedia 2021 于中国成都正式召开。阿里巴巴淘系技术与浙江大学联合举办的直播中多模态商品识别Workshop暨第二届淘宝直播商品识别大赛圆满结束。

淘系技术通过该 Workshop 开源了业界首个大规模的多模态视频商品检索数据集,并联合浙江大学教授庄越挺、悉尼科技大学教授杨易、天津大学教授韩亚洪等国内外知名学者发起多模态检索领域的国际挑战赛,旨在共同推动电商直播场景中多模态商品检索识别的研究和 AI 技术在实际应用场景中的落地。

在电商应用场景中,淘系技术通过直播商品识别算法,实现淘宝直播过程中商品和直播讲解点的有效关联,让消费者可以通过点击商品跳转观看该商品的真人讲解,实现边看边买的沉浸式消费体验。而直播间讲解商品多,视觉相似程度高,直播场景复杂度高,给直播中商品检索识别带来巨大的技术挑战。如何基于直播内容的理解,进行多模态商品检索和识别,是非常值得研究并需持续投入的课题。

基于淘宝直播数据构建的多模态视频商品检索数据集Watch and Buy (WAB),淘系技术于4月27日正式发起第二届淘宝直播商品识别大赛,相较与第一届大赛,在赛题设计上引导选手注重全类别的识别效果,特别是长尾的商品类别、视觉纹理简单商品的识别等,另一方面更加强调多模态信息(主播讲解语音、商品标题)等信息在精确识别视觉相似讲解商品中的重要性。

本届赛事共吸引来自北京大学、清华大学、中科院、卡耐基梅隆大学、伦敦大学、南京大学、浙江大学等全球知名高校学者组成的587支队伍参加,历经3个月的激烈追逐,最终来自中科院计算所、北京大学、中南大学组成的队伍分别获得本赛事的冠军、亚军和季军。

其中来自中科院计算所的冠军队伍的F1分数高达0.69,超过baseline0.22,Top3队伍的F1分数均超过0.6。在论文征集部分,workshop共接收了5篇论文,包括两篇long paper,三篇short paper。

Watch and Buy Challenge & workshop 成果总结

直播中多模态商品识别Workshop于10月20日下午在成都举行,聚集了来自海内外的计算机视觉领域专家们带来了精彩分享。

其中包括新加坡国立大学计算机学院的KITHCT讲座教授Tat-Seng Chua分享的“Deep Visual Analytics: Towards more Effective Multimodal Retrieval, QA and Recommendation”的keynote talk,

北京航空航天大学的刘偲副教授以“Cross Modal Intelligence Analysis and Generation”为主题的学术报告,

还有来自悉尼科技大学青年研究员朱霖潮主题为 “Challenges and Opportunities of Multimodal Understanding”的学术报告,

由淘系技术高级算法专家陈志文带来题为“Industrial Practice of Multimodal Video Content Understanding”的工业实践分享。

来自中科院、北大、中南大学、清华、华中科技大学的五位同学进行了口头报告,分享了他们的参赛方案和成果。

阿里巴巴淘系技术资深算法专家李晓波表示,“淘宝拥有最大规模的商品库,淘宝直播作为直播领域的先行者,实现通过直播的方式更好连接商品和消费者。在这个过程中,如何通过 AI 的能力,更好的理解视频直播内容,提升用户边看边买的消费体验是我们一直的追求。本次 workshop 通过提供真实的多模态商品识别的应用场景、数据,希望能够促进更多学术和工业的结合,激发更多创新研究和技术落地。”

本届ACM MM 2021 的大会 co-chair,来自浙江大学的庄越挺教授也表示,“阿里巴巴提供了真实的高质量的直播商品检索场景和数据,能够让学术界很好的参与到这个问题中。”

✿  拓展阅读

作者|淘系技术

编辑|橙子君

出品|阿里巴巴新零售淘系技术

多模态视频商品检索记录再刷新!第二届淘宝直播算法大赛完美落幕相关推荐

  1. 200万奖金广聚天下算法英雄,第二届广州·琶洲算法大赛要来了!

    随着深度学习不断驱动技术创新,人工智能加速与实体经济深度融合发展.作为中国首个自主研发.开源开放的产业级深度学习平台,飞桨与百度自研的产业级知识增强文心大模型,共同构筑了产业智能化基座,并联合产学研用 ...

  2. 2021第二届全球工业互联网算法大赛-榜单

    比赛链接: http://iiac.vip/ 比赛榜单: 其中关键:总的冠亚季军中,两位都是分赛道亚军,而且强调了商业. 所以答辩ppt一定按照要求,能多则多

  3. 淘宝直播商品识别大赛开幕,助力视频多模态商品检索技术再升级

    阿里巴巴淘系技术与浙江大学深度合作,在多媒体领域顶会ACM Multimedia 2021举办直播中多模态商品识别workshop暨第二届淘宝直播商品识别大赛,共同推动电商直播场景中多模态商品检索识别 ...

  4. 淘宝直播商品识别大赛

    赛题链接: https://tianchi.aliyun.com/competition/entrance/231772/information 开篇之前,感谢队友的倾情付出,以及不离不弃.把我队友的 ...

  5. 【天池大赛】淘宝直播商品识别

    点击我爱计算机视觉标星,更快获取CVML新技术 背景介绍 直播带货是淘宝连接商品和消费者的重要方式,买家在观看直播的过程对喜爱的商品进行购买. 在单场直播中,主播常常会对成百上千的商品进行展示.试用和 ...

  6. 第二届网刃杯网络安全大赛 Writeup

    第二届网刃杯网络安全大赛 Writeup 前言 MISC 玩坏的XP * ISC ncsubj carefulguy easyiec xypo7 喜欢移动的黑客* LED_BOOM* 需要安全感* c ...

  7. 弘辽科技:淘宝直播如何扣分?在哪里查询扣分记录?

    原标题<弘辽科技:淘宝直播如何扣分?在哪里查询扣分记录?> 淘宝直播是现在一种很热门的营销推广方式,很多淘宝商家都采取这个营销方式,去挑选专业主播来配合自己店铺商品的销售.而淘宝平台为了创 ...

  8. 记录我在北上广做淘宝的日子

    仅以此文记录我在广州做淘宝的日子,不管失败也好,成功也罢,当我再次回首的时候,知道自己做了些什么,成功了希望能够给大家些启示,失败了,也希望从中吸取教训. 本人11年大学毕业,对自己的大学生身份无任何 ...

  9. 媒体智能-淘宝直播流媒体互动实践 | D2 分享视频+文章

    背景:今天给大家带来的分享主题是<媒体智能-淘宝直播流媒体互动实践>,内容分为5个部分,首先看看在淘宝直播的直播间里主播可以怎样给用户拜年:然后具体讲如何制作一个手势拜年的特效:接着介绍我 ...

最新文章

  1. 使用谷歌 Colab Notebooks,这 6 个小技巧你需要掌握
  2. Android之基于xmpp openfire smack开发之openfire介绍和部署[1]
  3. mysql 类似wm concat_oracle的wm_concat()和mysql的group_concat()合并同列变成一行的用法以及和concat()合并不同列的区别...
  4. 【Redis】Redis 事务
  5. 2.css hack 大全【转】
  6. 冲突域和CSMA/CD
  7. 4.JUC-共享模型之无锁
  8. DIOR数据集转COCO格式 paddlepaddle
  9. 使用mmdetection做实例分割
  10. 使用Javascript实现Dropdownlist级联操作中遇到的两个错误
  11. 常见的概率公式及其推导(马尔科夫HMM系列课程拓展)
  12. 程序员常用远程工具有哪些?
  13. ArcGIS Pro教程 | 1#数据准备
  14. oracle数据库基本命令使用汇总
  15. 清理电脑,使其加速!
  16. Spline算法实现
  17. CCPC-Wannafly Summer Camp 2019 全记录
  18. 单片机开发与Linux开发区别
  19. 医学免疫学 Chapter4:抗体
  20. XJOI1133百鸡问题

热门文章

  1. 台式电脑怎么看计算机型号,在电脑上如何查看自己电脑硬件的型号
  2. 【500强外资金融科技中心】Seeking研发(Java/React Native)/测试/DevOps/项目管理/架构师
  3. 红米3s进不了recovery_红米3s卡刷教程_红米3s用recovery刷第三方系统包
  4. 这是一个关于女码农减肥的思考
  5. UE4打包导出文件打开没反应
  6. 三类器械计算机信息管理系统,三类医疗器械计算机管理系统要求
  7. linux QQ无法显示图片和自定义头像
  8. 重温CSS3常见新特性的奥秘(个人总结)
  9. Linux CentOS7 安装Oracle11gR2
  10. 电磁波的定义和来源guokr