2021欧洲杯足球赛近日“姗姗来迟”,牵动了无数球迷的心。精彩的球赛视频背后,令人意想不到的是 AI 技术正在重塑体育视频产业的内容生产方式。

在近期举办的国际计算机视觉与模式识别顶会 CVPR 2021 上,视频理解领域最具影响力的 International Challenge on Activity Recognition (ActivityNet) workshop 旗下多个竞赛公布榜单。竞赛吸引了百度、阿里、字节跳动、腾讯、华为等知名企业和清华、北大、斯坦福、麻省理工学院、中科院等国内外高校和机构参与。其中,全球首个以足球比赛视频的全方位理解为目标的 SoccerNet-v2 足球视频理解竞赛中,百度研究院以绝对优势夺取了全部两项任务的冠军。

百度拿下全部两项任务冠军01:49

视频链接:

https://baidu-ai-ar-1512380202189-8487.bj.bcebos.com/%E8%B6%B3%E7%90%83%E6%88%90%E7%89%87%2B%E5%AD%97%E5%B9%95-6-29-1.mp4

本届竞赛所使用的 SoccerNet-v2 数据集在足球理解领域规模最大,包括500场来自2014到2017年三个赛季的欧洲足球五大联赛和欧洲冠军联赛的视频,视频总时长达到764小时,人工标注达30万个,成为国际 AI 团队间衡量足球视频理解能力的重要标准。

双任务项目夺冠 大幅提升基线平均 mAP

本届 SoccerNet-v2竞赛下设了事件定位(action spotting)和回放溯源(replay grounding)两个任务。其中,事件定位(action spotting)是从足球比赛实况转播视频中找到一些关键事件并确定其发生的时刻。关键事件包括17个类别,涵盖进球、点球、任意球、红牌、黄牌、角球等重要事件,以及犯规、越位、射正、射偏等人类也难以立刻分辨的事件。同时有一部分事件甚至并未被直接拍摄到,需要根据上下文来推测,这也是对视频动作识别和事件检测能力的一个挑战。

回放溯源是(replay grounding)是把足球比赛转播视频中的回放片段和原始事件进行匹配。在足球比赛视频中一个精彩事件发生之后往往有多次回放,且回放和原始事件之间可能会相隔长达上百秒,拍摄视角也经常不同,能否将回放片段和原始片段匹配是对超长距离视频理解能力的一项考察。

百度研究院图文转视频 VidPress 团队专注于算法研究和应用创新,此次拿下两项任务的冠军,展现出了超群的技术实力。系统采用两阶段的方法,首先特征提取器提取足球视频特征,再将提取出的特征作为第二阶段具体任务模块的输入,进行事件定位或者回放溯源。

事件定位和回放溯源的系统流程

在特征提取阶段,团队认为在足球视频上微调过的特征提取器更有利于提升事件定位和回放溯源两个下游任务的表现,因此在 SoccerNetv2 数据上微调了五种预训练的特征提取器模型:TPN、GTA、VTN、irCSN 和 I3D-Slow。这五种特征提取器模型均是最近年来视频理解领域在分类任务上表现优异的模型,在标准数据集 Kinetics-400 上 的成绩也名列前茅。

在五种特征提取器模型之上,团队也充分利用数据,设计了多种微调特征提取器模型的策略、开发了提取特征的新方法。得到每种特征提取器在足球视频上提取的特征后,将五种特征连接起来并做了归一化处理,使得优化后的特征对足球比赛视频具有强大表达能力,为后面的下游任务打下了坚实基础。

在事件定位和回放溯源阶段采用了 Transformer 结构。Transformer 架构的特点是更清晰、更标准化、模型容量大、扩展性强,能适应计算机视觉、自然语言等多种业务。Transformer 结构在这两个任务中体现了对视觉语义特征的精确的时序处理能力,优于基线算法中 Siamese 网络的学习能力和训练速度。在训练过程中,事件定位采用了 mix-up 数据增强,更高效利用了训练数据、降低过拟合。在回放溯源的任务上,模型结构的更换使得训练时间减少到原来的八分之一。

结合前述的视觉信息语义化特征,以及为新的任务订制的 Transformer 结构,百度研究院在竞赛成绩上取得了较大幅度的领先。在事件定位任务上,把基线的平均 mAP 由52.54%提升到74.84%,提高了22.3个百分点,是第二名提升的近两倍;在回放溯源的任务上,把平均 mAP 由基线的40.75%提升到了71.90%,提高了31.15个百分点,比第二名63.91%的成绩高出8个百分点。

技术“照进”现实应用 智能视频生成工具应运而生

百度研究院之所以能够在该项竞赛中脱颖而出,离不开基于大规模视频数据的算法能力技术积累。

该项技术有非常高的实用价值,可以大规模应用于体育赛事视频中,通过对全场比赛进行智能识别,可以在不需要人工介入的条件下,精准、实时地切分出进球、射门、犯规等动作片段。

基于此项能力,团队开发出了一系列应用工具并成功落地。

首先是行业领先的自定义足球精彩集锦生成工具。输入球员后选定比赛场次,即可自动生成这个球员的精彩瞬间视频集锦以及慢动作回放。目前这一系统已经落地在百度百科400多个足球球员和球队页面。

输入球员名称+比赛名称,生成该球员的视频集锦

其次,将文本语义理解与视频图像理解贯通,团队还搭建了足球图文战报一键转换视频平台。输入文字直播内容或者直播间地址,就能智能聚合生成对应的视频内容,提高了战报的生成效率和可读性。

根据文字直播内容智能生成对应的片段视频

此外,团队还建立了基于图像场景识别的智能视频生产线,该生产线可以快速理解上传的长视频,检测是否有进球、精准定位视频中的进球瞬间,并完成自动剪辑。

上传一段比赛视频,自动识别生成进球片段

基于在智能视频技术上的不断创新和积累,百度研究院在2020年初孵化推出了智能图文转视频工具 VidPress,是业界首个支撑通用型、大规模的全自动视频生产技术。 VidPress 能够支持图文链接一键导入,自动自动实现配音、字幕、画面的视频内容生产,降低素材搜集、整理、匹配的时间成本。目前 VidPress 已作为百度大脑智能创作平台中的核心能力,为人民日报等多家媒体机构的智能视频生产赋能;为秒懂百科智能生成上千条球员精彩瞬间视频;为百家号和好看视频等平台的终端用户提供一键视频生成服务。百度大脑智能创作平台基于自然语言处理、知识图谱、视觉、语音的整合技术能力,为创作者提供多项能力,助力新闻生产的策、采、编、审、发全流程,全面提升内容生产效率。

全视频时代到来,各行各业对视频的应用、体验和效能都提出了全新升级需求,智能视频变化趋势背后的驱动力少不了 AI 的身影。无论是足球比赛视频,还是其他内容丰富、形式多样的视频内容,未来百度也将持续在相关领域的技术上不断突破迭代,并持续赋能应用与产品落地,为视频行业的发展与变革注入充足动力。

百度AI开发者社区https://ai.baidu.com/forum ,为全国各地开发者提供一个交流、分享、答疑解惑的平台,让开发者在研发路上不再“孤军奋战”,通过不断地交流与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开拓应用场景,赶快加入百度AI社区,你对 AI 的所有畅想,在这里都可以实现!

扫描下方二维码,添加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~

百度VidPress Sports团队获SoccerNet-v2足球视频理解竞赛双料冠军相关推荐

  1. 清华计算机系超算团队,清华超算团队第5次获得世界大学生超级计算机竞赛总冠军...

    原标题:清华超算团队第5次获得世界大学生超级计算机竞赛总冠军 中新社北京5月17日电 (记者 马海燕)记者17日从清华大学获悉,清华学生超算团队获得2018ASC世界大学生超级计算机竞赛(ASC18) ...

  2. 字节跳动获CVPR2021 细粒度图像竞赛双料冠军

    允峰 发自 凹非寺 量子位 报道 | 公众号 QbitAI 当我们还对玫瑰.月季和蔷薇傻傻分不清楚的时候,计算机视觉已经可以在一万种极其相似的自然界物种里精确地分门别类了. 图像分类是计算机视觉领域一 ...

  3. SIGGRAPH 2022最佳技术论文奖重磅出炉!北大陈宝权团队获荣誉提名

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 转载自:新智元 |  编辑:David [导读]SIGGRAPH ...

  4. 中国团队狂揽5项大奖!北航团队获2021 ACM MultiMedia唯一最佳论文奖

    来源:新智元 又一场计算机学术盛会落下帷幕! 10月24日,2021 ACM MultiMedia会议顺利闭幕.会议公布了多个奖项:包括最佳论文奖.最佳学生论文奖.最佳Demo奖.最佳开源奖等9个奖项 ...

  5. 百度母婴技术团队—基于Reactjs实现webapp #1

    百度母婴技术团队-基于Reactjs实现webapp #1 Open my-fe opened this Issue 2 days ago · 16 comments Labels None yet ...

  6. 如何攻克目标检测?百度全球顶级会议双料冠军团队有话说!

    计算机视觉最火方向是什么? 当然是目标检测啦! 目标检测,是计算机视觉领域的核心问题之一,近两年全球顶会的相关论文达上百篇,受到越来越多的人关注.无论是做人脸识别.自动驾驶.文字检测.人机交互,都离不 ...

  7. 清华计算机系超算团队,关注 | 清华大学学生超算团队获国际超级计算机竞赛世界大学生超算竞赛总冠军...

    原标题:关注 | 清华大学学生超算团队获国际超级计算机竞赛世界大学生超算竞赛总冠军 请输入标题 bcdef 德国当地时间6月21日,国际超算竞赛(ISC17)世界大学生超级计算机竞赛总决赛在德国法兰克 ...

  8. 港科夜闻|香港科技大学吴宏伟教授团队获国家自然科学奖二等奖

    关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1.香港科技大学吴宏伟教授团队获国家自然科学奖二等奖.2021年11月3日,2020年度国家科学技术奖公布.香港科技大学吴宏伟教授领衔的[状态相关 ...

  9. 清华大学参赛计算机集群,清华学生超算团队再获双料冠军

    清华学生超算团队再获双料冠军 本次决赛共有来自世界各地的13支队伍参赛,清华代表队由张晨.钟闰鑫.陈嘉杰.王雨田.翟明书.宋泽宇6名本科生组成,指导教师为计算机系助理研究员韩文弢和副教授翟季冬.计算机 ...

最新文章

  1. 【TeeChart Pro ActiveX教程】(八):ADO数据库访问(上)
  2. h3c交换机限制端口访问_H3C交换机端口限速和流量监管典型配置指导
  3. Linux 知识点滴
  4. nat+端口转发,使得宿主机secureCRT可以访问vbox里linux虚拟机
  5. golang linux安装
  6. django html显示xml,如何将HTML与Django集成?
  7. sql 成功率_备考2022年MBA: 如何提高清华、北大MBA提前面试成功率|博雅汇MBA
  8. 用于实现 Web 服务的 SOA 编程模型,第 10 部分: SOA 用户角色
  9. 【jQuery笔记Part4】01-jQuery-节点操作-添加节点-删除节点-复制节点
  10. 快递公司type字典
  11. 缺氧游戏 不给计算机加水,缺氧 泥土用完了怎么办 | 手游网游页游攻略大全
  12. Spring Cloud与Dubbo详细对比
  13. Altium Designer 软件介绍
  14. [BUUCTF] 洞拐洞拐洞洞拐
  15. 执行transact mysql_错误 执行Transact-SQL语句批处理时发生了异常。无法设置主体'sa'的凭据...
  16. 冒泡排序法(C语言)
  17. android版本升级5.0,安卓系统升级到Android 5.0教程【详解】
  18. 微金所获2015(行业)最具影响力品牌奖
  19. echarts修改鼠标悬停在节点上时显示的内容,自定义鼠标悬停显示内容
  20. strchr()函数

热门文章

  1. Abbkine BCA法 蛋白质定量试剂盒说明书
  2. Google gflags使用说明
  3. 快速获取系统字体列表
  4. Anaconda超详细安装教程(Windows环境下)
  5. FQ队列对quantum的处理
  6. 山茶花粉中咖啡因酪氨酸酶抑制剂活性的研究
  7. 【FFmpeg 系列】 SDL 音视频渲染(七)
  8. 北京科技大学 计算机考研真题,北京科技大学计算机系统结构和组成原理考研真题...
  9. 您必须应用的#1规则永远不会在Twitter或Facebook上被骗
  10. 热评云厂商:蓝汛4.0亿元,如何扭转乾坤看转型与创新