世界杯来了!央视名嘴白岩松调侃 “俄罗斯世界杯,中国除了足球队没去,其他的都去了”,这届世界杯,中国球迷购买球票的数量在所有国家中排名第 9,可见球迷对世界杯的热情。那么,除了准备好小龙虾在电视机前观看世界杯比赛,你有没有想过让 C罗、梅西或者内马尔在你家桌子上踢一场比赛会是什么样子?

华盛顿大学、Facebook 和 Google 的研究人员开发了第一个端到端的深度学习系统,该系统可以将足球比赛的 YouTube 视频转换为运动的 3D 全息图。

用CNN重建一场足球比赛

“对一场足球比赛进行单目重建有很多挑战。我们必须估计相对于场地的摄像机姿态,检测并跟踪每个球员,重新构建他们的身体形状和姿势,并对联合重建进行渲染,” 研究人员在他们的研究论文中写道。

图1:以足球比赛的 YouTube 视频为输入,系统输出比赛的动态 3D 重建,可以使用增强现实设备在桌面上以交互式的方式观看。

下面的视频演示了这个系统:

这种方法的关键是卷积神经网络(CNN),研究人员通过训练 CNN 来估计每个球员与拍摄比赛的摄像机之间的距离。该网络分析了从足球视频游戏《FIFA》中提取的12000 张 2D 球员图像,以及从游戏引擎提取的相应 3D 数据,以了解两者之间的相关性。

这样,网络就能从没见过的 2D 图像中预估球员的深度图( depth maps)。当被展示没见过的视频时,系统能准确地预测每个球员的深度图,并将其与颜色素材结合,以3D 的方式重建每个球员。

图 2:重建方法的概览

以 YouTube 视频的帧作为输入,我们使用 field lines 来恢复摄像机参数。然后,提取边界框、姿势和轨迹(跨多个帧)来分割球员。通过在视频游戏数据上训练好的深度网络,我们在游戏环境中重建了每个球员的深度图,这样就可以在 3D 查看器或 AR 设备上呈现出来。

然后,球员们被放在一个虚拟的足球场上。其结果令人惊叹,并且可以通过 3D 查看器或 AR 设备从任何角度观看比赛。

图3:训练数据:从《FIFA》游戏中提取图像和对应的深度,这里展示了几个可视化为深度图和网格的例子。

该团队使用 NVIDIA GeForce GTX 1080 GPU 和 NVIDIA TITAN Xp GPU,以及cuDNN 加速的 PyTorch 深度学习框架,在从世界杯比赛视频中提取的数小时的 3D 球员数据上对卷积神经网络进行训练。

基于这些比赛视频数据,神经网络能够重构球场上的每个球员的深度图,这些图可以在3D 查看器或 AR 设备上呈现。

“事实证明,在玩 EA 的《FIFA》游戏并截取游戏引擎和 GPU 间的调用时,可以从视频游戏中提取深度图。具体来说,我们使用 RenderDoc 来截取游戏引擎和 GPU 之间的调用。” 研究团队表示:“FIFA 与大多数游戏类似,在游戏过程中使用延迟渲染。通过访问 GPU 调用,可以捕获每帧的深度和颜色缓冲区。一旦特定的帧被捕获了深度和颜色,就可以提取出球员。”

图4:合成数据集的结果以及与当前最优技术和 ground truth 的比较,可视化为depth maps 和 3D 网格。我们的方法更准确,实现了更好的网格重构。

为了验证这个系统,研究团队用 YouTube 上找到的 10 个高分辨率的职业足球比赛视频测试他们的方法。值得注意的是,该系统只在合成视频素材上进行训练。但是,在真实的场景中,系统也有非常好的结果。

来自 YouTube 视频的实际图像的结果

从 Youtube 框架开始(顶行),我们网络重建的深度图可以添加到虚拟 3D 球场环境中,这里显示为仅网格和纹理渲染(第 2-4 行)。

研究人员用微软的 HoloLens AR 眼镜进行测试。HoloLens 可以将 3D 重建叠加到真实的桌面上。最终的产品虽然不完美,它无法重建球,不能实时地工作,并且只允许从视频录制的球场侧面观看。但是,这项技术可能比当前 3D 重建运动的最先进方法更具可扩展性,因为当前的方法需要在每一个角度布置相机。研究人员称,这种方法也适用于预定义的其他事件,例如音乐会或剧场。

桌面实际的场景

用HoloLens看到的场景

研究人员承认他们的系统并不完美。他们的下一个项目将专注于训练系统以更好地检测球,并开发可从任何角度观察的系统。

这项研究将于 6 月 18 日至 22 日在犹他州盐湖城举行的年度计算机视觉和模式识别(CVPR)会议上首次亮相。


论文地址:

http://grail.cs.washington.edu/projects/soccer/soccer_on_your_tabletop.pdf

来源:grail.cs.washington.edu

文章版权归原作者所有,转载仅供学习使用,不用于任何商业用途,如有侵权请留言联系删除,感谢合作。

来看一场 AI 重建的 3D 全息世界杯比赛!相关推荐

  1. 用3D全息投影打造一场婚礼有什么优势?

    由于传统的平面幕布投影已经逐渐不能够满足人们的应用需求,正在逐步被市场所淘汰,因此,近几年市场上相继诞生了多种非常先进的投影方式,3D全息投影就是其中之一,并且其应用迅速火热起来,应用领域越来越广阔. ...

  2. 7 Papers Radios | 机器人「造孩子」;谷歌裸眼3D全息视频聊天技术公开

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨机器之心 作者丨杜伟.楚航.罗若天 本周重要论文包括能「造孩子」的机器人以及谷歌公开的裸眼3D全 ...

  3. 谷歌参展攻略!AI皮影戏、3D作画、与AI共舞...嗨翻魔都(附视频)

    来源:大数据文摘 作者:睡不着的Iris.魏子敏 本文约3200字,建议阅读8分钟. 本文介绍了谷歌在上海举办艺术展,带领大家看看如何将人工智能和绘画.音乐和皮影戏全面结合起来. 谷歌来上海啦! 虽然 ...

  4. 无人驾驶的落地,是一场AI与人的博弈

    https://www.toutiao.com/a6710528603936784903/ "人类创造技术的节奏正在加速,技术的力量也正以指数级的速度在增长.指数级的增长是具有迷惑性的,它始 ...

  5. 周末,我打开《逆水寒》参加了一场AI学术会议

    晓查 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 今年,线上办AI学术会议已经是常态了. 但在中国古风游戏里开会,你肯定没见过. 会场设在大宋皇宫议事厅,门卫是带刀宫廷侍卫,参会者清一色换上 ...

  6. 干货 | 谈谈我是如何入门这场 AI 大赛的

    AI有道 公众号历史文章目录(请戳我) 前阵子因为机器学习训练营的任务安排,需要打一场 AI 比赛.然后就了解到最近热度很高且非常适合新人入门的一场比赛:天池新人实战赛o2o优惠券使用预测.今天,红色 ...

  7. 中国首场AI芯片产业峰会成功举办 GTIC 2018热度空前

    2018年3月9日,由智能行业第一媒体和产业服务平台智东西主办.全球好物消费推荐平台极果和中国家电及消费电子博览会AWE联合举办的"GTIC 2018 全球AI芯片创新峰会"在上海 ...

  8. 报名中 | 微软首席人工智能科学家邀你参加一场AI领域的私密聚会

    Alpha Founders Club(AFC)行业私密聚会已经成功举办过三场,分别专注于安全领域.VR领域和产品开发,每场聚会邀请10-20位行业资深从业者.创业者参加.聚会不仅促进了业内资源和信息 ...

  9. IBM发表未来5年5项科技预测 3D全息手机或现世

    北京时间12月25日凌晨消息,IBM本周发布每年一度的"未来5年5项预测"报告,对未来5年的科技发展作出5大预测,其中包括空气动力电池.3D投影手机和个性化换乘车等技术. 1.空气 ...

最新文章

  1. osi七层协议和tcp/ip四层协议
  2. vi/vim的选中/复制/粘贴命令
  3. JQuery实现一个简单的鼠标跟随提示效果
  4. 支付系统开发中可能遇到的问题
  5. 扇区示意图计算机组成原理,计算机组成原理本.ppt
  6. 《大型网站服务器容量规划》一1.1 容量规划背景
  7. Android游戏开发基础part4--Bitmap位图的渲染与操作
  8. ctfshow-萌新-web5( 利用位运算符控制SQL获取网站敏感信息)
  9. exec 直接赋值_了解 JavaScript 解构赋值
  10. echarts 柱状图 柱顶部显示数字
  11. Timer already cancelled 或者 Task already scheduled or cancelled
  12. logo设计及VIS手册排版
  13. 小柯在学JAVA之第二弹
  14. v4l2_async_subdev_notifier_register 分析
  15. 【好数推荐】数据堂平均音色语音库
  16. FreeRTOS学习笔记 2 - 任务
  17. 一个程序员去英国之申请ATAS
  18. python 操作windows DNS
  19. 驱动-MDL内存映射
  20. 数据库与文件的数据存储的区别

热门文章

  1. EntityFramework Core 3.x初级篇发布
  2. 如何运用领域驱动设计 - 存储库
  3. 从单机应用到微服务,用户认证走几步?
  4. Visual Studio容器项目工程化心得
  5. asp.net core合并压缩资源文件引发的学习之旅
  6. 编程语言的发展趋势及未来方向(3):函数式编程
  7. IIS负载均衡-Application Request Route详解第三篇:使用ARR进行Http请求的负载均衡
  8. Bash on Windows 抢鲜测试 -- 介绍及安装
  9. C# 字符串操作:split、substring、Format
  10. android自动跑马灯,Android-最强跑马灯