晓查 发自 凹非寺
量子位 出品 | 公众号 QbitAI

对于AI来说,识别视频里发生了什么已经不是难事,训练它的方法就是用带有标签的视频数据集进行监督学习。

比如我们给AI看带有“棒球”标签的视频,然后它就能知道这是什么运动。但这是远远不够的,我们希望它不仅能知道这是什么运动,还希望它能预测球何时被投出去。

可是要让AI理解视频里每一帧的内容太难了,因为你不可能逐帧对视频做标记,用监督学习的方法是不切实际的。

所以谷歌的研究人员提出了一种时间周期一致性学习(TCC)的自监督学习算法,可以在一段连续过程中,找到每一帧和某个具体动作的对应关系。

目前,谷歌已经开源了TCC的代码,希望让用户能够在自己开发的程序中用上这种最新算法。

TCC原理

当一个人想去倒一杯饮料时,他会去伸手去拿茶壶、酒瓶或水杯。这是一种按特定顺序发生的事件。相同类型的视频都会有类似的时间先后对应关系。

关键帧对于所有倒水视频是相似的,并且存在许多变化因素,例如视点、物体大小,容器形状或倒水速度的差异。

TCC利用周期一致性原则在相同动作的视频中找到这种对应关系,通过对齐视频来学习有用的视觉表征。

首先,训练算法通过单独提取每个帧来产生视频帧的嵌入。然后选择用于TCC学习的两个视频,使用其中一个作为参考视频,用它的帧嵌入来识别来自第二个视频相同动作的最近帧。

随着训练过程的进行,嵌入器对在动作的上下文中产生对每个视频帧的语义理解,改善和降低了周期一致性损失。

在下图中,谷歌展示了使用TCC训练的模型,该模型来自宾夕法尼亚动作数据集中进行深蹲练习的人的视频。

图中左侧的每个点对应于帧嵌入,点的位置随着当前视频帧动作而变化。尽管在姿势、光照、身体等方面存在许多差异,TCC还是能在不提供标注的情况将将两个视频同步起来。

谷歌还将TCC与其它有监督学习算法进行对比。在识别高尔夫挥杆和网球发球这个两个动作时,有监督学习需要50个标记样本才能达到和TCC一样的准确度,而TCC在仅有一个标记样本的情况下就已经有很高准确度了。

实际应用

TCC可以在只有一个标记视频的情况下,将其它同类视频的动作阶段进行分类,并且可以用参考视频一次对齐多个剪辑视频,做到“神同步”。

下面就是TCC将25个棒球投手视频的动作完全同步到一致的例子:

此外,TCC还可以将与一个视频中的任何帧相关联的元数据传输到另一视频中。比如将一个倒水视频中的声音传输到另一个视频中,做到音画同步,听起来毫无违和感。

博客地址:
https://ai.googleblog.com/2019/08/video-understanding-using-temporal.html

源代码地址:
https://github.com/google-research/google-research/tree/master/tcc

加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

25个视频神同步,还能给视频声音移花接木,谷歌开源最新自监督算法相关推荐

  1. 腾讯视频上传视频如何同步到企鹅号

    企鹅号是腾讯的一个非常棒的产品,让一大批自媒体人赚了钱,我们都知道腾讯视频和企鹅号是互通的,腾讯视频中的视频也可以同步到企鹅号中.所以今天播放器家园网小编教大家如何将视频进行同步. 腾讯视频上传视频如 ...

  2. 短视频剪辑软件分享,短视频剪辑软件这几个很不错。​

    短视频剪辑软件分享,短视频剪辑软件是一种可以帮助用户剪辑.编辑和制作短视频的应用程序.这些软件通常提供了一些基本的视频编辑功能,例如切割.裁剪.合并.添加音乐.特效.文字等等.一些短视频剪辑软件还提供 ...

  3. 如何将一张图片设置为html的背景音乐,如何把照片制作成视频 效果加背景音乐 制作独一无二的视频...

    想要用照片制作成视频展示吗?市面上很多软件使用复杂,难学.今天为大家推荐一款简单易学的软件给大家,自己也能制作结婚照视频.毕业照视频.家庭照.情侣照片视频!超给力哦..首先要利用电脑自带的Micros ...

  4. 多个视频怎么合成一个视频?教你几种视频合并方法

    将多个视频合成一个视频,可以让我们更好地记录和呈现某个事件或者经历的完整过程.比如,我们可以将旅行的点滴片段合成一个完整的旅行视频,或者将孩子成长的点滴合成一个成长记录视频.很多小伙伴不知道如何将多个 ...

  5. 看完沐神的装机视频,原来还能这么玩?

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送 来自|新智元  编辑|Aeneas 拉燕 桃子 [导读]AI大牛李沐带你来装机! AI大 ...

  6. sync是同步还是非同步_音视频是怎么保持同步的?(四)

    今天我们来继续讲音视频是怎么保持同步的. 常用同步策略 前面已经说了,实现音视频同步,在播放时,需要进行选定一个重要参考时钟,读取帧上的时间戳,同时企业根据的参考时钟来动态管理调节播放.它是目前已知的 ...

  7. 信朋友圈居然还有这波神操作?不仅可以编辑图片,而且还能剪辑视频

    对于我们来说,微信这款社交软件的使用频率是非常高的,里面有很多非常实用的功能.接下来就一起来看看吧,带给你不一样的分享. 1.朋友圈–图片编辑在发布朋友圈之前,其实微信还自带了图片编辑功能,你发现了吗 ...

  8. 音视频的同步原理——老文章,比较清晰

    http://blog.csdn.net/beyond_cn/article/details/20310177 1.   音视频同步的原理 2.  音视频同步的较正方法 3.  音视频同步时遇到的问题 ...

  9. AI顶会组团“改版”:NeurIPS DDL推迟3周,ICLR连赞助商都要开视频,CVPR还在死撑...

    郭一璞 发自 云凹非寺 量子位 报道 | 公众号 QbitAI 眼看着国外疫情还没有好转,AI顶会不断调整举办方式和时间表已经成了"新常态". 今天,NeurIPS 2020将截稿 ...

最新文章

  1. c # 学习笔记(一)
  2. matlab字符衔接,matlab字符串连接(多个字符串)的经验,matlab字符串
  3. Unity中如何计算带minimap的贴图资源的大小
  4. 再学 GDI+[83]: TGPImage(3) - 平行四边形变换
  5. python IP地址无效化
  6. lstrip在python中是什么意思_什么是一目均衡图?如何利用一目均衡图来做交易?...
  7. 数字化改革看“浙”里 CDEC2021中国数字智能生态大会杭州站举行
  8. 【TensorFlow】CNN
  9. 剑指offer最新版_剑指Offer——Java版本(持续更新)
  10. 10.凤凰架构:构建可靠的大型分布式系统 --- 可观测性
  11. 最大功率跟踪mppt
  12. Opencv3 core模块解析之convertTo
  13. 二开要饭网免费开源源码
  14. Axure模板库(1)-常见网站
  15. 使用JAVA编程实现多人聊天室(多线程实践)
  16. 属性管理器没有Microsoft.Cpp.x64.user的解决办法
  17. 跑步减肥的正确姿势与方法 不再担心女生跑步腿会变粗
  18. RIGOL DS70000系列示波器在USB2.0一致性分析测试方案
  19. Java一般要学多久?
  20. 微信小程序的注册流程

热门文章

  1. Linux入门时必学文件处理个命令
  2. CSS3秘笈第三版涵盖HTML5学习笔记13~17章
  3. Hadoop集群的NameNode的备份
  4. ylb:创建数据库、表,对表的增查改删语句
  5. Oracle PL/SQL之令人不解的提示(nls_date_format)
  6. c语言一输入运算就显示错误,大咖都会犯的18个c语言入门错误
  7. SpringMVC框架 学习DAY_02 : 接收请求参数/向模板页面转发数据/重定向与转发 /Session
  8. 数据包构造分析工具Hping3常用命令集合大学霸IT达人
  9. 解决Fiddler无法抓到手机的会话包
  10. 为0用c语言怎么写,应输出“1990”,该怎么写用C语言编程写 – 手机爱问