铜灵 发自 凹非寺
量子位 出品 | 公众号 QbitAI

提取关键点此前被视为需要大量数据才能完成的工作,但DeepMind的一项最新研究可不这么认为。

DeepMind的新模型Transporter从原始视频帧中学习以物体为中心的抽象表示,并能用简单的算法生成控制策略和探索程序。

也就是说,用无监督的方法和寥寥数据,就能提取出关键点,在没有奖励的情况下,还能进行有效操控。

效果如下:

软件工程师@AwokeKnowing表示,DeepMind最后还严谨地讨论了研究的局限性,但这项在无监督、没有硬工程特征(hard-engineered features)环境下的研究,确实是一项开创性的研究

新型Transporter架构

在论文Unsupervised Learning of Object Keypoints for Perception and Control中,研究人员提出了一种名为Transporter的新型神经网络架构,可跨各种常用的强化学习环境学习物体关键点的状态。

Transporter的架构如下:

研究人员在论文中表示,这个模型通过利用物体的运动来发现关键点,将原视频帧(xt)转换成另一个目标帧(xt’)。

这个学习过程分为三个阶段。

在训练期间,空间特征图Φ(xt)和Φ(xt’ )以及关键点坐标Ψ(xt) 和Ψ(xt’) 利用卷积神经网络和斯坦福此前提出的PointNet进行帧的预测,再次过程中,关键点的坐标被转换成高斯热力图(Gaussian heatmaps) HΨ(xt) 和HΨ(xt’)。

在transport期间,这个网络执行两种操作:

一是原帧的特征在HΨ(xt)和HΨ(xt’)中被设置成了0,二是在源目标图像中的特征位置HΨ(xt’)被替换成了HΨ(xt)。

在最后的改进阶段,研究人员又完成了两个任务,分别是在原位置绘制缺失的特征,和清理目标位置附近的图像。

研究人员将这些提取的关键点进行了可视化,并与T. Jakab和Y. Zhang等人此前的最先进关键点提取方法进行了效果对比:

T. Jakab等人研究:Unsupervised learning of object landmarks through conditional image generation.

地址:http://sina.lt/guuH

Y. Zhang等人研究:Unsupervised discovery of object landmarks as structural representations

地址:https://arxiv.org/abs/1804.04412

研究人员发现,Transporter学习了更多的空间对齐关键点,对不同数量、大小和运动的物体都有很强的鲁棒性。

使用学习的关键点作为状态输入,可在几种雅达利环境中实现比最先进的强化学习方法更好的策略,但只需要100k的环境交互。

DeepMind团队

这项研究来自DeepMind的Tejas Kulkarni, Ankush Gupta, Catalin Ionescu, Sebastian Borgeaud, Malcolm Reynolds,Andrew Zisserman和Volodymyr Mnih。

一作Tejas Kulkarni目前是DeepMind的高级研究科学家,此前在MIT攻读博士,主要研究视觉运动、深度强化学习代理、以及智能体的语言。

多篇论文被CVPR 17、NIPS 17、ICML 18等顶会收录。

传送门

Unsupervised Learning of Object Keypoints for Perception and Control
https://arxiv.org/abs/1906.11883

https://twitter.com/deepmindai/status/1145677732115898368?s=21

AI社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

DeepMind提出新型神经网络架构,用无监督方法从视频中提取关键点 | 论文相关推荐

  1. 73岁Hinton老爷子构思下一代神经网络:属于无监督对比学习

    来源:机器之心 本文约2700字,建议阅读7分钟. 在近期举行的第 43 届国际信息检索年会 (ACM SIGIR2020) 上,Geoffrey Hinton 做了主题为<The Next G ...

  2. Hinton构思下一代神经网络:属于无监督对比学习

    本文由机器之心报道 Geoffrey Hinton 是谷歌副总裁.工程研究员,也是 Vector Institute 的首席科学顾问.多伦多大学 Emeritus 荣誉教授.2018 年,他与 Yos ...

  3. 深圳大学梁臻博士提出EEGFuseNet高维脑电图混合无监督深度特征表征与融合模型及其在情绪识别中的应用...

    近期,深圳大学医学部生物医学工程学院梁臻博士(张治国教授团队MIND LAB核心成员)提出一种实用的基于无监督学习的卷积循环混合生成对抗网络,用以实现有效的脑电特征表征与融合,简称为EEGFuseNe ...

  4. 多任务上实现SOTA,UBC、谷歌联合Hinton等提出3D点云的无监督胶囊网络

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨杜伟.小舟 来源丨机器之心 这是一种为 3D 点云提出的无监督胶囊架构,并且在 3D 点云重构. ...

  5. UBC、谷歌联合Hinton等提出3D点云的无监督胶囊网络,多任务上实现SOTA

    本文转载自机器之心. 机器之心报道 作者:杜伟.小舟 这是一种为 3D 点云提出的无监督胶囊架构,并且在 3D 点云重构.配准和无监督分类方面优于 SOTA 方法. 理解对象是计算机视觉的核心问题之一 ...

  6. 翻译: Transformer一种用于语言理解的新型神经网络架构 Google AI

    神经网络,尤其是循环神经网络(RNN),现在是语言理解任务(如语言建模.机器 翻译和问答)的主要方法的 核心.在" Attention Is All You Need "中,我们介 ...

  7. UBC、谷歌联合Hinton等提出3D点云的无监督胶囊网络,多任务上实现SOTA | AI日报...

    多任务上实现SOTA,UBC.谷歌联合Hinton等提出3D点云的无监督胶囊网络 理解对象是计算机视觉的核心问题之一.传统方法而言,理解对象任务可以依赖于大型带注释的数据集,而无监督方法已经消除了对标 ...

  8. 二次元妹子五官画风都能改,周博磊团队用无监督方法控制GAN | CVPR 2021

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 现在,GAN不仅能画出二次元妹子,还能精准调节五官.表情.姿势和绘画风格. 而且在调控某个因素的时候,其他条件能尽量保持不变. 这就是香港 ...

  9. CVPR无监督/自监督学习(Un/Self-supervised Learning)方向论文学习(附摘要)

    目录 2022CVPR UniVIP: A Unified Framework for Self-Supervised Visual Pre-training(自监督学习) Crafting Bett ...

最新文章

  1. 一个简单的Apriltag,数字,动物水果分类器
  2. 在python中配置MySQL数据库
  3. 通过xrdp远程访问ubuntu出现输入d最小化问题的处理
  4. 腾讯视频下载电脑_腾讯视频如何设置允许腾讯视频驻留功能
  5. 用groovy采集网页数据
  6. 上海理工大学:用数字技术打响智慧抗疫信息战
  7. JavaScript浏览器编程之——使用Cookie传递参数
  8. apache geode项目结构_使用IntelliJ IDEA+Maven 创建、开发、管理项目
  9. 树、森林、以及二叉树之间的转化
  10. 再学C++之C++中的全部关键字
  11. 从客户端中检测到有潜在危险的 request.form值
  12. 三维空间中判断射线与平面是否相交
  13. java做绿色数字雨_数字雨
  14. vulhub-靶场实战-安装
  15. 【2021全国高校计算机能力挑战赛C++题目】17.信息整理 某机房上线了一套系统,和每台计算机都相连,以便监控各计算机相关外设的运行状态。
  16. 使用Google colab的GPU运行resnet
  17. vivo X90和iPhone 14哪个好 vivo X90 和苹果14 区别对比评测
  18. 计算机组成原理(下)
  19. 【蓝桥系列】——十三届蓝桥杯PythonB组第五题E题蜂巢(AC代码)
  20. 电池配置(串联和并联)及其保护

热门文章

  1. mysql--------命令来操作表
  2. mac composer 使用
  3. UITextField总结--博主总结的真好
  4. 用java编写一个函数,统计一个字符串中每个字母出现的次数
  5. ThinkPhp学习12
  6. 【翻译】Ext JS 5:为不同设备设置不同的主题
  7. mybatis源码分析(2)——事务概述
  8. 使用 ViS2005 进行单元测试
  9. 谈谈学习AS3的过程
  10. python日历gui_python GUI库图形界面开发之PyQt5日期时间控件QDateTimeEdit详细使用方法与实例...