方栗子 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

只给AI喂一张图片。

画里的各种物件,瞬间变成了独立的个体。可以移动起来,可以变形变色,毫无PS痕迹。

就连绿色的地板和黄色的墙,都不用安然站在那里不动:

这段表演,来自DeepMind最新发布的神经网络MONet (简称“莫奈”) 。

它把每个物体,圆满地从背景里分离出来。这样的技能,完全是在无监督的学习过程中解锁的。

与莫奈一同发布的,还有一只叫做IODINE (简称“碘”) 的网络。

它也是无监督网络,也可以让画面里的每一个角色,都成为独立的自我,随意奔跑,野蛮生长。

不过,这两个网络用的分割方法,还是非常不同的:

莫奈与碘

莫奈 (MONet) ,是从背景开始,每次只分割出一个物体

一步一步叠加上去。如下图,橘黄色→黄色→绿色→蓝色:

那么,来仔细认识一下莫奈的网络结构。

它是一只VAE (变分自编码器) 和一只注意力网络的结合:

注意力网络是循环 (Recurrent) 出现的,它会不断地产生掩膜 (Mask) ,不断地对VAE做出调整。

每一步里,注意力网络都是不同的,是随着上一步分割出的场景而变化的。这样,每一步输出的重构图也是不同的。

最终,会集齐画面里的所有物体。这时候,每个存在都是独立的了。

你看,学打星际2的强化学习AI,要先了解敌人的行动规律。这时候,MONet就可以帮忙:

而与莫奈不同, (IODINE) 不会一次只分一个物体。它会直接生成全场的分割图:

一开始是全然靠猜,然后会在一次一次迭代里面,不断细化 (Refine) 这个分割结果。

具体到网络结构上看,首先是这里的VAE和莫奈不一样。

莫奈的是普通VAE (下图左) ,碘的是多物体VAE (下图右) :

多物体VAE每一次工作,都会把画面里的所有物体,从背景里分割出来。

然后,怎样从一开始纯猜的各种后验参数λ,进化到最终的精确分割呢?

需要一个迭代推理过程:

思路是来自Marino等人2018年发表的迭代摊销推理 (Iterative Amortized Inference) 方法,这里先不详细介绍了 (文底有传送门) 。

不过,团队说这样的方法,可以让模型解锁多重稳定性 (Multi-Stability) ,和人类的感知相近了。

你看,就算只给出“一坨“俄罗斯方块,AI也能把它分成几块独立的形状:

有了莫奈和碘的分解大法,AI的表征学习 (Representation Learning) 便可得心应手。

瑟瑟发抖

团队说,一开始想做这样的网络,就是要给强化学习AI打游戏用的。

曾经在星际II的战场上,神族最强十人之一的LiquidMaNa,与DeepMind人工智能选手AlphaStar对战五局,双方都是神族。

MaNa全部GG。最短的一局,只有5分36秒。

而DeepMind每一日都在进化自家的算法,每一日都在开发新的算法。

人类下一个瑟瑟发抖的日子,可能很快就要来了。

MONet论文传送门:
https://arxiv.org/abs/1901.11390

IODINE论文传送门:
https://arxiv.org/abs/1903.00450

Iterative Amortized Inference论文传送门:
https://arxiv.org/abs/1807.09356

作者系网易新闻·网易号“各有态度”签约作者

订阅AI内参,获取AI行业资讯

加入社群

量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;

欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

从俄罗斯方块到星际2,全都用得上:DeepMind无监督分割大法,为游戏而生相关推荐

  1. 说人话教AI打游戏,Facebook开源迷你版星际争霸,成果登上NeurIPS 2019

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 怎么教AI打游戏呢?当然是直接下指令啦. 告诉AI造农民,基地就开始唰唰往外吐农民: △下方英文指令:创造新农民 指挥农民挖矿造兵工厂,一句 ...

  2. 1-10落败,5分钟崩盘!星际2职业高手史上首次被AI击溃,AlphaStar一战成名

    边策 栗子 夏乙 发自 凹非寺 量子位 & 腾讯科技 联合出品 5分36秒的战斗后,LiquidMaNa打出:GG. DeepMind开发的全新AI程序AlphaStar,在今天凌晨的< ...

  3. linux系统可以玩星际争霸吧,暴雪携手DeepMind推出《星际争霸2》API工具,玩家可以“调教”AI打游戏了...

    在去年的暴雪嘉年华期间,暴雪宣布与谷歌旗下的人工智能研究部门DeepMind展开合作,在<星际争霸2>中引入机器学习方法,进行人工智能研究.现在这个计划有了一些下文. 今天,暴雪<星 ...

  4. AI打王者、星际争霸……你还不懂背后技术?这有一份游戏AI综述

    视学算法报道 机器之心编辑部 游戏中的人工智能所面临的技术.挑战和机遇. 人机游戏有着悠久的历史,已经成为验证人工智能关键技术的主流.图灵测试可以说是人类首次进行人机对抗测试,这激发了研究人员设计各类 ...

  5. 俄罗斯方块linux服务器,分享|在 Linux 终端上玩俄罗斯方块

    用每个人最喜欢的砖块配对游戏"俄罗斯方块"重新创造 20 世纪 80 年代的魔力. 感谢你来浏览我们今天的 Linux 命令行玩具日历.如果这是你第一次访问该系列,你可能会问自己, ...

  6. 2023最新网络工程师面试大全,全都答得上offer绝对拿到手软

    一.目录 TCP和UDP都可以实现客户端/服务端通信,这两个协议有何区别? 是第几层的协议,其作用是什么? 请说一下FTP,SSH,TELNET,DNS,HTTP,HTTPS,SMTP协议的端口号? ...

  7. CV领域的对比学习综述(下)

    CV领域的对比学习综述(下) – 潘登同学的深度学习笔记 文章目录 CV领域的对比学习综述(下) -- 潘登同学的深度学习笔记 对比学习发展历程 不用负样本 BYOL 整体思路 网络架构 BN层知道了 ...

  8. 对比学习论文综述(part4 transformer + 总结)

    对比学习论文综述(part4:transformer + 总结) part4 Transformer 第四阶段主要是讲Transformer是怎么和对比学习有机结合起来的,在这个阶段主要就是简单的讲一 ...

  9. 数据增强:具有自预测表示的数据高效强化学习

    题目:Data-Efficient Reinforcement Learning with Self-Predictive Representations 出处:International Confe ...

最新文章

  1. 0.QObject的数据存储
  2. 树莓派 Ubuntu mate 18.04 修改为清华源
  3. Linux操作系统总结
  4. CentOS 7.X 升级 Python 3.8.X
  5. 用java api 实现查询 Hive 数据
  6. [转]cmd 设置环境cmd环境变量命令set 设置永久环境变量命令setx
  7. nssl1193-地主【dp】
  8. android 自定义控件 焦点,android中设置控件获得焦点
  9. springboot导包显示不存在_BOOT项目依赖另外一个模块的包,开发的时候都正常,执行clean package打包成jar时却提示依赖的模块包不存在。...
  10. 腾讯云blog:孪生网络入门(上) Siamese Net及其损失函数
  11. OpenShift 4 - 多云管理(1) - 安装 RHACM、导入已有集群、配置观察功能
  12. Hadoop的调度器总结(转)
  13. Jackson修改字段名和自定义命名策略
  14. 面向ASIC的逻辑综合
  15. hdu5651xiaoxin juju needs help(大组合数模板)
  16. 数据防泄漏 | 禁止PrintScreen键
  17. Unity之UGUI-特效遮挡问题2.0
  18. Elasticsearch 7.10 之 Similarity module
  19. C/C++编程:实现hash函数
  20. RecyclerView 嵌套RecyclerView 或者 ScrollView当中嵌套RecyclerView ,子View会自动滚动到顶部

热门文章

  1. 算到怀疑人生!如何用并查集解决朋友圈个数问题?
  2. javaweb中服务器响应,Java Web服务器响应与JSON
  3. python绘制拟合回归散点图_python – 将曲线拟合到散点图的边界
  4. vbscript html 在线,在HTML中使用VBScript可用三种方法
  5. python权威指南 pdf_Python高级编程(第2版) 中文完整pdf扫描版[76MB]
  6. php教程mvc,php.MVC教程
  7. React Fiber 了解一下
  8. 输入URL经历的过程
  9. java 开发者异常处理_Java异常处理和设计
  10. java学习 类变量 类方法_这篇文章主要介绍了JAVA类变量及类方法代码实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下类变量(...