从俄罗斯方块到星际2,全都用得上:DeepMind无监督分割大法,为游戏而生
方栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI
只给AI喂一张图片。
画里的各种物件,瞬间变成了独立的个体。可以移动起来,可以变形变色,毫无PS痕迹。
就连绿色的地板和黄色的墙,都不用安然站在那里不动:
这段表演,来自DeepMind最新发布的神经网络MONet (简称“莫奈”) 。
它把每个物体,圆满地从背景里分离出来。这样的技能,完全是在无监督的学习过程中解锁的。
与莫奈一同发布的,还有一只叫做IODINE (简称“碘”) 的网络。
它也是无监督网络,也可以让画面里的每一个角色,都成为独立的自我,随意奔跑,野蛮生长。
不过,这两个网络用的分割方法,还是非常不同的:
莫奈与碘
莫奈 (MONet) ,是从背景开始,每次只分割出一个物体。
一步一步叠加上去。如下图,橘黄色→黄色→绿色→蓝色:
那么,来仔细认识一下莫奈的网络结构。
它是一只VAE (变分自编码器) 和一只注意力网络的结合:
注意力网络是循环 (Recurrent) 出现的,它会不断地产生掩膜 (Mask) ,不断地对VAE做出调整。
每一步里,注意力网络都是不同的,是随着上一步分割出的场景而变化的。这样,每一步输出的重构图也是不同的。
最终,会集齐画面里的所有物体。这时候,每个存在都是独立的了。
你看,学打星际2的强化学习AI,要先了解敌人的行动规律。这时候,MONet就可以帮忙:
而与莫奈不同,碘 (IODINE) 不会一次只分一个物体。它会直接生成全场的分割图:
一开始是全然靠猜,然后会在一次一次迭代里面,不断细化 (Refine) 这个分割结果。
具体到网络结构上看,首先是这里的VAE和莫奈不一样。
莫奈的是普通VAE (下图左) ,碘的是多物体VAE (下图右) :
多物体VAE每一次工作,都会把画面里的所有物体,从背景里分割出来。
然后,怎样从一开始纯猜的各种后验参数λ,进化到最终的精确分割呢?
需要一个迭代推理过程:
思路是来自Marino等人2018年发表的迭代摊销推理 (Iterative Amortized Inference) 方法,这里先不详细介绍了 (文底有传送门) 。
不过,团队说这样的方法,可以让模型解锁多重稳定性 (Multi-Stability) ,和人类的感知相近了。
你看,就算只给出“一坨“俄罗斯方块,AI也能把它分成几块独立的形状:
有了莫奈和碘的分解大法,AI的表征学习 (Representation Learning) 便可得心应手。
瑟瑟发抖
团队说,一开始想做这样的网络,就是要给强化学习AI打游戏用的。
曾经在星际II的战场上,神族最强十人之一的LiquidMaNa,与DeepMind人工智能选手AlphaStar对战五局,双方都是神族。
MaNa全部GG。最短的一局,只有5分36秒。
而DeepMind每一日都在进化自家的算法,每一日都在开发新的算法。
人类下一个瑟瑟发抖的日子,可能很快就要来了。
MONet论文传送门:
https://arxiv.org/abs/1901.11390
IODINE论文传送门:
https://arxiv.org/abs/1903.00450
Iterative Amortized Inference论文传送门:
https://arxiv.org/abs/1807.09356
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
订阅AI内参,获取AI行业资讯
加入社群
量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;
欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !
从俄罗斯方块到星际2,全都用得上:DeepMind无监督分割大法,为游戏而生相关推荐
- 说人话教AI打游戏,Facebook开源迷你版星际争霸,成果登上NeurIPS 2019
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 怎么教AI打游戏呢?当然是直接下指令啦. 告诉AI造农民,基地就开始唰唰往外吐农民: △下方英文指令:创造新农民 指挥农民挖矿造兵工厂,一句 ...
- 1-10落败,5分钟崩盘!星际2职业高手史上首次被AI击溃,AlphaStar一战成名
边策 栗子 夏乙 发自 凹非寺 量子位 & 腾讯科技 联合出品 5分36秒的战斗后,LiquidMaNa打出:GG. DeepMind开发的全新AI程序AlphaStar,在今天凌晨的< ...
- linux系统可以玩星际争霸吧,暴雪携手DeepMind推出《星际争霸2》API工具,玩家可以“调教”AI打游戏了...
在去年的暴雪嘉年华期间,暴雪宣布与谷歌旗下的人工智能研究部门DeepMind展开合作,在<星际争霸2>中引入机器学习方法,进行人工智能研究.现在这个计划有了一些下文. 今天,暴雪<星 ...
- AI打王者、星际争霸……你还不懂背后技术?这有一份游戏AI综述
视学算法报道 机器之心编辑部 游戏中的人工智能所面临的技术.挑战和机遇. 人机游戏有着悠久的历史,已经成为验证人工智能关键技术的主流.图灵测试可以说是人类首次进行人机对抗测试,这激发了研究人员设计各类 ...
- 俄罗斯方块linux服务器,分享|在 Linux 终端上玩俄罗斯方块
用每个人最喜欢的砖块配对游戏"俄罗斯方块"重新创造 20 世纪 80 年代的魔力. 感谢你来浏览我们今天的 Linux 命令行玩具日历.如果这是你第一次访问该系列,你可能会问自己, ...
- 2023最新网络工程师面试大全,全都答得上offer绝对拿到手软
一.目录 TCP和UDP都可以实现客户端/服务端通信,这两个协议有何区别? 是第几层的协议,其作用是什么? 请说一下FTP,SSH,TELNET,DNS,HTTP,HTTPS,SMTP协议的端口号? ...
- CV领域的对比学习综述(下)
CV领域的对比学习综述(下) – 潘登同学的深度学习笔记 文章目录 CV领域的对比学习综述(下) -- 潘登同学的深度学习笔记 对比学习发展历程 不用负样本 BYOL 整体思路 网络架构 BN层知道了 ...
- 对比学习论文综述(part4 transformer + 总结)
对比学习论文综述(part4:transformer + 总结) part4 Transformer 第四阶段主要是讲Transformer是怎么和对比学习有机结合起来的,在这个阶段主要就是简单的讲一 ...
- 数据增强:具有自预测表示的数据高效强化学习
题目:Data-Efficient Reinforcement Learning with Self-Predictive Representations 出处:International Confe ...
最新文章
- 0.QObject的数据存储
- 树莓派 Ubuntu mate 18.04 修改为清华源
- Linux操作系统总结
- CentOS 7.X 升级 Python 3.8.X
- 用java api 实现查询 Hive 数据
- [转]cmd 设置环境cmd环境变量命令set 设置永久环境变量命令setx
- nssl1193-地主【dp】
- android 自定义控件 焦点,android中设置控件获得焦点
- springboot导包显示不存在_BOOT项目依赖另外一个模块的包,开发的时候都正常,执行clean package打包成jar时却提示依赖的模块包不存在。...
- 腾讯云blog:孪生网络入门(上) Siamese Net及其损失函数
- OpenShift 4 - 多云管理(1) - 安装 RHACM、导入已有集群、配置观察功能
- Hadoop的调度器总结(转)
- Jackson修改字段名和自定义命名策略
- 面向ASIC的逻辑综合
- hdu5651xiaoxin juju needs help(大组合数模板)
- 数据防泄漏 | 禁止PrintScreen键
- Unity之UGUI-特效遮挡问题2.0
- Elasticsearch 7.10 之 Similarity module
- C/C++编程:实现hash函数
- RecyclerView 嵌套RecyclerView 或者 ScrollView当中嵌套RecyclerView ,子View会自动滚动到顶部
热门文章
- 算到怀疑人生!如何用并查集解决朋友圈个数问题?
- javaweb中服务器响应,Java Web服务器响应与JSON
- python绘制拟合回归散点图_python – 将曲线拟合到散点图的边界
- vbscript html 在线,在HTML中使用VBScript可用三种方法
- python权威指南 pdf_Python高级编程(第2版) 中文完整pdf扫描版[76MB]
- php教程mvc,php.MVC教程
- React Fiber 了解一下
- 输入URL经历的过程
- java 开发者异常处理_Java异常处理和设计
- java学习 类变量 类方法_这篇文章主要介绍了JAVA类变量及类方法代码实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下类变量(...