通用人工智能最新突破!一个Transformer搞定一切
Datawhale干货
编辑:梦晨 鱼羊,来源:量子位
通用人工智能,还得看DeepMind。
这回,只一个模型,使用相同的权重,不仅把看家本领雅达利游戏玩得飞起。
和人类聊聊天、看图写话也不在话下。
甚至还能在现实环境里控制机械臂,让其听从指令完成任务!
模型名为Gato,西班牙语中的“猫”。
按照DeepMind的说法,这只猫猫可以使用具有相同权重的同一个神经网络,适应各种不同的环境。
具体而言,DeepMind让它在604个不同的任务上接受了训练,这些任务模式完全不同,需要观察的元素和行为规则也不同。
而Gato不仅在450个任务中都超过了专家水平的50%,在23个雅达利游戏上表现还超过人类平均分。
DeepMind CEO哈萨比斯直接说:
这是我们目前最通用的智能体。
这一最新成果一发布,当即就在AI圈子里掀起热议。
有AI研究者指出:
Gato令人印象深刻。只需要在云上花费5万美元,就能完成对它的训练。
这点钱只是PaLM训练费用1100万美元的一个零头。用PaLM的预算完全可以将Gato扩展100倍,而这很可能是行之有效的。
PaLM是谷歌发布的5400亿参数语言模型。
有人直接祭出了AlphaStar架构和Gato架构的对比:
Zoom AI杰出科学家Awni Hannun则直接感叹起过去5周以来,谷歌/DeepMind释出成果之密集。
所以这只来自DeepMind的“猫猫”,究竟怎么一回事?
一个Transformer搞定一切
对于研究方法,DeepMind只用一句话就解释明白了:
我们受到语言大模型的启发,用类似的方法把模型能力拓展到文本之外的领域。
没错,这次立功的又是语言大模型中常用的Transformer架构。
Transformer的本质就是把一个序列转换(transform)成另一个序列。
所以要想让它掌握各种不同任务,首先就需要把各类数据都编码成序列。
文本自不必说,天然就是序列信息,可用经典的SentencePiece编码。
图像,ViT已经打好样,先按16x16像素分割,再给每个像素编上号处理成序列。
玩游戏时的按键输入同样是序列,属于离散值,比如懂得都懂的“上上下下左右左右BABA”。
操纵机器人时的传感器信号和关节力矩属于连续值,也通过一系列采样和编码处理成离散序列。
最终,所有序列数据都交给同一个Transformer处理。
整个Gato模型使用的训练数据总体上偏向游戏和机器人控制任务,596个任务占了85.3%。视觉和自然语言任务只占14.7%。
模型架构上,为了简洁和可扩展性,就在最经典的原版Transformer基础上小改,具体参数如下:
24层11.8亿参数版的Gato,在谷歌16x16 Cloud TPUv3切片上训练了大约4天。
到了部署阶段,Gato对于视觉和语言任务就像传统Transformer和ViT那样运行。
对于游戏和机器人控制的行为模式则可以理解为“走一步看一步”。
首先给出一个任务提示,比如游戏操作或机器人动作,作为输出序列的开头。
接下来Gato会观察当前的环境,对动作向量进行一次自回归采样,执行动作后环境发生变化,再重复这个过程……
那么这样训练出来的Gato,在各项任务中到底表现如何?
仅靠12亿参数成为多面手
玩游戏方面,Gato的表现可以用一张图来总结。
x轴是训练集之中专家水平的百分比,其中0代表一个随机参数模型的水平。
y轴是Gato超过或达到对应专家水平的任务数量。
最终结果,Gato在604个任务中,有450个超过了专家水平的50%。
更详细的结果如下:
雅达利游戏测试中,Gato在23个游戏上表现超过人类平均分,11个游戏上比人类得分高一倍。
这些游戏包括经典的乒乓球、赛车,也包括射击、格斗等多种类型。
在Bengio团队推出的BabyAI测试上,Gato几乎在所有关卡达到了专家水平的80%,最难的几个Boss关达到75%。与之前BabyAI榜单上的两个模型水平相当(分别为77%和90%),但这两个模型都针对性的用了上百万个演示来训练。
△BabyAI关卡示例。
在Meta-World上(虚拟环境中操作机械臂),Gato在全部45个任务中,有44个超过专家水平的50%,35个超过80%,3个超过90%。
△Meta-World任务示例
操纵真实机器人方面,与之前模型对比也不遑多让。
至于视觉和文本任务DeepMind这次至少为了验证通用模型的可行性,没有做跑分,而是给了一些示例。
△描述图像
△聊天对话
最后,DeepMind还对Gato模型的可扩展性做了评估。
虽然当前Gato在每一个单独任务上都还比不上SOTA结果,但实验结果表明,随着参数、数据和硬件的增加,Gato模型的性能还有成比例上涨的空间。
另外,Gato在少样本学习上也表现出一定潜力。
DeepMind认为,这样一个通用模型将来可通过提示或微调迅速学习新的任务,再也不用为每个任务都重头训练一个大模型了。
通用人工智能还有多远?
看完Gato如此表现,网友们的“大受震撼”也就不奇怪了。
甚至还有人认为,AGI(通用人工智能)近在眼前。
当然,反对/质疑的声音也不小。
比如始终冲在给人工智能泼冷水一线的马库斯,这次也第一时间开了炮:
仔细看看第10页。无论模型有多大,大型语言模型标志性的不靠谱和错误信息仍然存在。
但不管怎么说,DeepMind在通用人工智能方向上的努力都在不断涌现出新成果。
事实上,无论是2013年惊艳了谷歌的雅达利游戏AI,还是名满全球的AlphaGo、AlphaStar,DeepMind透过这些阶段性成果想要达成的终极目标,一直都通向通用人工智能这个关键词。
去年,DeepMind首席研究科学家、伦敦大学学院教授David Silver还领衔发布了一篇同样引起不少讨论的文章:Reward is Enough。
论文认为,强化学习作为基于奖励最大化的人工智能分支,足以推动通用人工智能的发展。
而据Gato团队成员透露,这只“猫猫”已经在DeepMind内部孕育了2年时间。
此次Gato是以有监督方式进行离线训练的,但论文也强调,原则上,同样可以采用离线或在线强化学习的方式对其进行训练。
而就在一周前,DeepMind发布了一个新视频,其中说到:
我们接下来要做一件大事(the next big thing),那意味着需要去尝试很多人们认为过于困难的事情。但我们一定要去尝试一下。
现在看来,这个next big thing就是指AGI了。
论文地址:
https://www.deepmind.com/publications/a-generalist-agent
参考链接:
[1]https://twitter.com/DeepMind/status/1524770016259887107
干货学习,点赞三连↓
通用人工智能最新突破!一个Transformer搞定一切相关推荐
- NLP通用模型诞生?一个模型搞定十大自然语言常见任务
翻译 | 于之涵 编辑 | Leo 出品 | AI科技大本营 (公众号ID:rgznai100) AI科技大本营按:目前的NLP领域有一个问题:即使是再厉害的算法也只能针对特定的任务,比如适用于机器翻 ...
- 将你的前端应用打包成docker镜像并部署到服务器?仅需一个脚本搞定
1.前言 前段时间,自己搞了个阿里云的服务器.想自己在上面折腾,但是不想因为自己瞎折腾而污染了现有的环境.毕竟,现在的阿里云已经没有免费的快照服务了.要想还原的话,最简单的办法就是重新装系统.而一旦重 ...
- python利器app怎么查文献-科研人必备:一个工具搞定文献查阅、数据分析、模型搭建...
原标题:科研人必备:一个工具搞定文献查阅.数据分析.模型搭建 写论文有多难?这首诗形容得好: 进入学校先选题,踌躇满志万人敌:发现前辈都做过,满脸懵逼加惊奇. 终于找到大空白,我真是个小天才:左试右试 ...
- 封装一个类搞定90%安卓客户端与服务器端交互
本实例封装了一个处理安卓客户端与服务器端交互的几个方法,对于中文乱码问题本实例也找到了解决方案.本例可以处理的场景如下: 1.与服务器端交互json数据. 2.Get方式与服务器端交互数据. 3.Po ...
- labview 重新启动后上次_还在为labview保存参数而苦恼吗?看看一个vi搞定全部
2020labview懒人参数存取-升级版 问题:项目编程过程中,参数存取是无论如何也没法避免的一个环节,因为程序设置完成后,下次再打开时如果要执行上次设置的参数,就需要加载上次保存的参数文件.那么以 ...
- 一个单片机搞定USB电阻式触摸屏,完美解决飞点问题。
一个单片机搞定USB电阻式触摸屏,完美解决飞点问题. 参考文章: (1)一个单片机搞定USB电阻式触摸屏,完美解决飞点问题. (2)https://www.cnblogs.com/zkp2010/ar ...
- php调用jssdk转发_php一个文件搞定微信jssdk配置
php一个文件搞定微信jssdk配置: 包括缓存,包括https通讯,获取微信access_token,签名什么的都有.但是防范性编程做得比较少,商业用的话,需要完善下代码. 使用姿势 ^ajax(C ...
- DS90C385MTD一个芯片搞定LVDS 大分辨率LCD
DS90C385MTD一个芯片搞定LVDS 大分辨率LCD http://www.gooogleman.com/forum.php?mod=viewthread&tid=378 转载于:htt ...
- 计算机怎么用函数计算销售额排名,用Excel算TOP项销售额占比?一个公式搞定所有!...
原标题:用Excel算TOP项销售额占比?一个公式搞定所有! 作者 | 拉登Dony 来源 | 拉小登(id:ladengchupin) 今日目标: 计算Top项销售占比 昨天遇到了一个提问,非常的头 ...
最新文章
- 图解反向代理和正向代理。
- CTFshow php特性 web97
- Redis 过期键删除策略、内存淘汰机制
- 我是如何学习写一个操作系统(一):开篇
- 前端学习(3275):js中this的使用四
- LeetCode 1944. 队列中可以看到的人数(单调栈)
- Docker精华问答:Docker与虚拟机的区别?| 技术头条
- CEH v8~v11 Module Slides 和 Lab Manual 下载
- java web 的map_javaweb开发过程中小工具系列之将Map转换成对象
- linux 日志编程(总结)
- JAVA入门[14]-Spring MVC AOP
- virtual关键字
- 拓端tecdat|R语言对苏格兰独立民意调查的Meta分析
- 使用Cargo入门rust语言
- 「干货」Web安全红队外围信息收集「详细总结」
- json对象转换为字符串数组 java_Json对象与Json字符串的转化、JSON字符串与Java对象的转换...
- 需求分析岗的一点总结
- [PMP] 什么是从众效应
- 2021年边缘计算融资汇总
- 改版后的51la统计,与旧版有何区别呢?