萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

放任25个AI共同生活,他们竟然模拟起了人类的行动!

不仅像人一样起床、刷牙、吃饭、睡觉,还会被迫“出门打工”,甚至在闲暇时分一起庆祝节日。

这一切,来自斯坦福和谷歌的一项新研究——

他们做了一个很新的实验,创造了25个AI NPC,每个NPC都有不同的身份和行动决策,并让它们在一个沙盒环境中共同生活,背后依靠ChatGPT大模型来完成行动决策。

结果发现,这些AI NPC不仅会像人一样生活,如作家就去写作、店主就去经营商店,而且他们彼此之间还会发生交互,甚至产生对话:

研究一po出就爆火,宾大沃顿商学院教授Ethan Mollick表示:

这些行动相比“角色扮演”,更像是正常人类会做出来的行动。

OpenAI科学家Andrej Karpathy更是直呼“这让开放世界游戏相形见绌”:

所以,这个研究究竟构建了一个怎样的“AI社会”?

当AI玩起模拟人生

从Demo展示来看,这25个AI有着不同的身份、性格和年龄:

他们会在一个共同社区中生活,这些社区的构造非常详细,包括居住区、大学、公园、咖啡厅等:

可以看见,每个AI都有自己的基础行程,包括起床、洗漱、吃饭、睡觉等,根据不同的身份设定,又会做出不同的行动,共同维持社区的运转。

其中,Demo中的emoji简单代表了AI正在进行的操作,如收发信件和吃饭:

但在这其中,也会有交互行为产生:

用的也不是AI的语言,而是人类说话的方式:

不仅如此,这些相互之间可以产生互动的AI,甚至还能听取人类玩家的要求,并采取对应的行动。

例如论文作者提到,他们以人类的身份告诉其中一个AI NPC,希望在社区举办一个“情人节派对”的活动。

没想到,这位AI NPC不仅热情地答应了作者们的请求,自发开始组织起这场活动,包括时间地点和到场人物等:

看到这里,已经有网友表示“太疯狂了”——

对于玩家来说,相比遵循步骤,以后在游戏中可能真的需要去说服NPC或思考并采取行动,才能完成任务。

还有脑洞大开的网友想到了更加“邪恶”的玩法:

想象你杀死了一个NPC,然后坐车回到城市,看着他们为他举办葬礼……

那么,这些AI究竟是如何自发行动,构建起一个自运转的AI互动社会的呢?

用大模型控制行动决策

具体来说,斯坦福和谷歌分两步让AI们采取行动、与其他AI发生交互。

第一步,是构建各种各样的AI“人设”,并让他们做出符合设定的日常行动来。

这里我们以其中一个AI角色John Lin为例,在Demo中可以找到他的设定列表。

可以看见,他的设定非常详细,包括基础信息(姓名、年龄、位置、时间),注意力设定(视野范围等),个人情况(性格、家庭背景、工作等)。

以此为参照,这位名叫John Lin的AI就能形成每天固定的生活习惯,包括早起例行洗漱,然后上班,最后回家睡觉。

但在他的生活过程中,必定会与其他AI沟通、或是遇到新人,于是——

第二步,就是要让AI人设对外界环境和其他人的行动做出反应,产生交互

于是,这项研究构建了一种赋予AI记忆力、检索记忆、感知、反馈和交互等能力的架构。

从架构图来看,AI会首先感知周遭环境,并将一定视野(注意力)范围内发生的事件记录下来,加进自己的记忆流(memory stream)中;

随后,无论是AI计划要做的事(plan)、还是对外界发生的事情给出反馈(reflect),都会受到这个记忆流的影响,具体方式是通过从记忆中检索对应的事件,并依靠大模型ChatGPT来进行决策

(当然,无论是计划还是反馈,对应的事件也会加入记忆流中,成为新的记忆)

最后,这些决策的结果将被转变为具体的方案,促使AI思考并做出具体的行动。

研究提到,之所以采用大模型+记忆架构的方式,是因为大模型虽然已经具备非常好的行动逻辑性,但无论是GPT-4还是其他大模型,长期规划和保持清晰的记忆仍然是一种挑战。

基于此,需要一套记忆系统作为大模型的“参照物”,让它在采取决策的时候有清晰的事件列表可以回溯。

不过,这项研究也提出了一些关于AI安全的问题。

包括如何防止它对社会产生的影响,同时被有心之人用于生成Deepfake和“定制版”AI诈骗等——

例如,以后和你聊天的AI卖茶小妹,可能不仅会记得你说过的每一件事情、每一个生日,甚至还能以此为参照,生成更加“贴心”的回答,让“她”看起来更像一个人……

One More Thing

值得一提的是,此前国内也已经有名叫超参数科技的公司做出了类似的AI NPC系统GAEA。

和斯坦福谷歌这项研究一样,GAEA同样具备记忆系统,并依靠大语言模型来帮助NPC做出行动决策。

不过,二者促使AI产生行动的激励机制有一些差异。相比这项研究依靠大模型来完成行动决策:

GAEA中的AI还会额外依靠更具体的数值,进一步影响NPC的行动决策(饥饿值、心情值等):

对于这类AI NPC技术,你还想到了什么脑洞大开的玩法?

试玩地址:
https://reverie.herokuapp.com/arXiv_Demo/#

论文地址:
https://arxiv.org/abs/2304.03442

参考链接:
[1]https://twitter.com/emollick/status/1645499660402925576
[2]https://twitter.com/karpathy/status/1645485475996790784

用ChatGPT控制NPC,行动逼真到像正常人!斯坦福谷歌新研究炸场,赋予大模型准确记忆力...相关推荐

  1. 找不出破绽!斯坦福等新研究:随意输入文本,改变视频人物对白,逼真到让作者害怕...

    栗子 安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 细思极恐的事情还是来了. 斯坦福和普林斯顿大学等最新研究:给定任意文本,就能随意改变一段视频里人物说的话. 并且,改动关键词后人物口型 ...

  2. 复旦大学教授肖仰华:ChatGPT 浪潮下,面向大模型如何做数据治理?

    嘉宾 | 肖仰华 编辑  | 伍杏玲 出品 | CSDN 由 ChatGPT 引起的大模型热潮正席卷当下.众所周知,大模型的建立离不开海量数据,且大模型的最终效果取决于数据的质量,数据越丰富.质量越高 ...

  3. 《花雕学AI》讯飞星火认知大模型的特点和优势,与ChatGPT的对比分析

    引言: 人工智能是当今科技领域的热门话题,自然语言处理是人工智能的重要分支.自然语言处理的目标是让计算机能够理解和生成自然语言,实现人机交互和智能服务.近年来,随着深度学习的发展,自然语言处理领域出现 ...

  4. ChatGPT大模型用于刑侦破案只能是虚构故事吗?AI大模型企业服务趋势探讨(一)...

    故事开始了. 一阵疼痛痉挛,脚下地面渐渐返潮,他知道又要下雨了. 刑警老周摸索着爬到台阶的高处,等待老城区电子工厂夜班的收工铃声.素来挡风的夹克挡不住湿冷刺骨的潮气.这股子潮气里还不时翻滚浓烈的腐败腥 ...

  5. ChatGPT 与AI大模型发展简要综述

    来源:数据观综合 编辑:蒲蒲 " 日前,美国硅谷的初创公司OpenAI推出了一款新的人工智能对话模型ChatGPT,模型中首次采用RLHF(从人类反馈中强化学习)方式. 目前,模型处于测试阶 ...

  6. 一场关于ChatGPT话语权的深度思考:人类会在大模型中迷失自我吗?

    大数据文摘授权转载自AI科技评论 作者:Elizabeth Weil 译者:ChatGPT 编辑:孙溥茜 ChatGPT 之风愈演愈烈,华盛顿大学语言学家 Emily M. Bender 公开反对让大 ...

  7. 摩根大通打造ChatGPT式人工智能服务;度小满开源金融大模型“轩辕”;2022年中国数字孪生市场规模超100亿元丨每日大事件...

    ‍ ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 企业动态 阿里巴巴:网传裁员为谣言,今年预估新招15000人 5月25日,阿里巴巴集团官微宣布,2023年六大业务集团总计需新招15000人 ...

  8. 《预训练周刊》第66期:智源2022大模型创新论坛、 ChatGPT手把手debug代码、AI与物理的交融...

    No.66 智源社区 预训练组 预 训 练 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<预训练周刊>已经开启"订阅功能",以后我们会向您自动推送最新版的&l ...

  9. 大模型多模态Chatgpt+自动驾驶控制器设计方案

    /导读/ 最近的科技圈,大家都被微软推出的ChatGPT刷屏,作为工智能公司OpenAI于2022年11月推出的聊天机器人,其能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至 ...

最新文章

  1. R语言ggplot2可视化:使用ggrepel包在线图(line plot)的尾端那个数据点添加文本标签(text label)
  2. iOS学习笔记(1)--认识Xcode6.1的Interface Builder和常用快捷键
  3. 【原创】用J-LINK烧写ARM开发板的Nor Flash
  4. 2、数据库需求分析阶段详解
  5. 苹果公司的企业文化_百度、苹果、脉脉等互联网大厂的企业文化衫还能这么潮?...
  6. 一个会“说话”的油箱盖,告诉你每一滴油的去向
  7. 为什么到今天还要坚持写博客
  8. 虚拟机系统iso镜像下载_如何下载正版系统镜像
  9. redis缓存数据库技术
  10. [已实现]暴力破解路由器管理密码
  11. 区块链相关技术学习总结(1)——区块链以及区块链技术入门详解
  12. 爬虫,酷我音乐接口解析
  13. 顺丰该不该开除删库的运维工程师?
  14. 做读书笔记好用的软件分享
  15. MIPI CSI-2笔记(16) -- 数据格式(YUV图像数据)
  16. 阿里真的开始衰落了吗?
  17. 杜洋面包板入门电子制作学习笔记 第2集
  18. Single Variable Calculus 总结
  19. 小学老师工资多少一个月_小学教师工资待遇现在怎么样?乡村老教师含泪哭诉!...
  20. 想学java老师建议学python怎么办?IT培训常见骗局汇总

热门文章

  1. Git快速入门(Win版+IDEA+Gitee实战)【基于狂神讲解】
  2. python项目之博客系统开发-李杰-专题视频课程
  3. php require的用法,php引入外部文件require和include的用法
  4. 网站请勿随意使用第三方CDN资源调用公开库资源 - 聆听分享网
  5. java swt canvas_SWT中的canvas
  6. HashMap的时间复杂度是O(1)
  7. 自然数拆分问题的解法与感悟(C++)
  8. FMU40ARB1A2超声波液位计FMU40ANB1A2优质服务
  9. 流氓软件的对抗之路续集,如何定位删除流氓软件
  10. 25.STM32光传感器