大数据文摘出品

来源:bdtechtalks

编译:Hippo

GPT-3是人工智能研究实验室OpenAI的最新成果。它是有史以来规模最大的语言模型,引发了一系列关于人工智能将如何快速改变众多行业的讨论。

但是,很少有人去讨论GPT-3是如何改变OpenAI本身的。在创建有史以来最成功的自然语言处理系统的过程中,OpenAI已逐渐从一个非盈利性人工智能实验室演化成一家出售人工智能服务的公司。

由于纠缠在两个相互矛盾的目标之间,该实验室处于一种不稳定的状态。一方面要开发有利可图的人工智能服务,另一方面又要探索人类级别的人工智能并造福所有人。在这之间寻求平衡是OpenAI成立的特殊使命。

OpenAI构架的变化

2019年3月,OpenAI宣布它将从非营利实验室转变为“盈利设限”公司。这种模式为从投资者和大型科技公司筹集资金开辟了道路,投资方被告知他们的回报将以投资额的100倍为上限(这上限够诱人!)。

为什么会发生这样的架构变化?该公司在一篇网站告示中宣布,此举旨在“迅速增加我们在算力和人才方面的投资以平衡实现公司使命所需要的支出。”

“算力和人才”是这里的关键词。

人才和算力成本是人工智能研究的两个核心挑战。从事OpenAI这类研究的人才库非常有限。鉴于对人工智能商业化的兴趣日益浓厚,大型科技公司之间在为自己的项目招募人工智能研究人员时存在激烈的竞争。这引发了一场军备竞赛,每家科技巨头都给出更高的薪水和津贴以吸引人工智能研究人员。

Google和Facebook抢走了3位深度学习鼻祖中的2位,即Geoffrey Hinton和Yann LeCun。备受尊敬的人工智能专家Ian Goodfellow(同时也是对抗式生成网络GAN的发明者)就职于Apple,另一位人工智能天才Andrej Karpathy在Tesla工作。

OpenAI对科学研究仍然有浓厚的兴趣,但是随着大多数人工智能人才被吸引到可以提供丰厚薪水的公司,非营利性人工智能实验室发现要填补他们的职位空缺越来越难,除非他们能够提供类似水平的薪水。根据2018年《纽约时报》的报道,只有少数OpenAI的研究人员每年能获得超过100万美元的收入,而报告称另一家人工智能研究实验室DeepMind在2018年向700名员工支付了超过4.83亿美元的薪水。

深度学习算法是人工神经网络的主要组成部分,而其算力需求是导致人工智能成本进一步增加的主要原因。在能够胜任实际任务之前,神经网络必须对利用大量案例进行训练,这一过程需要昂贵的计算资源。近些年OpenAI参与了一些非常昂贵的人工智能项目,包括通过机械手臂玩转Rubik魔方,通过扮演游戏对手击败Dota2冠军,以及一组人工智能扮演不同角色玩500万次捉迷藏游戏。

据估计,训练GPT-3至少需要460万美元。需要明确的是,训练深度学习模型并不是一个纯粹的一次性的过程。反复的试验、意外的错误和超参数调整可能会使成本增加数倍。

OpenAI并不是第一个采用商业模式的人工智能研究实验室。面对类似的困境,DeepMind在2014年接受了Google提出的6.5亿美元的收购提议。

OpenAI领导层的变化

在联合创始人之一Sam Altman的领导下,OpenAI开始向投资者开放市场化营销,他辞去了备受推崇的创业加速器Y Combinator的总裁一职并成为OpenAI的首席执行官。

在Altman之前,Greg Brockman是该组织的代表。Brockman是OpenAI的联合创始人兼CTO,同时也是一位经验丰富的科学家和工程师。

在科技投资领域,声誉和产品管理能力比科学天才更受重视,而Altman正是那种受投资者信任,并能把资金交给他管理的人。在Y Combinator任职期间,他帮助创立了许多成功的公司,包括Airbnb和Dropbox。

2019年5月,在接受知名科技媒体TechCrunch采访时,Altman说:“我们从未取得任何收益,目前也没有赚钱的计划。也许某一天我们会赚到钱,但我们并不知道如何做。”

但这并没有妨碍投资者对OpenAI大笔投资。微软相信Altman会以某种方式找到使投资获利的方法,因此他们在7月向该公司提供了10亿美元的投资。

OpenAI任务的改变

但是,技术投资公司和类似OpenAI这样的科学研究实验室是存在根本上的冲突的。

OpenAI的既定使命是确保能够“构建安全的通用人工智能(AGI)并向全世界分享这项技术来惠及全人类”。

但是根据专家估计,要想实现AGI这个崇高的目标至少需要几十年的时间,而科技投资者的耐心极少能有那么久。如果几年之内其投资无法得到回报,他们将会变得懈怠。对于这一点只需要看看著名的Boston Dynamics(波士顿动力公司),尽管在YouTube上发布的机器人视频像病毒似的疯狂传播,但筹资者已经几度易手。

那么,OpenAI如何能够在保持AGI研究的同时获得资助者青睐?

“OpenAI正在开发一系列功能越来越强大的人工智能技术,这需要大量资金以支撑算力。想要覆盖这些成本最显而易见的方法是制造出一个产品,但这将意味着我们工作重心的转移。我们选择了折中的方法,我们打算推出部分“准AGI”技术,而微软成为我们将这些“准AGI技术”商业化的首选合作伙伴,”OpenAI在宣布获得Microsoft投资的博客公告中写道。

相关链接:

https://openai.com/blog/microsoft/

但是有明显迹象表明,OpenAI至少部分地成为了一家产品公司。

GPT-3的商业版本

2020年5月,Microsoft宣布与OpenAI合作并专门为OpenAI建设世界前五名级别的超级计算机,由此Microsoft可以充分挖掘OpenAI的才能来创建Altman所说的“我们的梦想系统”。超级计算机一方面将帮助OpenAI训练其深度学习模型,另一方面还将为Microsoft Azure云计算平台的其他客户提供服务。

此后不到两周,OpenAI在arXiv(论文预印本网站)上发表了第一版的GPT-3论文。与之前的GPT-2不同,GPT-3不会向公众发布。OpenAI选择了商业发布,开发人员可以通过应用程序编程接口(API)购买对GPT-3的访问权限。

OpenAI 的API公告于6月11日发布,一些开发人员可以获得相关技术的早期访问权限。

这使GPT-3与微软认知服务(Microsoft Cognitive Services)十分相似,后者是一个基于黑盒子的人工智能云平台,通过API接口向开发人员提供计算机视觉、自然语言处理和其他人工智能类功能,同时无需提供后台运行的模型的实际细节。

这至少将帮助OpenAI返还Microsoft投资的一部分,同时Microsoft也将从双方合作中受益并更深入地应用该项技术,能够将其与Bing,Office 365,Outlook.com和Teams等产品集成。

GPT-3的商业发布使OpenAI与成为人工智能产品公司更近了一步,而与非盈利性人工智能科学研究的初衷越发偏离。

淡化人工智能警告

在开发出GPT-2后,基于对“技术的恶意应用”(例如散布垃圾邮件和虚假新闻)的担忧,OpenAI团队决定不向公众发布。取而代之的是采用了分阶段的方法,先发布了一个较小版本的人工智能模型并进行了评估,之后才发布了较大的模型。

虽然当时的作者认为性能良好的语言模型不会造成假新闻的泛滥,但他也支持在发布技术之前先认真地思考一下这种技术可能带来的后果。

GPT-3比GPT-2大三个数量级。在深度学习的语言模型中,关键问题之一是记忆广度。随着神经网络生成的文本变长,人工智能开始失去连贯性。实验表明,较大的神经网络通常具有较长的记忆广度,这意味着GPT-3中被误用的可能性比GPT-2要大得多。

但是这次OpenAI并没有为GPT-3可能成为制造垃圾邮件机的和虚假新闻的武器而大声疾呼。相反,OpenAI高管们试图淡化有关GPT-3的警告。7月, Sam Altman在一条推文中删除了“ GPT-3宣传”。

Altman的评论大部分是正确的,因为人工智能在达到人类智力水平之前还有一段路要走。GPT-3的许多实验表明,尽管取得了令人着迷的进步,但语言模型仍然难以解决一些体现智能的基本任务。

尽管如此,Altman的言论依然可以表明公司高管向投资者保证一切都在控制之中。

作为产品公司的OpenAI

GPT-3自发布以来受到了技术界的广泛好评。许多开发人员和企业家都发布了GPT-3自动生成内容的推文,例如诗歌、模因(文化的基本单位,与基因在生物进化过程中所起的作用相类似)、推文和网站模型。

一位开发人员甚至设法用GPT-3生成Python代码用来搭建深度学习模型。

GPT-3具有明显的优势,并有可能成为人工智能业务的转折点。深度学习的主要限制之一在于它是狭义的人工智能系统。它在特定的任务上可以表现很好,但推广到其他领域中就表现不佳了。想要创建一个新的深度学习应用程序,就必须从零开始训练模型或运用迁移学习对新任务的预训练模型进行参数微调。

这种限制阻碍了人工智能服务作为平台的发展。尽管GPT-3仍然属于狭义的人工智能领域,但事实证明,它在许多没有学习样本的训练中依然能够运行。这就意味着你无需重新调整参数,它也能适应新的应用程序。

这种功能已经催生了许多运用人工智能模型创造新服务的点子。Debuild.co就是这样一个通过GPT-3创建Web应用程序的公司。

帮助租户研究潜在房东的公司Augrented,正在探索通过GPT-3撰写法律告示或其他简单的英语声明,帮助租户捍卫自己的权利。

OthersideAI也在运用GPT-3向用户提供创意工具。

GPT-3最终可能会成为一个新平台,在此平台上将创建新的业务和生态系统。这对于Altman是成功的,但是它会使OpenAI成为一个产品/服务公司,这与发布开源人工智能模型并让开发人员用它来做自己的事情是完全不同的。

现阶段的OpenAI需满足客户需求,扩展其基础架构,处理合规性问题等。随着人工智能模式成为初创公司生死攸关的力量,OpenAI还必须能够应对开展深度学习业务所带来的特定挑战。OpenAI仍有许多问题需要处理,如消除有害偏差,解决模型衰减等等。这些都是成本极其高昂的任务,处理1750亿参数的深度学习模型尤为如此。

与此同时,OpenAI在需要弄清如何解决这些事情的同时,还需保持盈利。

尽管Altman是一位非常成功的企业家,他也无法单打独斗。随着OpenAI进一步涉足产品管理领域,它将需要Microsoft的更多帮助。

OpenAI已经在依靠Microsoft的云架构来训练和运行其模型,但不久的将来,它可能需要这家技术巨头来协助处理合法性、客户支持、安全隐私、产品扩展等其他问题。

OpenAI的未来

旧金山OpenAI总部

OpenAI的故事描绘出了科学人工智能研究面临的挑战。目前,人们普遍认为更大的深度学习模型将发展出更先进的人工智能系统。这意味着人工智能研究实验室需要大量资金吸引人才来训练他们日益庞大的深度学习模型。

目前,唯一愿意提供资金的是那些大型高科技公司,但投资者同样希望获得投资回报,这就迫使研究实验室不得不利用部分资源来创造有利可图的产品。如此一来,大型公司可能会完全将实验室纳入自己的商业目标。

在Google收购DeepMind之后,我们已经看到了这种趋势:人工智能实验室必须将资源同时分配给AGI研究部门和致力于创造可盈利产品的“应用人工智能”部门,但是该公司尚未实现收支平衡。

至于OpenAI,它现在还发展的很好。越是困于将人工智能服务商业化,不忘初心就越难。它是会坚持维持研究人类智力水平的人工智能的透明性、坚持开放源代码性质,还是会倾向于通过生产商业实体,并将其研究作为公司的机密和知识产权予以严密保护?它是会坚持“以人为本”,还是以满足投资者(及未来所有者)作为其主要关注点?

时间会证明一切。

相关报道:

https://bdtechtalks.com/2020/08/17/openai-gpt-3-commercial-ai/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

改变宇宙之前,GPT-3最先改变的可能是OpenAI相关推荐

  1. 马云:你改变不了特朗普,你连你妈都改变不了,你要改变你自己

    整理 | 非主流 出品 | AI 科技大本营 1 月 3 日,世界浙商上海论坛暨上海市浙江商会第十次会员代表大会在上海举行.马云在大会上发表主题演讲,依旧金句频出. 回望 2018,马云表示,「201 ...

  2. [react] 在react中怎样改变组件状态,以及状态改变的过程是什么?

    [react] 在react中怎样改变组件状态,以及状态改变的过程是什么? 使用this.setState改变组件的状态 改变的过程中,React Fiber Reconciler遍历了整个Fiber ...

  3. 数据共享如何改变世界_如何改变他人?“我不会去改变这个世界,我们会去改变自己”。...

    我们每一个人都经常觉得,如果要是别人改变了的话,我们就会变得快乐,如果别人会做这一点的话,我就会变成快乐.我们就是一直不断地去努力,而且也希望别人可以改变. 我见到很多的人,来参加我们的课程,带着这样 ...

  4. 普通的人改变结果,优秀的人改变原因,顶级优秀的人改变模型

    普通的人改变结果,优秀的人改变原因,顶级优秀的人改变模型:想必又是要不知道几年时间和多少历练才能彻底悟透这句话,并且言行一致. 改变思维,一下子说不出到底哪本书改变了我的思维或者说提升了思维方式,但对 ...

  5. 改变网changeself.com,记录着改变生活、改变态度、改变思维方式、改变特质、改变行为方式,一切从改变自己身上的特质开启

    改变网致力于提供如何改变相关信息.改变生活.改变态度.改变思维方式.改变特质.改变行为方式,一切从改变自己身上的特质开启.随着人们对生活品质的追求不断提升,怎样让自己变得更具有魅力和品位,如何改变自己 ...

  6. 心若改变,态度就会改变;态度改变,习惯就改变;习惯改变,人生就会改变

    很久很久以前,人类都还赤着双脚走路.有一位国王到某个偏远的乡间旅行,因为路面崎岖不平,有很多碎石头,刺得他的脚又痛又麻.回到王宫后,他下了一道命令,要将国内的所有道路都铺上一层牛皮.他认为这样做,不只 ...

  7. 改变不了环境,学会改变自己!

    人生,就像一条连续不断的抛物线,有高峰,也有低谷,不断的循环往复,直至我们生命的结束.我们每个人都希望自己一生都能够处于顺境.于是我们对低谷抱有着抵触的心理,对它的降临很是抗拒.殊不知没有低谷沟壑的人 ...

  8. html中单选按钮设置监听事件,浅谈监听单选框radio改变事件(和layui中单选按钮改变事件),单选框radio...

    浅谈监听单选框radio改变事件(和layui中单选按钮改变事件),单选框radio 若是只引用jquery的话,监听单选按钮改变事件如下: 男 女 $(document).ready(functio ...

  9. 改变可以改变的事,接受不能改变的事--达达的马蹄 kanninstar

    改变可以改变的事,接受不能改变的事 1.不管环境如何,目前做的事情就是定下心来,好好学习 2.积极改变可以改变的事,用平静之心接受不能改变的事情 3.跟人打交道,态度最重要,如论何时,礼貌为先 4.自 ...

最新文章

  1. gin路由打开html页面,Gin(二):使用路由
  2. vue引入vue-amap
  3. 计算机丢失qt4core.dll,qtcore4.;dll文件丢失。怎么办?
  4. php echo输出两个变量,php实现关于var_dump和echo输出多变量的测试
  5. 性能监控工具yourkit的安装及eclipse、tomcat的集成
  6. BZOJ2005 [NOI2010]能量采集
  7. Android 高德地图No implementation found for long com.autonavi.amap.mapcore.MapCore
  8. SVPWM调制的simulink仿真
  9. 苹果iPhone/iPad不越狱怎么破解付费APP?
  10. 你可以更幸福(转载)
  11. 微信小程序——使用npm包、分包
  12. Go使用qrcode包解析微信和支付宝二维码,生成一个链接(前端拿到链接即可解析成对应的支付二维码)
  13. 移动Ad Hoc下按需距离矢量路由协议AODV实验报告
  14. 理论物理极础4:质点系
  15. 设置U8g2库函数字体的方法
  16. 华清远见C语言笔试题,华清远见C语言学习笔记五
  17. 数据传输网络 三层结构体系(核心层 汇聚层 接入层)
  18. Android获取手机屏幕宽度
  19. BLE-SDP服务发现协议
  20. 基于Android的家庭财务管理系统

热门文章

  1. 分分钟带你杀入Kaggle Top 1%
  2. matlab中中图像PSNR和SSIM的计算
  3. 基于2-channel network的图片相似度判别
  4. 零知识证明实践教程,第一部分
  5. 独家 | 几个Jupyter笔记本的使用技巧
  6. 一本算法刷题必读配套书(附链接)
  7. NLP技术在海外金融机构的应用
  8. 报名 | AI Time :论道AI安全与伦理
  9. 清华中德大数据研究学生交换项目成果报告会成功举办
  10. SAP IDoc Post不成功,报错 - Conventional invoice verification no longer maintained as of Release 4.6-