关注公众号,发现CV技术之美

本文转载自新智元。

来源:Google

编辑:好困 LRS

【导读】通用人工智能(AGI)的目标是训练的模型具有和人类相当的智慧,却惹得无数研究人员竞折腰。最近Jeff Dean发文,称他们正在研究下一代AI框架Pathways,目标直指AGI。这次凭借谷歌的「钞」能力,Jeff Dean能否再掀起一场AI革命?

前脚专攻通用人工智能(AGI)的DeepMind想脱离谷歌,后脚谷歌就提出了一种潜在的AGI架构。

前段时间Jeff Dean在TED表示他们正在开发一种超级智能的AI模型,目前只剩下道德相关的问题没有解决。

近日,Jeff Dean则亲自撰文,介绍了这个全新的机器学习架构——Pathways。

回顾过去20年计算机科学的研究中,或许没有哪个领域比AI 研究取得的进展更快。

在机器学习技术还没有那么惊艳的的2001, 谷歌的20号员工Jeff Dean就已经开始训练模型对谷歌搜索的错误查询进行纠正。

在后续的20年中,谷歌始终秉承AI first,为业界贡献了无数经典模型,word2vec,Transformer,BERT都极大促进了AI的发展。

Jeff Dean也成为了美国工程院院士,创建了Google Brain、开发谷歌机器学习开源框架TensorFlow,还是谷歌广告系统、谷歌搜索系统等技术的重要创始人之一,可以说是谷歌的技术奠基人。

但机器学习模型始终还处在一个固定的开发模式中,对于每个任务开发一个特定的模型,创建benchmark 来互相比拼,最后活下来的模型成为新sota。

这种研究方式虽然可以促进模型的研究,提升特定任务的性能,但离通用人工智能似乎已经越来越远了。

当一个任务需要变换输入数据时,现有的模型通常需要重新收集、标注数据,重新研究模型的架构,对于复杂环境的应变能力可以说是十分拉胯了。

Jeff Dean将这个新的模型架构Pathways,称为「下一代AI 架构」——只训练一个模型,就可以处理数以万计的任务类型。

下一代AI架构:Pathways

简单来说就是,Pathways能够让AI模型像人类一样思考。

问题1:传统AI模型训练后只能完成一个任务。

Pathways:训练一个模型可以做千上万个任务。

通常来说,每当处理一个新的问题时都需要训练一个新的AI模型,而这些数学模型的参数实际上是用随机的权重进行初始化,然后使用标注数据进行训练的。

但人类每次学习新技能的时候并不是这样。

这就好像说,你在学习跳绳时,又要忘记曾经所学过的一切技能,包括如何平衡、如何跳跃、如何协调双手的运动,直接从「爬」开始学习跳绳。

这或多或少就是如今训练大多数机器学习模型的方式:从无到有地训练每一个新的模型来做一件事,而且只做一件事(或者把一个通用模型用于一个特定的任务),而不是扩展现有的模型来学习新的任务。

直接导致的结果就是,数以千计的任务带来了成千上万的模型。这不仅让学习每个新任务的时间更长,而且还需要更多的数据来学习每个新任务,因为每次学习都需要从零开始学习关于世界的一切以及该任务的具体细节。

Google则希望训练一个模型,不仅可以处理许多独立的任务,而且可以借鉴和结合其现有的技能,从而更快、更有效地学习新任务。

举个例子,当一个模型学会了如何从航拍图像中预测地形和建筑的高度之后,它在学习一个新的任务,比如预测洪水带来的影响时,之前学到的那个知识在这时就会作为一个常识来辅助新的训练。

此外,模型也会有不同的能力,可以根据需要调用,并且还可以将多个模型拼接起来,进而执行新的、更复杂的任务。

问题2:AI模型只能实现一种感知。

Pathways:能够使用多种感官数据。

人类依靠多种感官来感知世界,这与当代AI模型系统处理信息的方式非常不同,现在的大多数模型一次只处理一种模式的信息。

模型的输入可以是文本、图像或语音,但通常无法同时处理所有的三种数据。

Pathways 也是一个多模态模型,能够包含视觉、听觉和语言理解。无论模型是在处理「豹子」这个词,还是豹子的「声音」,或是看到豹子奔跑的「视频」,内部都会激活相同的反应,从而理解豹子的「概念」。

训练产生的结果是一个更有洞察力、更不容易出错和产生偏见的模型。

当然,AI模型不需要局限于这些熟悉的感觉;Pathways可以处理更多抽象形式的数据,帮助找到人类科学家在复杂系统(如气候动力学)中难以发现的有用模式。

问题3:AI模型是密集且低效的。

Pathways:让模型变得稀疏且高效。

今天的大多数模型都是「密集型」的,这也就意味着,在完成一个不管是简单还是复杂的任务时,整个神经网络都会被激活。

而人类就不一样了,即便大脑中有近千亿个神经元,并且拥有许多不同的区域用于处理各种的任务,但我们只会在特定情况下调用其中一小部分来使用。

经过Pathways训练的AI也可以模拟人类大脑的行为,通过建立一个「稀疏」激活的单一模型,只有在特定任务需求的时候才会激活特定部分的神经元。

模型能够动态地学习网络的哪些部分擅长哪些任务,可以学习到如何找到模型的最相关部分来处理任务。

这种架构的另一大好处是,它不仅有更强大的能力来学习各种任务,因为不需要为每项任务激活整个网络,所以运行速度更快,并且更省电。

之前Google 也发表过类似的研究,GShard和Switch Transformer是两个参数量巨大的机器学习模型,但由于两个模型都使用了稀疏激活,在实际运行时消耗的能量不到类似规模的密集型模型的1/10,并且准确率还与密集型模型相当。

总结一下?

现阶段的机器学习模型,本可以出色地完成很多不同的任务,却只能选取其中一个过专业化;本可以综合各种不同类型的输入,却只能依赖其中的一种形式;本可以像专家一样熟练操作,却只能付诸于暴力计算。

这就是Pathways诞生的原因——让一个AI能够跨越数以万计的的任务,理解不同类型的数据,并同时以极高的效率实现。

不知道各位看完Jeff Dean的文章之后是怎样的一种感受,反正这位网友表示:「太肤浅了,以至于毫无用处」。

「虽然有很多远大的目标,却完全没有提到他们将如何去实现。」

当然了,也有网友对此表示十分期待。

「看起来非常令人兴奋。稀疏可扩展的深度学习可以向一个模型中依次添加任务。我也非常期待之后谷歌的开源代码和样本。」

但不要忘了,这想搞事的是谷歌,「钞」能力了解一下?

参考资料:

https://blog.google/technology/ai/introducing-pathways-next-generation-ai-architecture/

https://www.ted.com/talks/jeff_dean_ai_isn_t_as_smart_as_you_think_but_it_could_be/footnotes?utm_content=2021-10-28&utm_source=t.co&utm_medium=social&utm_campaign=social#t-13177

END,入群

谷歌又在开发新AI框架!这次瞄准的是:通用人工智能(AGI)相关推荐

  1. DeepMind 的新强化学习系统,是迈向通用人工智能的一步吗?

    作者:Ben Dickson 来源:数据实战派 前言 尽管已经掌握围棋.星际争霸 2 和其他游戏,深度强化学习模型的主要挑战之一是,它们无法将其能力泛化到训练领域之外.这种限制使得将这些系统在现实世界 ...

  2. DeepMind的新强化学习系统,是迈向通用人工智能的一步吗?

    尽管已经掌握围棋.星际争霸 2 和其他游戏,深度强化学习模型的主要挑战之一是,它们无法将其能力泛化到训练领域之外.这种限制使得将这些系统在现实世界中的应用变得非常困难,因为现实世界中的情况比训练模型的 ...

  3. 微软10亿美元投资AI公司助力云计算,研发通用人工智能

    7月22日,微软宣布将向人工智能创业公司OpenAI投资10亿美元,两家公司将为微软Azure云计算平台联合开发超级计算技术. 据华尔街日报当天报道,两家公司表示,微软和OpenAI计划开展强人工智能 ...

  4. Meta扎克伯格称已开发新AI翻译技术,直接翻译闽南语

    Meta首席执行官扎克伯格昨天在Facebook上贴出一段英语与闽南语AI口译翻译对话的视频,并表示目前正在开发AI口语翻译系统,让主要用于口说而非书写的语言(例如闽南语)可以被翻译. 与扎克伯格对话 ...

  5. AI周报丨中国信息通信研究院发布《AI框架发展白皮书》;华为开源首个NLP中文数据集-悟空;AAAI2022年度论文公布。

    AI周报丨中国信息通信研究院发布<AI框架发展白皮书>:华为开源首个NLP中文数据集-悟空:AAAI2022最佳论文公布. 2022年2月22日 极链AI云 官网地址 点击注册 更多AI内 ...

  6. 辩论届人机大战:IBM新AI完胜人类冠军!

    来源:智东西 导语:6月18日,IBM的AI系统Project Debater首次与人类进行现场公开辩论.Project Debater能够理解对方观点,并有针对性地做出清晰的反驳,最终成功战胜人类辩 ...

  7. 全球首个AI框架CC EAL2+证书 ,昇思MindSpore推开可信AI大门

    近日,昇思MindSpore正式通过SGS Brightsight实验室的安全评估,获得了AI框架领域的首份CC EAL2+证书. 作为全球最大的独立认证机构,SGS Brightsight可以说是全 ...

  8. 微软云服务再添新产品,这次来自两位华裔女科学家创办的AI公司

    微软云服务再添新产品,这次来自两位华裔女科学家创办的AI公司 微软的Azure AI又添了一项新产品. 这次是一个用于反欺诈的AI平台,来自DataVisor. 微软全球金融服务副总裁Janet Le ...

  9. 【AI周报】2021图灵奖揭晓;字节开源veGiantModel;阿里开源EPL;谷歌AI框架Pathways论文放出

    01 行业大事件 2021图灵奖揭晓: 高性能计算先驱.超算TOP500榜单创始人之一Jack Dongarra获奖 他曾说过:未来的计算架构会是 CPU 和 GPU 的结合. 守了一天,终于揭晓! ...

最新文章

  1. iphone6 充电电流测试软件,iPhone7支持快充? 9个充电器数据实测
  2. java 调用scala 类_如何使用java类加载器调用带参数的scala函数?
  3. 半正定问题与二阶凸锥问题(SDPSOCP)
  4. centos6.5 安装mono
  5. 【javascript】 的严格模式 详解
  6. 【论文写作】课程指导平台的开发中系统部分代码如何写
  7. 用unity协程写的发牌程序
  8. onclick获取当前节点
  9. 金庸群侠传苍龙逐日1.2-szlzw手机移植版攻略
  10. 百会:物联网推动CRM创造新型服务
  11. html5课件动画制作,ppt如何制作课件动画
  12. 用python绘制用例图源代码_用Visio画UML用例图
  13. 对antd中的表格筛选进行改造
  14. 域名dns劫持问题如何预防
  15. 孤独源于过分的优越感,而优越感的另一面,则是自卑
  16. Uncaught TypeError: xxx.push is not a function
  17. C++ 使用哈希表封装模拟实现unordered_map unordered_set
  18. ESXi 7.0 Update 1c中加入的systemMediaSize启动选项
  19. [绝招]快递公司抵制先验货再签收 不签字不能先验货
  20. 智慧油库人员定位管理系统“位”何而来?

热门文章

  1. 打开PHP时候,提示找不到指定模块解决办法
  2. Docker 学习前置,网络IP地址以及交互
  3. 龙门架式焊接机器人_一种龙门架式焊接机械手的制作方法
  4. 什么是php微信开发,php微信公众号开发模式详解
  5. flask爱家租房项目开发(十二)
  6. flutter 刷脸_传说哥教你如何假装架构师
  7. python判断某一天是一年中的第几天
  8. [转载] 晓说——第29期:海上霸主航母(上)
  9. 内容创业赛道分野,2018紧,2019更紧
  10. Python彩色图片转成黑白图片