出品 | AI科技大本营(ID:rgznai100)

3月20日,北京智源人工智能研究院发布我国首个超大规模智能模型系统“悟道1.0”。“悟道1.0”由智源研究院学术副院长、清华大学唐杰教授领衔,带领来自北京大学、清华大学、中国人民大学、中国科学院等单位的100余位AI科学家团队联合攻关,取得了多项国际领先的AI技术突破,形成超大规模智能模型训练技术体系,训练出包括中文、多模态、认知、蛋白质预测在内的系列模型,勇闯通用智能发展前沿,构建我国人工智能应用基础设施。同时,与龙头企业共同研发工业级示范性应用,加快大规模智能模型应用生态建设。

从“大炼模型”迈向“炼大模型”,“悟道”模型旨在探索通用智能

会上,智源研究院院长黄铁军教授介绍了“悟道”模型研发的初衷。据他介绍,本轮人工智能浪潮的基本特点是“数据+算力+算法=模型”,模型浓缩了训练数据的内部规律,是实现人工智能应用的载体。近年来人工智能的发展,已经从“大炼模型”逐步迈向“炼大模型”的阶段,通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用,这是必然趋势。

智能模型不仅要规模大(主要体现为参数量),还要智商高,才能满足各种应用需要,这需要突破大量技术挑战。例如:如何使得预训练模型具备像人类一样的符合逻辑、意识和推理的认知能力?如何实现对图、文和视频等多模态数据和信息的理解和建模的统一?如何将中文融入预训练模型,推动中文应用背景下的人工智能的发展?如何使得预训练模型深入融入自然科学研究,在目前基础上进一步实现对超长/复杂蛋白质序列的建模和预测?

会上,“悟道”模型技术委员会主任、智源研究院学术副院长唐杰教授介绍了“悟道”模型的战略布局及阶段性成果。据介绍,“悟道1.0”先期启动了4个大模型的研发:面向中文的预训练语言模型悟道·文源、首个公开的中文通用图文多模态预训练模型悟道·文澜、具有认知能力的超大规模预训练模型悟道·文汇、以及超大规模蛋白质序列预测预训练模型悟道·文溯。

在科研方面,“悟道1.0”模型正在逐步搭建并完善超大规模预训练模型技术体系,取得了多项国际领先的AI技术的突破:在基础性能方面,在自然语言理解和生成、跨视觉和文字的理解与检索等多项任务上取得更好表现;针对预训练模型有效使用,提出高效算法;进一步实现规模和性能的扩增中面临的挑战;以及建设并开放了全球最大中文语料数据库WuDaoCorpora。

应用生态“三步走”:探索“悟道”大模型生态发展

在模型研发的同时,智源研究院也在同步探索“悟道”模型的应用生态建设模式。据唐杰教授介绍,后续“悟道”模型将以开放API(应用程序接口)的形式对外提供服务,用户通过申请并经授权后可以基于模型API开发各类智能化应用。另外,也会开源模型的社区版本,服务我国AI科研发展。

下一步,“悟道”模型应用生态建设分为三个主要阶段,分别关注示范应用、API生态及社区运营维护等。第一阶段为示范性应用搭建,将构建面向电子商务、智能文本服务、垂直领域以及数个独立的示范性应用,将开放几个高质量的应用Demo,支持用户在平台页面上使用及测试。第二阶段为API及平台生态构建,将设计多个API,支持对模型的不同请求方式,构建支持高并发、高速推理的API接口,分别支持企业级用户、个人独立开发者对模型或特定功能的请求。第三阶段为社区运营及迭代,将逐步增量扩大在线评测,构建开发者及使用者社区,建立完善的使用反馈机制,并作为模型迭代的参考标准,同时加强社区维护及管理,加快模型迭代。

目前,智源研究院已启动第一阶段的示范性应用搭建,正与快手、搜狗、360、阿里、智谱华章、一览群智、循环智能、新华社等机构就模型的应用进行洽谈,联合构建一批工业级示范性应用。

下一步,智源研究院将加强用户的开发,做好用户服务,与AI龙头企业共同研发更多工业级示范性应用,并将加快推动API生态构建及社区运营迭代工作,通过举办学术交流、技术挑战赛等活动提高“悟道”模型的影响力,吸引更多AI企业、研究机构、个人开发者等开展基于模型的应用开发工作,推动构建国际领先的超大规模智能模型应用生态。

此外,为了更好地推动“悟道”大模型的研发,保持研发过程中技术的领先性,此次发布上,还同时成立了由北京大学鄂维南院士等9位来自学术界和产业界的顶尖科学家组成的“悟道”大模型技术委员会。

更多精彩推荐
☞Python 玩出花儿,把罗小黑养在自己桌面☞315 曝光人脸识别摄像头,进店瞬间偷走你的“脸”,自动分析心情☞玩转3D全息图像!AI即刻生成☞在 5G 速度上,iPhone 12 只是个弟弟

​对标GPT-3、AlphaFold,智源研究院发布超大规模智能模型系统“悟道1.0”相关推荐

  1. 智源研究院发布世界首个“机器学习通用数学符号集”

    上周举行的智源大会嘉宾众多.信息量巨大,相信很多老师同学都会觉得有点应接不暇吧.智源研究院在大会上有很多重要的发布,因为时间关系,来不及展开.今天我们要好好说说其中非常有意义的一项.这就是智源研究院组 ...

  2. 智源研究院发布“智能体系架构与芯片”重大研究方向,打造通用智能处理器,突破“算法共性特征”难题...

    9 月 18 日上午,北京智源人工智能研究院(以下简称"智源研究院")在北大科技园举行"智能体系架构与芯片"重大研究方向发布会,智源研究院院长黄铁军以及北京人工 ...

  3. 智源研究院发布“智能信息检索与挖掘”重大方向,打造北京学派,联合攻关“个人智能信息助手”关键科学问题...

    8 月 27 日上午,北京智源人工智能研究院(以下简称"智源研究院")举行"智能信息检索与挖掘"重大研究方向发布会,北京市科学技术委员会党组书记.主任许强出席会 ...

  4. 智源研究院发布“源创计划”,助力人工智能创业项目加速

    6月3日,智源研究院张宏江理事长发布"源创计划",旨在支持人工智能领域创业项目加速,促进AI原创成果转化落地. "源创计划":最懂AI创业的加速计划 (智源研究 ...

  5. 智源研究院发布《2020北京人工智能发展报告》,剖析北京AI发展的17个中国“第一”...

    11月14日,北京智源人工智能研究院(简称"智源研究院")召开2020智源论坛,会议期间发布<2020北京人工智能发展报告>(以下简称<报告>).<报 ...

  6. 中文版GPT-3来了?智源研究院发布清源 CPM —— 以中文为核心的大规模预训练模型...

    清源 CPM(Chinese Pretrained Models)是北京智源人工智能研究院和清华大学研究团队合作开展的大规模预训练模型开源计划,清源计划是以中文为核心的大规模预训练模型.首期开源内容包 ...

  7. AI 时代保护儿童刻不容缓!智源研究院发布我国首个儿童人工智能发展原则《面向儿童的人工智能北京共识》...

    2020年9月14日,北京智源人工智能研究院(以下简称"智源研究院")联合北京大学人工智能研究院.清华大学人工智能研究院.清华大学人工智能国际治理研究院.中科院自动化所.中科院计算 ...

  8. 打造生物智能和人工智能“双螺旋”,智源研究院发布“人工智能的认知神经基础”重大研究方向...

    2020年8月24日,北京智源人工智能研究院(以下简称"智源研究院")在清华智源中心举行了"人工智能的认知神经基础"(以下简称"认知神经基础" ...

  9. 智源研究院发布“知识疫图-全球新冠疫情智能驾驶舱”,一键预测、跟踪和决策辅助...

    近日,北京智源人工智能研究院数据开放研究中心联合清华大学.中国工程科技知识中心.清华大学附属北京长庚医院.阿里巴巴智能计算实验室.搜狗搜索.智谱.AI等单位,正式发布"知识疫图-全球新冠疫情 ...

最新文章

  1. php5.3二进制包,php使用pack处理二进制文件的方法
  2. python图片马赛克_python 检测图片是否有马赛克
  3. SAP UI5 how the ui library theme parameter is loaded
  4. 《深入理解Java虚拟机》读书笔记3--垃圾回收算法
  5. ALBERT、XLNet,NLP技术发展太快,如何才能跟得上节奏?
  6. 决策树(五)--OpenCV决策树
  7. vba宏语言_Excel VBA(1) – VBA 简介及录制宏
  8. 此语言无法安装在此计算机上win10,如何解决Win10换成无法安装英文语言包的问题...
  9. 如何把后缀为.mdf的文件打开
  10. Unity用代码将多张图片合并为一张图片
  11. 博物馆 库房rfid_博物馆RFID综合管理解决方案
  12. 生先森依旧怀抱初心,满载爱意
  13. 安卓实现每日一句功能-一言API调用
  14. ios13.3 降级13.2.3绕id
  15. 一款开源免费的办公套件系统:DzzOffice详细部署
  16. html mebed高度问题,高中英语中最易犯的100个错误,看看你有多少?
  17. 昨天,我的大学学习[5]--转载自:www.cstc.net.cn
  18. 蔬菜干行业调研报告 - 市场现状分析与发展前景预测
  19. CentOS7搜狗拼音安装
  20. 【论文写作】有了这些网站,可以解决论文写作中99.9%的问题!

热门文章

  1. 谈谈Boost网络编程(2)—— 新系统的设计
  2. Elasticsearch2.2.0配置文件说明
  3. NEW关键字的三种用法
  4. Java多线程常见面试题及答案汇总1000道(春招+秋招+社招)
  5. Android提前加载unity程序,Unity项目嵌入Android App实现过程
  6. 金融学名词M0, M1, M2, M3, M4, M5, M6
  7. Java8中Stream流对集合操作
  8. 18,rand('state',sum(100*clock))
  9. Android studio Day02-1
  10. myeclipse使用maven整合ssh配置