2022 WAIC带上,达摩院发布并开源“通义”大模型,在国内率先构建了AI统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。

9月2日,阿里巴巴达摩院主办世界人工智能大会“大规模预训练模型”主题论坛。会上,达摩院副院长周靖人发布阿里巴巴最新“通义”大模型系列,并宣布相关核心模型向全球开发者开源开放。面向大模型通用性与易用性仍欠缺的难题,通义打造了业界首个AI统一底座,并构建了大小模型协同的层次化人工智能体系,将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。

近年来,大模型表现出前所未有的理解与创造能力,且打破了传统AI只能处理单一任务的限制,让人类离通用人工智能的目标近了一步。但大模型在实现全模态和全任务的通用性上仍存在许多技术难点,同时受算力资源限制,其训练与落地应用颇具挑战。

2021年,阿里巴巴达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破,引领了中文大模型的发展。尤其引发关注的是,达摩院团队使用512卡V100 GPU即实现10万亿参数大模型M6,同等参数规模能耗仅为此前业界标杆的1%,极大降低了大模型训练门槛。

今年,阿里巴巴在解决大模型通用性及易用性难题上继续发力。达摩院副院长周靖人介绍,为了让大模型更加“融会贯通”,达摩院在国内率先构建了AI统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。通义统一底座中M6-OFA模型,作为单一模型,在不引入新增结构的情况下,可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务,且效果达到国际领先水平。这一突破最大程度打通了AI的感官,受到学界和工业界广泛关注。近期M6-OFA完成升级后,可处理超过30种跨模态任务。

“大模型模仿了人类构建认知的过程,这是当下我们面临的重要机遇。通过融合AI在语言、语音、视觉等不同模态和领域的知识体系,我们期望多模态大模型能成为下一代人工智能算法的基石,让AI从只能使用‘单一感官’到‘五官全开’,且能调用储备丰富知识的大脑来理解世界和思考,最终实现接近人类水平的认知智能。”周靖人表示。

同时,以统一底座为基础,达摩院构建了层次化的模型体系,其中通用模型层覆盖自然语言处理、多模态、计算机视觉,专业模型层深入电商、医疗、法律、金融、娱乐等行业。通用与专业领域大小模型协同,让通义大模型系列可兼顾性能最优化与低成本落地。为加快大模型规模化应用,达摩院还研发了超大模型落地关键技术S4框架,百亿参数大模型在压缩率达99%的情况下多任务精度可接近无损。

通过部署超大模型及轻量化版本,阿里巴巴通义大模型系列已在超过200个场景中提供服务,实现了2%~10%的应用效果提升。典型使用场景包括电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等。

与本次发布同步,通义大模型系列中语言大模型AliceMind-PLUG、多模态理解与生成统一模型AliceMind-mPLUG、多模态统一底座模型M6-OFA、超大模型落地关键技术S4框架等核心模型及能力已面向全球开发者开源,最新文生图大模型近期将开放体验。

开源链接:https://github.com/alibaba/AliceMind/; https://github.com/OFA-Sys/OFA

阿里达摩院发布并开源“通义”大模型,AI底座之上促场景创新相关推荐

  1. 重磅!阿里达摩院发布《2020十大科技趋势》

    来源:雷锋网 2019年,是新兴科技发展史上的重要年份. 这一年,各大公司的AI.云计算.大数据走向下沉市场,空中博弈进入到地面作战,技术的商业化成为生意成败的重要考量.其间,产业与场景成为大漏斗,好 ...

  2. 阿里达摩院发布2019年十大科技趋势

    "  据悉,这是达摩院自2017年10月成立以来发布的首份科技趋势报告.此前,马云对达摩院的发展提出三个要求:「活得要比阿里巴巴长」.「服务全世界至少 20 亿人口」.「必须面向未来.用科技 ...

  3. 阿里达摩院通义大模型概述

    阿里推出"通义"系列大模型,以统一学习范式和模块化设计理念统一架构.模态.训练.应用等方面,使用开源社区"魔搭"进行模型服务共享,推出"飞天智算平台& ...

  4. 《预训练周刊》第7期:傅立叶图像变换器解析、阿里达摩院发布最大中文预训练语言模型PLUG

    No.07 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 ‍‍‍超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第7期 ...

  5. 270亿参数、刷榜CLUE,阿里达摩院发布最大中文预训练语言模型PLUG(开放测试)...

    转自:机器之心 经历「大炼模型」后,人工智能领域正进入「炼大模型」时代.自去年 OpenAI 发布英文领域超大规模预训练语言模型 GPT-3 后,中文领域同类模型的训练进程备受关注.今日,阿里达摩院发 ...

  6. 270亿参数、刷榜CLUE,阿里达摩院发布最大中文预训练语言模型PLUG

    作者|机器之心编辑部 来源|机器之心 经历「大炼模型」后,人工智能领域正进入「炼大模型」时代.自去年 OpenAI 发布英文领域超大规模预训练语言模型 GPT-3 后,中文领域同类模型的训练进程备受关 ...

  7. AI大一统:阿里达摩院发布多任务、多模态统一模型OFA

    引言:我们正处于一个"多模多任务大统一"的AI时代. 老铁们,上图是对动漫<海贼王>所选框的文字描述(Zero-shot测试),而这一"炫酷"的效果 ...

  8. 坐拥270亿参数!阿里达摩院发布超大规模语言模型PLUG,上能写诗词歌赋、下能对答如流...

    作者 | 马超 出品 | CSDN(ID:CSDNnews) 日前,阿里达摩院发布了最新中文预训练语言模型 PLUG,在 PLUG 生成的各种诗歌与小说中,不时灵光闪现式的金句.妙语令人啧啧称奇. 但 ...

  9. 阿里达摩院发布中文领域最大规模语言模型PLUG测试访问地址

    **阿里达摩院发布中文领域最大规模语言模型 ** 测试地址: https://nlp.aliyun.com/portal#/BigText_chinese

  10. NLP之PLUG:阿里达摩院发布最大中文预训练语言模型PLUG的简介、架构组成、模型训练、使用方法之详细攻略

    NLP之PLUG:阿里达摩院发布最大中文预训练语言模型PLUG的简介.架构组成.模型训练.使用方法之详细攻略 目录 PLUG的简介 PLUG的得分 PLUG的特点 PLUG的架构组成 PLUG的模型训 ...

最新文章

  1. 如何快速是DNS修改生效
  2. $sanitize和$sce服务的使用方法
  3. 11行代码AC——比紫书优化,例题2-3 近似计算——解题报告
  4. php引用类,thinkphp引用类的使用
  5. Runner站立会议05
  6. 杭电计算机2010年笔试真题详解
  7. IBM与红帽联手构建开源混合云环境
  8. 人工智能——皇帝的新脑还是人类的终结(学习笔记)
  9. 文本文件和二进制文件的判别
  10. 注册ActiveX控件 未在此计算机上注册ActiveX控件!!!
  11. 黑域 绿色守护 安卓最好的省电工具?
  12. <<算法竞赛进阶指南>>:陪审团
  13. oracle修改表字段名备注_ORACLE 动态SQL 给每个字段添加中文备注
  14. Android verified boot 2.0 vbmeta 数据结构解析
  15. LOL-无双剑姬我的最爱
  16. 低功耗蓝牙芯片CH579系列开发记录
  17. 五一劳动节致全体技术同胞书
  18. Steam根目录下userdata文件夹命名规则
  19. python非线性规划求解_Python之建模规划篇--非线性规划
  20. Kotlin sealed class 的使用

热门文章

  1. React全家桶写一个CNode社区
  2. 未明学院:被腾讯群面虐完后,我找到了未来的方向…
  3. 回声状态网络(ESN)的公式推导及代码实现
  4. App Inventor探索
  5. 小程序中实现用户的登录与注册
  6. 网站服务器的10G内存,10G网站空间
  7. 多益网络社招iq_多益网络2018秋招iq测试题(二)
  8. 简述变分法在泛函极值问题中的应用
  9. 戏精,程序员的桌面画风竟然是酱紫的!
  10. Linux文件目录操作命令 rm