2021-03-02 14:20:52

3月2日,阿里巴巴与清华大学联合发布业界最大的中文多模态预训练AI模型M6,该模型参数规模超千亿,同时具备文本、图像的理解和生成能力,图像设计效率超越人类,可应用于产品设计、信息检索、机器人对话、文学创作等领域。

阿里M6模型根据文本内容,自动设计特定风格图片

预训练语言模型是让AI具备认知能力的关键技术,它突破了传统深度学习方法的瓶颈,是一种新型AI训练思路,即首先自动学习大量语言文字和图像数据,记忆和理解人类丰富的先验知识,再进一步学习专业领域信息,从而让AI同时掌握常识和专业知识。目前,谷歌、微软和 Facebook等企业已投入该技术的研发。

此次发布的M6模型参数规模达到1000亿,是多模态预训练领域史上最大的模型,其理解和生成能力超越传统AI。以图像生成为例,模型可设计包括服饰、鞋类、家具、首饰、书籍等在内的30多个物品类别的图像,最短一分钟即可完成作品的创作,效率超越普通设计师。

阿里M6模型自动生成相关图像效果

M6的突破源自多项底层技术创新。阿里巴巴研究团队基于自研Whale分布式框架,将参数规模扩展到千亿的同时,利用大规模数据并行和模型并行,训练速度提升10倍以上,仅需1-2天即可完成上亿数据的预训练。此外,M6模型首次将多模态预训练模型应用到基于文本的图像生成任务,结合向量量化生成对抗网络学习文本与图像编码共同建模的任务,能够生成清晰度高且细节丰富的图像。

阿里巴巴达摩院智能计算实验室资深算法专家杨红霞表示:“多模态预训练是下一代人工智能的基础,M6模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。”

作为国内最早投入认知智能研究的科技公司之一,阿里巴巴已有30多项认知智能领域研究成果被国际顶级会议收录;据介绍,研究团队还将研发更高规模的万亿参数多模态预训练模型,进一步突破算力及预训练模型的极限,最终实现通用领域的高质量泛内容生成。

— 完 —

阿里发布千亿参数规模AI模型,可设计30多种物品高清图像相关推荐

  1. 比 OpenAI 更好!!谷歌发布 20 亿参数通用语音模型——USM

    整理 | 禾木木       责编 | 王子彧 出品 | CSDN(ID:CSDNnews) 去年11月,谷歌曾宣布"1000 种语言计划",通过建立一个机器学习模型,从而支持世界 ...

  2. 人类算力天花板?1750 亿参数的 AI 模型 GPT-3 引爆硅谷

    这几天轰动硅谷的 GPT-3 是什么来头? 相信不太了解 AI 的朋友这几天也或多或少看到了一些关于 GPT-3 的重磅消息,甚至有媒体称其为 "继比特币之后又一个轰动全球的现象级新技术&q ...

  3. 阿里开源深度学习框架XDL,面向高维稀疏数据,支持千亿参数训练规模

    安妮 发自 阿里中心 量子位 出品 | 公众号 QbitAI 近日,阿里巴巴首次开源了面向高维稀疏数据的深度学习框架,叫作X-Deep Learning,简称XDL. 阿里表示,XDL基于大数据营销平 ...

  4. 透视鹏程.盘古:首个2000亿参数中文大模型是怎样炼成的?

    2021-05-19 10:21:00 机器之心原创 机器之心编辑部 给足算力和数据,就能训练出千亿参数的大模型?事实没有那么简单. 「70 年的人工智能研究史告诉我们,利用计算能力的一般方法最终是最 ...

  5. 又被 AI 抢饭碗?2457 亿参数规模,全球最大中文人工智能巨量模型 “源1.0”正式开源...

    作者 | 伍杏玲 出品 | AI科技大本营(ID:rgznai100) 输入: 昔我往矣,杨柳依依. 今我来思,雨雪霏霏. 行道迟迟,载渴载饥. 我心伤悲,莫知我哀! (以战争为题写一首诗) 回复: ...

  6. 腾讯Angel升级:加入图算法,支持十亿节点、千亿边规模!中国首个毕业于Linux AI基金会的开源项目...

    出品 | AI科技大本营(ID:rgznai100) [导语]Angel 是腾讯的首个AI开源项目,于 2016 年底推出.2017年开源.近日,快速发展的 Angel 完成了从  2.0 版本到 3 ...

  7. 6个月火速炼成千亿参数大模型!背后是披荆斩棘的华为云哥哥们

    6个月的时间为约定,他们就这样硬生生地打造了个全球领先--华为云盘古大模型: 业界首个千亿级生成与理解中文NLP大模型. 业界最大的CV大模型. 而在这场攻坚战中,华为云人工智能领域首席科学家田奇和团 ...

  8. 全球最大中文单体模型来了!2600亿参数,AI产业规模化应用可期

    金磊 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上学时候,有的同学花费大量时间去死记硬背,成绩却不一定好. 而学霸们往往有这样的心得:在刷题之外还要总结知识体系,事半功倍. 人学习过 ...

  9. 华为云中文预训练模型发布:全球最大、千亿参数,逼近人类神经元

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 还是熟悉的华为开发者大会 (HDC),还是熟悉的余承东. 也还是一贯地擅长宣布"世界第一": 业界首个千亿级生成与理解中 ...

最新文章

  1. Nginx 安装及配置
  2. Android Studio 编译: Program type already present: XXX 解决方案
  3. Java开发面试问题,Jsoup解析html
  4. 网页中嵌入地图位置方法
  5. python dict方法_python dict()方法学习笔记
  6. jinja test
  7. 20140213-面向对象技术概论
  8. 【转】Data truncation: Truncated incorrect DOUBLE value:Mysql Update时
  9. EMNLP21' | 细粒度情感分析新突破 —— 通过有监督对比学习方法学习隐式情感...
  10. 探索式测试实践之路(国际大师James Bach题词推荐之探索式测试唯一本土著作)
  11. c#中的ref、out、params参数
  12. Linux下安装gcc环境
  13. android 播放多个声音小,手机音量调最大,外播声音却还是很小?可能是你没打开这两个设置...
  14. 68个Python内置函数详解,进阶必备!
  15. windows中如何让chrome信任自签名证书?
  16. 关于掉落的详细分析。
  17. 进程创建的优化设计(上)
  18. org.apache.dubbo 2.7.7 服务端处理请求及时间轮(失败重试)
  19. Excel函数——小数点计算
  20. 早上在玩支付宝的答答星球,认真点就有点赌徒心理了

热门文章

  1. Flex与ASP.NET通过Remoting方式进行通讯
  2. 安装rpm的mysql_linux下安装rpm格式的mysql
  3. python3 import execjs ModuleNotFoundError: No module named ‘execjs‘
  4. scikit CountVectorizer源码
  5. 阿里全球数学竞赛第二届
  6. 大牛书单 | Python方向的好书
  7. 这 100 个心理学知识你必须了解
  8. 计算机大师高德纳权威著作《计算机程序设计艺术》影印版精装版已经入库,即将上市!
  9. python 复现 Unet 论文中的 Weight Map
  10. Image Generation