自从GPT-3发布以来,大模型成为几乎所有全球头部AI企业的逐鹿目标。浪潮信息作为全球领先的AI厂商,也高举巨量模型的大旗,加速创新研发。在10月26日于北京举行的2021人工智能计算大会(AICC 2021)上,浪潮人工智能研究院宣布全球最大规模的中文AI巨量模型“源1.0”开源开放。

人工智能巨量模型“源1.0”由浪潮人工智能研究院于9月28日发布,是目前为止全球最大的人工智能巨量模型。据悉,它的参数量达2457亿,训练采用的中文数据集达5000GB,相比于美国的GPT-3模型1750亿参数量和570GB训练数据集,源1.0参数规模领先40%,训练数据集规模领先近10倍,荣膺世界第一。浪潮信息开源开放‘源1.0’旨在与更多的产、学、研、用单位和开发者一起,从技术创新、场景融合、应用开发等各个维度,共同促进巨量模型的健康发展与产业落地。

“源1.0” 开源开放计划将首先面向三类群体,一是高校或科研机构的人工智能研究团队,二是元脑生态合作伙伴,三是智能计算中心。面向第一类群体,“源1.0”将主要支撑在语言智能前沿领域的算法创新和方向探索;面向第二类群体,“源1.0”将主要支撑元脑生态伙伴开发行业示范性应用;面向第三类群体,“源1.0”将作为算法基础设施,与智能计算中心算力基础设施高效协同,支撑AI产业化和产业AI化发展。

“源1.0”开放开源计划项目包含开放模型API,开放高质量中文数据集,开源模型训练代码、推理代码和应用代码等。同时,浪潮信息将加强模型API和平台生态构建,开发支持高并发、高速推理的多种API接口,以支持各类用户对模型或功能的不同请求方式。并且浪潮人工智能研究院也将大力运营“源1.0”开源开放社区,建立完善的开发反馈机制并加快模型迭代。

目前,浪潮信息“源1.0”大模型只是一个开始,据浪潮人工智能研究院透露,“源2.0”的开发工作已经提上日程。在未来,浪潮“源”系列巨量模型将推动创新企业及个人开发者基于大模型构建智能化水平更高的场景应用,赋能实体经济智能化升级,促进数字经济高质量发展。

浪潮信息人工智能巨量模型“源1.0”,切实促进AI行业高质量发展相关推荐

  1. 又被 AI 抢饭碗?2457 亿参数规模,全球最大中文人工智能巨量模型 “源1.0”正式开源...

    作者 | 伍杏玲 出品 | AI科技大本营(ID:rgznai100) 输入: 昔我往矣,杨柳依依. 今我来思,雨雪霏霏. 行道迟迟,载渴载饥. 我心伤悲,莫知我哀! (以战争为题写一首诗) 回复: ...

  2. 如何训练2457亿参数量的中文巨量模型“源1.0”

    如何训练2457亿参数量的中文巨量模型"源1.0" 浪潮人工智能研究院 从2018年的BERT到2020年的GPT-3,NLP语言模型经历了爆发式的发展过程,其中BERT模型的参数 ...

  3. 中文巨量模型“源1.0”:模型结构与生成效果解析

    浪潮人工智能研究院 "源 1.0"自 2021 年 9 月底发布以来收获了广泛的关注.其参数量达 2457 亿,超越美国 OpenAI 组织研发的 GPT-3."源 1. ...

  4. 中文巨量模型“源1.0”的学习优化方法

    最近,浪潮人工智能研究院发布了中文巨量模型"源1.0",参数量达2457亿,超越美国OpenAI组织研发的GPT-3."源1.0"在语言智能方面表现优异,获得中 ...

  5. 中文巨量模型“源1.0”的小样本学习优化方法

    浪潮发布了中文巨量模型"源1.0",参数量达2457亿,超越美国OpenAI组织研发的GPT-3."源1.0"在语言智能方面表现优异,获得中文语言理解评测基准C ...

  6. 中文巨量模型“源1.0”:语料质量清洗与数据分析方法

    2021年,浪潮人工智能研究院发布了中文巨量模型"源1.0",其参数规模为2457亿,训练采用的中文数据集达5TB,超越美国OpenAI组织研发的GPT-3模型."源1. ...

  7. AI周报丨中文巨量模型源1.0比GPT-3强在哪里?;谷歌用协同训练策略实现多个SOTA,单一ViT模型执行多模态多任务

    01 # 行业大事件 语言大模型的终极目标是什么? 在自然语言处理(NLP)领域,暴力美学仍在延续. 自 2018 年谷歌推出 BERT(3.4 亿参数)以来,语言模型开始朝着「大」演进.国内外先后出 ...

  8. 中文巨量模型“源1.0”的模型结构与生成效果解析

    "源 1.0"自2021年9月底发布以来收获了广泛的关注.其参数量达2457亿,超越美国OpenAI组织研发的GPT-3."源1.0"在语言智能方面表现优异,获 ...

  9. 全球最大AI巨量模型,参数2457亿炼丹16天最懂中文

    晓查 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一个比GPT-3还大的AI模型,如果把近5年中文互联网能爬取到的内容看了个遍,会怎么样? 能学会日语. 我们把日语词汇"气持 ...

最新文章

  1. php代码实现关键词搜索,PHP代码实现百度统计关键词及来路推送
  2. apache文件服务器加权限,apache2运行权限设置
  3. [Unity C#教程] 游戏对象和脚本
  4. Puffer:专注拥塞控制、带宽预测和ABR
  5. 动手动脑 - 继承与多态
  6. MySQL查询条件中的各种运算符/操作符说明
  7. Centos7 安装docker和docker-compose
  8. LeetCode-----算法448.找到所有数组中消失的数字
  9. SAP License:2021年度最新FICO面试题目
  10. Jupyter Lab在线运行矩池云教程
  11. 开花(在b数组中二分查找a数组元素)
  12. Atitit 音频技术简史艾提拉著 目录 1. 2014年1月16日,谷歌发布音乐时间轴 2 2. 时代发展 2 2.1. 机械录音 电声录音时代 四.数码录音时代 2 3. 【音频录音技术】 2
  13. delphi mysql ado_delphi2010利用ADO连接MySQL数据库
  14. 统计学(贾俊平《第七版》)知识总结
  15. 【CentOS】scala安装
  16. 邮箱邮件安全问题有哪些?如何做邮件安全宣传?
  17. 大学计算机考试知识点归纳总结,大学计算机基础重点归纳.doc
  18. 四年级下册计算机作业,科学(四年级下册)作业.doc
  19. 同时查询京东多个快递物流,并分析中转延误
  20. [bzoj4084][Sdoi2015]双旋转字符串_hash

热门文章

  1. strstr函数的原理原来是这样的
  2. No executable code found at line。。。
  3. 麦马计算机专业对化学的要求,麦克马斯特大学有哪些专业处于世界顶尖水平?...
  4. 技术驱动下的电视行业,HDR成为下一个风口
  5. 今晚7:30 | IJCAI专场五!不见不散!
  6. 关于俄罗斯方块游戏软件C语言初步感受
  7. 第五章 矩阵的相似对角化
  8. mdf是什么mysql_mdf是数据库文件吗
  9. 任正非:为什么华为选择与西工大合作,而没选清华北大,mysql连接查询原理
  10. Python GUI:PyQT5+爬虫实现简单音乐下载器