8月26日,阿里达摩院语言技术实验室取得一系列突破,斩获自然语言处理(NLP)领域6大权威技术榜单冠军。据介绍,参与竞赛的6项自研AI技术均采用模仿人类的学习模式,全方位提升了机器的语言理解能力,部分能力甚至已超越人类。目前,这些技术均已大规模应用于阅读理解、机器翻译、人机交互等场景。

过去几年,AI在图像识别、语音识别等方面已逐步超越人类水平,但在复杂文本语义的理解上,AI与人类尚有差距,其主要原因就是传统AI学习文本知识效率较低。为此,业界提出了一种模仿人类的学习思路,即先让AI在大规模的网页和书籍文字中进行训练,学习基本的词法、语法和语义知识,然后再在固定领域内的文本上进行训练,学习领域专有知识。这一思想就是预训练语言模型的核心创新。自Google提出模仿人类注意力机制的BERT模型以来,预训练语言模型已成为NLP领域的热点研究方向。

达摩院早在2018年就开始布局通用的预训练语言模型,并逐渐将该思路拓展到了多语言、多模态、结构化和篇章文本理解和文本生成领域,如今已建立一套系统化的深度语言模型体系,其自研通用语言模型StructBERT、多语言模型VECO、多模态语言模型StructVBERT、生成式语言模型PALM等6大自研模型分别刷新了世界纪录。

达摩院自研模型位居GLUE榜单第一名

其中,StructBERT能让机器更好地掌握人类语法,使机器在面对语序错乱或不符合语法习惯的词句时,仍能准确理解并给出正确的表达和回应,大大提高机器对词语、句子以及语言整体的理解力。该模型以平均分90.6分在自然语言处理领域权威数据集GLUE Benchmark中位居第一,显著超越人类水平(87.1分)。

达摩院语言技术实验室团队表示:“实验室的目标是让AI掌握人类知识的基础技术,预训练语言模型的诞生使得AI像人一样学习新知识成为可能,未来达摩院会全面对外开放这些技术,让特定领域的AI变得更加智能。”

过去两年,阿里获得了30多项NLP领域顶级赛事世界冠军,有100多篇相关顶会论文; 阿里自然语言技术已在金融、新零售、通讯、互联网、医疗、电力、客服等领域服务超十亿用户和数万企业客户。

全面提升AI语言理解能力,达摩院自研语言模型体系登顶6大权威榜单相关推荐

  1. ​横扫六大权威榜单后,达摩院开源深度语言模型体系 AliceMind

    整理 | AI 科技大本营(ID:rgznai100) 自然语言处理(NLP)被誉为 AI 皇冠上的明珠,传统 NLP 模型制作复杂,耗时耗力,且用途单一,难以复用.预训练语言模型是 NLP 领域的研 ...

  2. 横扫六大权威榜单,达摩院自家深度语言模型体系AliceMind开源了

    机器之心发布 机器之心编辑部 阿里巴巴达摩院宣布正式开源 AliceMind,助推语言 AI 进入大工业时代. 自然语言处理(NLP)被誉为 AI 皇冠上的明珠,传统 NLP 模型制作复杂,耗时耗力, ...

  3. 横扫六大权威榜单后,达摩院开源深度语言模型体系 AliceMind

    整理 | AI 科技大本营(ID:rgznai100) 自然语言处理(NLP)被誉为 AI 皇冠上的明珠,传统 NLP 模型制作复杂,耗时耗力,且用途单一,难以复用.预训练语言模型是 NLP 领域的研 ...

  4. 达摩院自研数学规划求解器发布,最新技术将通过阿里云对外输出

    8月18日消息,阿里巴巴达摩院研发的数学规划求解器参加国际权威榜单测评,在单纯形法测评中排名第一,打破世界纪录.这款拥有自主知识产权的求解器MindOpt现已用于阿里集团多个业务场景,包括云计算资源调 ...

  5. 阿里达摩院包揽AI领域六大权威榜单冠军:用人类的学习方式超越人类

    让AI模仿人类的学习方式,结果会怎样? 8月26日,阿里达摩院语言技术实验室取得一系列突破,斩获自然语言处理(NLP)领域6大权威技术榜单冠军.据介绍,参与竞赛的6项自研AI技术均采用模仿人类的学习模 ...

  6. 谁说GPT只擅长生成?清华研究力证:GPT语言理解能力不输BERT

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者|张倩.小舟 来源|机器之心 一直以来,GPT 模型的语言生成能 ...

  7. 《预训练周刊》第5期:智源等研究力证:GPT语言理解能力不输BERT、盘点NLP预训练「兵器谱」...

    No.05 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第5期< ...

  8. 阿里自动驾驶新突破!达摩院自研ISP图像处理器大幅提升安全性

    阿里巴巴达摩院在自动驾驶领域取得新突破!4月8日,据记者了解,达摩院已经自主研发出用于车载摄像头的ISP处理器,保障自动驾驶车辆在夜间拥有更好的"视力","看" ...

  9. 再次刷新单模型纪录!快手登顶多模态理解权威榜单VCR

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:机器之心 多模态理解领域的权威排行榜纪录,又被来自国内的技术团队刷新了. 近日, ...

最新文章

  1. 通过Spring配置文件中bean中的property赋值
  2. 如何修改和查看tomcat内存大小
  3. .NET自定义获得JSON的方法(System.Runtime.Serialization.Json)
  4. Javascript闭包——懂不懂由你,反正我是懂了
  5. php网站入门鹿泉银山,银山门传说与银山门古石洞的考证
  6. 为您的Android,iOS等应用加入声波传输功能
  7. 斐讯k2p官方固件如何登陆ssh后台
  8. 一次 svchost.exe 进程占用大量网络带宽的排查
  9. pumping lemma
  10. 生物信息学仿真软件SInC的初步使用教程
  11. Python实现自由爆率抽奖小程序
  12. 虾皮如何注册店铺_Shopee(虾皮购物)入驻申请流程?
  13. Android aab安装到手机
  14. AML与PIO整合问题
  15. 存款准备金率,央行票据
  16. skin卓沿护肤品怎么样_白金卓沿护肤品怎么样孕妇能用吗
  17. AD域PowerShell常用命令——Get-ADuser
  18. Linux dd与cp区别
  19. VMware15 虚拟机下Win7 桥接模式、NAT模式无法联网处理
  20. 原生javascript实现图片轮播

热门文章

  1. VsCode开发Java SpringBoot遇到的问题
  2. Android:Service通知Activity更新界面
  3. 在pycharm 中使用 GitHub:
  4. httpClient创建对象、设置超时
  5. 深入浅出UML类图(二)
  6. 夺命雷公狗-----React---5--props对象的传递
  7. 34-指针与二维数组
  8. ModelSim6.3 使用教程By Sunev
  9. [LibTorch] C++ 调用 PyTorch 导出的模型
  10. 【mmdetection】mmdetection数据处理pipline结果可视化