点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达

2018年以来,以BERT、GPT等为代表的大规模预训练模型,带来了人工智能领域新的突破,由于其强大的通用性和卓越的迁移能力,掀起了预训练模型往大规模参数化发展的浪潮。其中微软、谷歌、Facebook、NVIDIA等诸多公司在预训练算法上持续大量投入。国内如百度、华为、阿里等公司也相继投入到大规模预训练模型算法的研究中。现阶段,在中文自然语言处理方向上,预训练也如雨后春笋一样涌现。现有算法主要依赖纯文本学习,缺少知识指导学习,模型能力存在局限。

2021年10月13日,腾讯云小微与腾讯AI Lab联合团队提出了基于知识的中文预训练模型——“神农”,该模型仅包含十亿级参数量,并一举登顶CLUE总排行榜、1.1分类任务、阅读理解任务和命名实体任务四个榜单,刷新业界记录。

10月13日,“神农”刷新CLUE分类榜单纪录;HUMAN 为人类标注成绩,非模型效果,不参与排名。

同时,“神农”登顶CLUE阅读理解、NER榜单,刷新业界记录。

作为中文语言理解领域最具权威性的测评基准之一,CLUE涵盖文本相似度、分类、自然语言推理、阅读理解、NER等众多语义分析和理解类子任务。近段时间,各大公司纷纷用CLUE作为预训练算法能力的验证和衡量标准。此次登顶CLUE榜单,不仅代表了云小微与腾讯AI Lab联合团队在中文预训练研究领域达到业内领先水平,并且推动中文预训练模型在理解和推理方面提升了一个新高度。

联合团队致力于将知识融入预训练模型,进而充分发挥已有参数下的模型潜力。模型结构方面,“神农”基于 Transformer 架构,仅包含十亿级的参数量。从数据量来看,“神农”以数百 GB 级的平文本做基石,涵盖百科、论坛博客、新闻、财经等众多领域的高质量文本。相对于业界其他中文预训练模型,“神农”在以下三个方面获得了突破性进展:

第一,“神农”从两个角度对知识进行建模,分别是“通用型推理知识”和“任务型知识”。通用型知识指的是现有知识,比如词法、句法、图谱等,这类知识的特点是通用性强,覆盖度广。虽然能整体提高模型的能力,但是在特定场景中往往不容易发挥作用。而任务型知识旨在挖掘场景下特有的知识,并通过将其泛化来提升预训练模型的能力。二者可谓相辅相成。

第二,联合团队将汉语中典型的篇章推理知识作为通用知识融入预训练过程中,如因果、对比、递进、转折关系等。中文是表达极其丰富的语言,存在大量指示性的虚词。这些虚词在中文的语义理解中起着至关重要的作用。比如:

这段话的语义可谓一波三折,而引起语义起伏变化的正是这些虚词。通过引入这类知识可以强化模型对中文的理解能力。

第三,“神农”提出基于对比学习的任务型知识挖掘和融入算法。通过定义知识模板,该算法可以为指定任务“定制知识”,并将其融入到训练过程中。另外,“神农”将挖掘出来的知识在大规模单语文本中进行泛化,大大提高了知识的表达能力。

“神农”正是通过充分利用这两类知识,进一步强化了中文预训练模型的能力,在包含文本分类、阅读理解等多类任务上表现出色。

一直以来,腾讯云小微团队和腾讯AI Lab团队持续深耕知识挖掘、语义理解技术以及预训练技术。云小微方面,依托自研的知识挖掘算法和深度学习技术,基于平台对行业知识的长期积累,能快速搭建多个领域的知识结构,有效地从非结构化文件中抽取关键信息,为行业提供全流程知识构建服务。在此加持下,团队通过将行业知识与预训练技术相结合,可以更好地服务应用,为各行各业输出完整的AI解决方案,不断渗透智慧生活各个场景。目前已在智能网联汽车、智慧文旅、智慧教育等多行业领域落地应用,服务广泛的用户群体。

腾讯AI Lab始终强调研究与应用并重发展,其研究覆盖机器学习、计算机视觉、语音识别及自然语言处理等四大核心方向,其中自然语言处理方向强调赋予计算机系统以自然语言文本理解与外界交互的能力,并不断探索最前沿的文本理解和生成技术。实验室立足未来,开放合作,致力于不断提升AI的认知、决策与创造力,向“Make AI Everywhere”的愿景迈步。

本次两个团队强强联合,深入探索知识与预训练的融合技术,提出了全新的基于知识的预训练方法,在这一领域又迈出了坚实的一步。

点个在看 paper不断!

登顶CLUE榜单,腾讯云小微与腾讯AI Lab联合团队提出基于知识的中文预训练模型...相关推荐

  1. 直击智能语音行业痛点,腾讯云小微云函数助力AI语音落地

    近两年,Serverless的发展带来了架构开发的新思路,开发者可以避免繁杂的后台开发配置工作和巨型系统架构城堡,快速构建起应用并部署,应对市场的变化. 2019年腾讯Techo开发者大会Server ...

  2. 启英泰伦-腾讯云小微产品方案

    1 离在线整体方案概述¶ 1.1 方案概述¶ 随着人们生活水平的提高,对产品的功能要求也越来越高,追求产品的多功能性.传统的离线语音产品仅本地功能控制,无法满足人们的对在线内容的需求. 传统家电,功能 ...

  3. 北京内推 | 腾讯云小微自然语言技术中心招聘NLP研究型实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 腾讯 我们属于腾讯云与智慧产业群腾讯云小微自然语言技术中心.自然语言技术中 ...

  4. 岗位内推 | 腾讯云小微自然语言技术中心招聘NLP研究型实习生

    PaperWeekly 致力于推荐最棒的工作机会,精准地为其找到最佳求职者,做连接优质企业和优质人才的桥梁.如果你需要我们帮助你发布实习或全职岗位,请添加微信号「pwbot02」. 我们属于腾讯云与智 ...

  5. 打造 AI 语音新标杆,英特尔与腾讯云小微创新共赢

    英特尔宣布已于近日开始生产的第三代英特尔®至强®可扩展处理器(代号"Ice Lake")将于 2021 年第一季度实现规模量产. 人工智能的影响力正在不断加深. 如今,越来越多企业 ...

  6. 腾讯AI Lab联合清华,港中文长文解析图深度学习的历史、最新进展到应用

    本文作者: 腾讯:荣钰.徐挺洋.黄俊洲:清华大学:黄文炳:香港中文大学:程鸿 前言 人工智能领域近几年历经了突飞猛进的发展.图像.视频.游戏博弈.自然语言处理.金融等大数据分析领域都实现了跨越式的进步 ...

  7. 腾讯AI Lab联合清华、港中文带来万字干货解析:图深度学习的历史、最新进展和应用

    作者: 腾讯:荣钰.徐挺洋.黄俊洲:清华大学:黄文炳:香港中文大学:程鸿 前言 人工智能领域近几年历经了突飞猛进的发展.图像.视频.游戏博弈.自然语言处理.金融等大数据分析领域都实现了跨越式的进步并催 ...

  8. 【EasyNLP】带你轻松玩转CLUE榜单

    重磅来袭!EasyNLP正式成为CLUE榜单的官方工具! 1.导读 EasyNLP是一款简单.易用.高效的NLP开发工具,其完全基于Pytorch实现,提供了包括预训练语言模型(Pre-trained ...

  9. 腾讯云服务器备案要多久?腾讯云小程序备案流程

    腾讯云备案要多久?现在腾讯云提交网站备案很方便,直接用腾讯云网站备案小程序即可备案,只要资料准备好,提交时间一般5-30分钟即可. 如果,你有服务器或网站在腾讯云,想接入新的网站备案的. 可以点击进入 ...

最新文章

  1. c++ char数组初始化_c专题指针数组与指针的关联
  2. 部署war包到阿里云liunx的tomcat时报错:zip END header not found
  3. AndroidVerifyBoot
  4. 成功解决but is 0 and 2 (computed from start 0 and end 9223372 over shape with rank 2 and stride-1)
  5. div上下展开收缩 html,js实现div层缓慢收缩与展开的方法
  6. 可以改善mysql性能的InnoDB配置参数
  7. SAP CRM Business partner API里的buffer设计
  8. 四川省高中计算机考试,四川高中信息技术学业水平考试时间
  9. chrome失去响应问题
  10. UCI数据集+机器学习+十折交叉验证
  11. GD32F103与STM32F103的区别 2021.6.2
  12. 【CV-Learning】线性分类器(SVM基础)
  13. 请求指纹认证授权秘钥使用
  14. 5.5 除法的运算过程
  15. java 简单框架_最简单的Java框架
  16. 中文邮件格式模板、工作汇报邮件模板这样写,90%人都爱看
  17. 宏碁服务器u盘装系统,教你acer宏碁u盘重装win10
  18. admob插屏激励视频广告
  19. 宝付揭穿职业乞讨曝光骗子
  20. 10亿美元融资腾讯跟头,Grail要用基因测序做癌症早期筛查

热门文章

  1. WordPress页面Page和文章Post的相互转换
  2. HDU 1090 A+B for Input-Output Practice (II)
  3. C++_volatile限定修饰符 Pair类型
  4. 股市币市:数据分析与交易所最新公告(20190228)
  5. 【ACM】连续出现的字符
  6. 谷歌高管又变动:AI 研究部门元老即将离职
  7. 邢波出任全球第一所AI大学校长,履历横跨三门学科
  8. 微软开源的自动机器学习工具上新了:NNI概览及新功能详解
  9. 时间序列的建模新思路:清华、李飞飞团队等提出强记忆力E3D-LSTM网络
  10. 观点PK_倘若做不好AI,云服务商还能勇往直前吗?