近年来,基于Transformer的一系列大规模预训练模型不断推进NLP领域前沿,也持续冲击着大众和研究者关于NLP任务的认知。GPT-3在多项任务上取得的泛用能力似乎使人们看到了实现通用人工智能的曙光,但一些基本的问题也仍然阻碍着学者们进一步的工作。

预训练模型成功的原因究竟在何处?规模化和计算力驱动的NLP是否会迎来新的产业化浪潮?又是否会形成新的巨头垄断?这会对NLP从业者或研究者们产生什么影响?

整理:周寅张皓

校对:贾       伟

11月26日,在【青源Talk】第二期上,XLNet 发明者、循环智能(Recurrent AI)联合创始人,智源青年科学家杨植麟博士分别从“NLP的state-of-the-art技术”、“NLP的落地场景”、“NLP产业化尚未解决的问题”、“从学习的角度看NLP的现在与未来”等四个方面,对以上问题做了回答。

杨植麟认为,以GPT-3为代表的各种预训练模型带来了 NLP 七十年历史上最激动人心的时刻,当下正是NLP蓬勃发展的时期,未来将有更多应用会大规模落地。因此工业界对NLP研究者的需求将会持续增长。

“先把蛋糕做大!”杨植麟说,大规模应用落地前,做大行业规模,将为每个NLP从业人员提供更多机会。

点击“阅读原文”,可观看视频,或下载PPT。

1

NLP技术的 State Of The Art

State of the Art 简称 SATO,指同期达到最优结果的技术方法。2017年以来,NLP领域的各项任务的SOTA结果纷纷被Transformer+预训练机制的模型攻占。报告中,杨植麟通过分析近年来语言模型的变化,总结了当前NLP领域主流最优的技术体系,分为以下四点:

1、预训练(Pretrain)大模型;

2、让大模型在特定任务上进行小样本学习(Few-shot Learning)或半监督学习(Semi-supervised Learning);

3、使用大模型在对应任务的大量数据进行预测;

4、使用预测结果蒸馏得到小模型

这些方法在尝试同时将数据效率和模型效率做到极限,目前 CV 领域也正形成类似的技术收敛现象,例如SimCLR v2。

但同时,杨植麟指出,这套方法仍然依赖于结构化的数据,当缺少标注数据与明显的类别划分时,第二步精调工作便很难完成。如何解决对结构化数据的依赖,是当下 NLP 前沿的重要开放性问题。

2

NLP的落地场景

大规模模型的预训练方法究竟带给我们什么?杨植麟博士从产业界的实际应用给予了我们答案。

杨植麟表示,未来几年将是NLP领域成果大规模落地的时代,产业界、学术界、包括传统行业将越来越多的应用NLP技术。杨植麟用循环智能(Recurrent AI)公司承担的应用任务举例介绍了当下NLP的应用现状:

1、AI赋能线索分配

利用已有的与用户交互的数据,使用NLP技术实现AI辅助的智能获客与高意向为成交客户单的发现,降低企业的获客成本。

2、沟通数据标签化及话术挖掘

使用销售部门存在的大量与客户交互的文本语音等数据,通过成交记录训练出标准化销售流程,使用最高成功率的话术来提高销售额,并可以在实践中得到反馈,进一步更新策略,为管理团队提供支持。杨植麟采用了XLNET等技术,实现了商业化的NLP模型快速部署。

3、人机耦合

杨植麟实际工作中发现,NLP更多的价值在于赋能实际的从业者。

例如销售过程这样的高社交环境中,人具有无可替代的情感价值。但AI通过分析发掘话术,可以提高人的工作效率。同时,实际销售工作中产生的数据可以进一步调整模型,通过业务反馈实现行业内模型自训练的闭环。

此外,通过AI的支持,还可以帮助解决销售人员流动性大,新人缺乏销售经验,难以有效进行价值传递的问题,使得新人业绩得到有效提高。

杨植麟作为循环智能(Recurrent AI)的联合创始人,致力于推动NLP技术在应用场景的部署,公司通过NLP技术赋能销售领域,为销售人员与企业提供了支持。NLP的落地应用会对行业工作人员的工作效率优极大的极高,降低了公司的边际成本,并与从业者相互促进。因此NLP的落地应用对行业产生更多积极的作用,未来我们将迎来NLP技术产业化的浪潮。

然而,仍然存在应用NLP的边际成本高、应用存在场景碎片化、任务难定义、行业标注数据集的缺乏与数据不准确等问题。且当前应用局限于完成数据结构化的子任务,仍未能承担更复杂的工作。杨植麟期待未来能够在结构化的数据基础上,完成端到端的复杂任务,例如目标导向的认知推理,阅读产品文档,外呼任务等。

3

从学习的角度看NLP的现在和未来

杨植麟认为,Transformer+Pretraining的模式表现优异的原因在于规模和泛化能力,超大规模的参数使模型能从具备优秀的表达能力,从巨大的表达空间中优化到较好的解。而预训练方法使模型学到的解具有一定的泛化能力。

因此,不断推进的模型规模会对越来越依赖于超大算力的支持,在未来会形成以超大规模算力支持的复杂算法系统,这一阶段会有越来越多的组织,机构参与推动,从一个团队变成规模化的组织。同时,为了发展算力,计算机的底层结构也会发生改变。

杨植麟认为,未来学术界的实验室将会越来越多的与工业界的算力平台合作,探索潜在的问题。他了提出“数据驱动+计算流”的发展模式,在现在的时代背景下,“做大蛋糕”,我们将迎来一个NLP落地蓬勃发展的时期。


点击左下角“阅读原文”,下载 PPT!

XLNet 发明者杨植麟:从学习的角度看NLP现状与未来(附PPT下载)相关推荐

  1. 【报名】杨植麟 :从学习的角度看NLP的现状与未来

    活动议程 日期:11月26日(周四) 时间 主题 19:00-19:05 主持人介绍 张家俊,中国科学院自动化研究所研究员,智源青年科学家 19:05-20:20 <从学习的角度看NLP的现状与 ...

  2. Yoshua:深度学习AI迈向人类水平的挑战(附PPT下载)

    来源:学术头条 本文约2000字,建议阅读5分钟. 本文介绍了蒙特利尔大学计算机科学与运算研究系教授Yoshua Bengio作<Challenges for Deep Learning tow ...

  3. XLNet模型第一作者杨植麟:NLP落地的四个技术阶段

    作者 | Recurrent.ai 来源 | RecurrentAI(ID:gh_0382adb3c10e) 近日,Recurrent.ai 联合创始人.XLNet 模型第一作者杨植麟,受邀在 CSD ...

  4. 杨植麟:28 岁青年科学家,开挂人生的方法论

    智源导读:杨植麟,循环智能创始人.智源青年科学家.如今仅28岁的他,曾于2011年至2015年在清华计算机系就读,本科期间师从唐杰教授:随后去往CMU读博,师从苹果AI研究负责人Ruslan Sala ...

  5. 智源青年科学家杨植麟:为什么预处理模型XLNet比BERT、RoBERTa更加优越

    在2020年2月11日下午的"智源论坛Live | 青年科学家线上报告会"中,智源青年科学家.Recurrent AI联合创始人杨植麟做了题为<Latest Advances ...

  6. 循环智能杨植麟:“人机耦合”将是对话语义应用的新趋势!

    受访者 | 杨植麟,循环智能联合创始人 记者 | 徐威龙,编辑 | 郭芮 出品 | CSDN(ID:CSDNnews) 「AI技术生态论」人物访谈栏目是CSDN发起的百万人学AI倡议下的重要组成部分. ...

  7. 循环智能杨植麟:“人机耦合”将是对话语义应用的新趋势

    2020-04-12 11:19:51 受访者 | 杨植麟,循环智能联合创始人 记者 | 徐威龙,编辑 | 郭芮 出品 | CSDN(ID:CSDNnews) 「AI技术生态论」人物访谈栏目是CSDN ...

  8. 【2020年高被引学者】 杨植麟 北京睿科伦智能科技有限公司

    [2020年高被引学者]杨植麟,北京睿科伦智能科技有限公司研究员,循环智能(Recurrent AI)联合创始人.本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院.研究兴趣包括深度学习和 ...

  9. 读杨植麟智源采访有感

    永远相信好的东西还没做出来.论文读得不算少,读到自己感觉这也有人做了,那也有人做了,自己的工作一点也没啥亮点,是读入了迷区了. 快速迭代.大多数人的大多数Idea都不work,要快速迭代,不断试错,最 ...

最新文章

  1. linux redis 三种启动方式
  2. ajax异步上传到又拍云的实例教程
  3. Python 字符串方法详解
  4. 社会工程学之《反欺骗的艺术》小结(三)
  5. c语言小车路径规划算法,基于路径规划的室内小车定位系统
  6. 基于STM32的简易交通灯设计
  7. java中钟摆运动的代码_仿真树叶飘落效果的实现(精灵旋转、翻转、钟摆运动等综合运用)...
  8. 再见了, 达叔!我用Python回顾一代喜剧大师203部作品,太经典了!
  9. 从前端到全栈-基础能力-js-异步编程
  10. DockOne微信分享(六十六): Docker网络方案初探
  11. 正则表达式中空白字符与非空白字符
  12. 清除本地dns(Mac,win)
  13. 教育部“1+X”职业技能等级证书申报哪家好?学生应该如何选报?
  14. css书写顺序规范---规范书写很重要
  15. bzoj3875 骑士游戏 最短路
  16. 网鼎杯半决赛 pwn1
  17. 通过SE14重建数据库表
  18. [sd card] sd card初始化流程
  19. 曾经拥有的,不要忘记。不能得到的,更要珍惜。属于自己的,不要放弃。已经失去的,留作回忆。
  20. 【汇正财经】红筹股和H股有什么区别?

热门文章

  1. postman对象参数null_postman的几种参数格式
  2. 如何取小数点前两位并四舍五入?
  3. 请你描述一下 cookies,sessionStorage 和 localStorage 的区别?
  4. 编写程序判断等腰、等边或者普通三角形
  5. java 重复start,iText中带有“start”属性的有序列表[重复]
  6. BIOS不识别linux,linux – 在BIOS中启用VT但KVM无法检测到
  7. rhel6编译ssh的src.rpm包并修改spec参数
  8. 第九次作业-测试报告和用户使用手册
  9. 【BZOJ】2099: [Usaco2010 Dec]Letter 恐吓信
  10. MVP遇到GMCT:不加入域更改密码有几种方法?