作者 | Recurrent.ai

来源 | RecurrentAI(ID:gh_0382adb3c10e)

近日,Recurrent.ai 联合创始人、XLNet 模型第一作者杨植麟,受邀在 CSDN 主办的 2019 AI 开发者大会发表演讲。在演讲中,杨植麟首先从学术角度,详细介绍了 XLNet 模型的核心设计思想和原理,然后站在创业者的角度,介绍了自然语言处理(NLP)在企业服务领域落地的四个技术阶段。

XLNet 模型:在两种研究方向之间重新架一座桥

自从 2018 年 10 月 Google 发布 BERT 预训练模型以来,NLP 领域的发展就进入了快车道。2019 年 6 月,杨植麟作为第一作者,由卡内基梅隆大学(CMU)与 Google Brain 团队携手推出的 XLNet 模型,在 20 项 NLP 任务中超过 BERT 模型,且在其中 18 项任务中拿到最优成绩(State-Of-The-Art,SOTA),包括机器问答、自然语言推断、情感分析和文档排序等。XLNet 模型成为 NLP 领域备受关注的重要学术成果。

杨植麟在演讲中提到,XLNet 论文已经被人工智能领域的顶级会议 NeurIPS 2019 接收为 Oral 论文,将获得 15 分钟的登台演讲时间。据了解, NeurIPS 2019 共收到 6743 篇论文,接收 1428 篇,其中 Spotlight 论文(5分钟演讲时间)164 篇,占比 2.4%;最重要的 Oral 论文仅 36 篇,占比 0.5%。

对于 XLNet 模型的原理,杨植麟介绍,当前 NLP 领域的预训练方法可以分为自回归(Auto-Regressive,AR)和自编码(Auto-Encoding,AE)两个阵营,XLNet 模型的核心设计思想是结合两者各自的优势,同时摒弃两者各自的缺陷。

“XLNet 比较有意思的地方是,它在语言建模(Language Modeling)和预训练(Pretraining)这两种研究方向之间重新架了一座桥。过去,这两种方向高度一致,更好的语言建模可以带来更好的预训练结果。但是当 BERT 这种双向模型出来之后,情况变得不一样,因为语言建模有个致命问题,只能对单向的上下文进行建模。”杨植麟分析道,“XLNet 模型把自回归思想泛化,泛化之后的语言模型可以处理双向上下文。因此,如果语言建模水平有提升,就可以将成果运用到预训练过程中,从而在两者之间重新架起一座桥。”

NLP 落地:从定制化开发到规模化量产

杨植麟今年夏天从卡内基梅隆大学(CMU)博士毕业,博士期间他在 NLP 学术领域取得了多项世界级成绩。在剑桥大学人工智能研究员 Marek Rei 公布的机器学习和 NLP 领域论文统计数据中,杨植麟连续入选 2017 年、2018 年顶级会议和期刊的第一作者排行榜,全球范围内仅有 3 名学者能连续两年入选。

在 NLP 学术领域硕果颇丰的杨植麟,选择进入产业界,联合创立了面向企业服务领域的 NLP 创业公司 Recurrent.ai。他如何看待 NLP 技术的落地?

“前几年,在计算机视觉领域,新的模型算法刷榜之后,国内出现了一批独角兽级别的创业公司。所以在 BERT、XLNet 等模型出来之后,很多人会问这些算法模型在产业界,会不会发生类似计算机视觉领域的事情,产生一批 NLP 领域的独角兽公司。”针对现场很多人心中的疑问,杨植麟分享了他的思考,他认为 NLP 的落地需要经过四个技术阶段,能否产生 NLP 领域的独角兽公司,也就取决于谁能率先突破这四个阶段的技术挑战。

四个技术阶段分别是:

  1. 手动的、定制化的 NLP:基于规则、人工模型架构调优。
  1. 手动的、通用的 NLP:引入预训练模型。
  1. 半自动的、通用的 NLP:引入 AutoML 实现自动调参。
  1. 自动的、通用的 NLP:将人整合为流水线的一部分,实现自动化。
“国内企业服务市场,大约 90% 的 NLP 技术处在第一阶段。第二阶段是将 XLNet 这样通用的预训练模型,用在不同的任务上面,只需要手动微调参数。第三阶段是引入 AutoML 实现自动调参,将算法和模型自动化,这个阶段对于做学术而言足够了,因为数据集是现成的,但是对于产业落地还不够。因为做产业时,拿到的数据就是未标注的,需要解决怎么标、标多少等问题。第四阶段,就是把人(标注员)整合为流水线的一部分,如果需要扩展场景,只需要增加人力即可。”杨植麟详细分享了他的看法。
总结起来,杨植麟分享的 NLP 四个技术阶段,就是从当前主流的“定制化开发”到“规模化量产”的必经之路。
这也是 Recurrent.ai 正在做的事。杨植麟强调:“Recurrent.ai 所采用的 AutoAI 架构,最大优势是底层架构是统一的,基于统一的底层架构,就可以规模化、可复制地支持不同类型的上层应用。”
杨植麟还分享了 Recurrent.ai 已落地的几个典型应用场景:
  • 通过帮助企业分析销售与客户的海量历史对话数据,进行销售意向打分排序,提升销售转化率;
  • 通过分析客户咨询的高频问题及对应的高转化回复话术,了解用户心声,通过调整沟通策略,提高意向客户成单率;
  • 通过自动结构化呈现客户画像,帮助销售人员依据客户的不同,使用定制的开场白,并且减少重复问题,进一步提升高分线索成单率。
“NLP 落地的最大痛点,从十年前到现在都没有解决的问题,就是这个行业一直是高度定制化的。”杨植麟总结道,“而现在,随着预训练技术和 AutoML 技术的成熟,面向企业服务领域的 NLP 技术有机会实现规模化量产,只有实现规模化量产,才有机会诞生独角兽级别的 NLP 创业公司。”
(*本文为AI科技大本营转载文章,转载联系作者)

精彩推荐

【结果提交倒计时】PV,UV流量预测算法大赛,结果提交截止时间为 9月20日 ,还没有提交的小伙伴抓紧时间了~~9月25日公布初赛成绩。 最新排行榜请扫码查看。

推荐阅读

  • 免费开源!新学期必收藏的AI学习资源,从课件、工具到源码都齐了

  • 干货 | 收藏!16段代码入门Python循环语句

  • Python玩转高德地图API(一)

  • 任正非称华为 6G 领先世界;支付宝小程序将与微博打通;Linux Kernel 5.3 发布 | 极客头条

  • 幼儿识字从比特币开始? 小哥出了本区块链幼教书, 画风真泥石流……

  • Serverless 的喧哗与骚动

  • 我们到底该如何看待6G?

  • 互联网大佬为什么爱唱歌

  • 惊呆!这辆悍马自己在跑跑跑跑跑跑跑!

你点的每个“在看”,我都认真当成了喜欢

XLNet模型第一作者杨植麟:NLP落地的四个技术阶段相关推荐

  1. 智源青年科学家杨植麟:为什么预处理模型XLNet比BERT、RoBERTa更加优越

    在2020年2月11日下午的"智源论坛Live | 青年科学家线上报告会"中,智源青年科学家.Recurrent AI联合创始人杨植麟做了题为<Latest Advances ...

  2. XLNet 发明者杨植麟:从学习的角度看NLP现状与未来(附PPT下载)

    近年来,基于Transformer的一系列大规模预训练模型不断推进NLP领域前沿,也持续冲击着大众和研究者关于NLP任务的认知.GPT-3在多项任务上取得的泛用能力似乎使人们看到了实现通用人工智能的曙 ...

  3. 【报名】杨植麟 :从学习的角度看NLP的现状与未来

    活动议程 日期:11月26日(周四) 时间 主题 19:00-19:05 主持人介绍 张家俊,中国科学院自动化研究所研究员,智源青年科学家 19:05-20:20 <从学习的角度看NLP的现状与 ...

  4. NLP专题直播 | 详谈Transformer, BERT, ALBERT, XLNet(ALBERT第一作者亲自讲解)

    提到 - "预训练模型".从简单的 Word2Vec,ELMo,GPT,BERT,XLNet到ALBERT,  这几乎是NLP过去10年最为颠覆性的成果.作为一名AI从业者,或者未 ...

  5. 杨植麟:28 岁青年科学家,开挂人生的方法论

    智源导读:杨植麟,循环智能创始人.智源青年科学家.如今仅28岁的他,曾于2011年至2015年在清华计算机系就读,本科期间师从唐杰教授:随后去往CMU读博,师从苹果AI研究负责人Ruslan Sala ...

  6. 循环智能杨植麟:“人机耦合”将是对话语义应用的新趋势!

    受访者 | 杨植麟,循环智能联合创始人 记者 | 徐威龙,编辑 | 郭芮 出品 | CSDN(ID:CSDNnews) 「AI技术生态论」人物访谈栏目是CSDN发起的百万人学AI倡议下的重要组成部分. ...

  7. 循环智能杨植麟:“人机耦合”将是对话语义应用的新趋势

    2020-04-12 11:19:51 受访者 | 杨植麟,循环智能联合创始人 记者 | 徐威龙,编辑 | 郭芮 出品 | CSDN(ID:CSDNnews) 「AI技术生态论」人物访谈栏目是CSDN ...

  8. 【2020年高被引学者】 杨植麟 北京睿科伦智能科技有限公司

    [2020年高被引学者]杨植麟,北京睿科伦智能科技有限公司研究员,循环智能(Recurrent AI)联合创始人.本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院.研究兴趣包括深度学习和 ...

  9. 读杨植麟智源采访有感

    永远相信好的东西还没做出来.论文读得不算少,读到自己感觉这也有人做了,那也有人做了,自己的工作一点也没啥亮点,是读入了迷区了. 快速迭代.大多数人的大多数Idea都不work,要快速迭代,不断试错,最 ...

最新文章

  1. PyTorch 之 DataLoader
  2. 保定linux第一版PPT-SVN for Linux
  3. linux上常用工具集
  4. ABAP很厉害是怎么一种体验?
  5. MTK 驱动开发(2)---GPIO 配置
  6. 单片机单口不可用或被占用_昆明工业控制单片机应用开发价格
  7. python numpy数组动态写入csv文件_python - 将NumPy数组转储到csv fi中
  8. Vue + Echarts 实现中国地图的绘制
  9. maven学习系列——(七)Dependency
  10. 换服务器系统怎么迁移,更换服务器时,数据迁移的方法
  11. Java中List集合去重
  12. html 背景图片居中显示,CSS让背景图片居中显示的方法
  13. Linux常用网络指令
  14. java 对Excel 操作 例子(上)
  15. XXX客户2020年护网行动总结报告
  16. 计算机40个快捷键,计算机快捷键40个_计算机常用快捷键大全分享
  17. APP测试点分析与总结
  18. getchar 和 getch区别
  19. 个人电脑详细的安全设置方法
  20. OA系统与MES系统的异同点

热门文章

  1. 1.韩语入门基本发音
  2. scp pm domain
  3. 哈夫曼树和哈夫曼编码应用之图片压缩编码c++实现
  4. 关于毕业生吐槽导师不管不指导毕业论文的在线平台的设计
  5. 在excel中使用vba实现查询、统计系统
  6. 互联网周刊:新技术驱动下的市场渠道创新
  7. 东方财富某年的笔试题
  8. 源代码管理工具-GIT
  9. C++中线程同步的四种方法(Win32平台)
  10. 【CSS笔记】CSS设置元素堆叠顺序、元素宽高自适应、calc数学函数