整理 | Just

出品 | AI科技大本营(ID:rgznai100)

随着BERT、XLNET等新技术的涌现,深度NLP在语言分析、理解和处理等问题上继续取得突飞猛进的发展,并为更多行业赋予了智能化能力。阿里云智能NLP平台提供了完整的NLP处理能力,并通过与场景的深度结合,在智能司法、智能医疗、智能客服等领域落地。

9月26日,在云栖大会的NLP专场,围绕阿里小蜜平台的技术布局、典型场景应用,阿里巴巴智能服务事业部资深算法专家陈海青介绍了阿里NLP核心技术及人机交互技术实践,技术挑战及未来。

值得一提的是,阿里达摩院还在此次专题上发布了NLP与MT自学习平台。

阿里小蜜的NLP技术实践

淘宝传统的服务模式是人找人的方式,去年平台平均每天的客服服务是5000万人次,所以自然需要通过机器智能方式解决问题。为此,阿里逐步搭建了小蜜智能交互平台以服务商家及其背后的用户。

陈海青介绍了阿里小蜜平台的三大模式升级:其一是服务模式的升级,从纯人力密集型向智能+人力混合型升级;其二是着力点的升级,从以服务为基础的智能人机交互领域额着力点向平台与多领域升级;其三是生态圈的升级,从阿里巴巴自身领域到二环商家再到企业平台领域的升级。

随后他展示了阿里小蜜平台的一些应用案例。以店小蜜为例,它可以构建物流场景的通用本体模,也可以构建手机、服饰类目等行业本体模型,此外还有QA匹配模型。

而对企业小蜜,有面向第三方企业、ISV等的智能解决方案,并以智能知识库的方式进行知识收集与积累。

拓展到电话的案例,还有热线小蜜,主要应用于呼入场景的电话客服还有呼出场景的电话回访机器人,陈海青在现场展示了菜鸟语音的交互效果。

NLP技术是这些应用背后的核心支撑技术。他介绍了自然语言处理板块的分层梳理流程,主要包括分层领域的框架设计,基于不同业务场景的意图和模型设计与积累,以及通过模型沉淀框架并进行平台化积累。这一板块做到了四种能力,QA Bot,task bot,predictbot,chit chat。

围绕数据、算法、服务、应用四个层面,他介绍了核心的NLU架构体系。其中包括数据的沉淀以及业务标注的训练平台体系构建;还有基于平台化算法框架的意图识别和实体识别能力搭建;基于规则,降级模型以及深度模型的NLU工程能力平台搭建。

他指出,当前NLU还是以意图识别和实体识别为核心能力。面临的核心挑战是意图的平台化扩展效率和小样本场景的冷启动,就NLU的效率和效果而言,主要涉及的问题是如何构建数据、算法和服务。

他重点简述了NLU的意图识别问题,主要分为文本分类和语义匹配任务。这需要做到迁移性好/扩展性好,新增类别或新增语料,无需重训模型;借助迁移能力,提升小样本场景效果。其次,鲁棒性要高,不容易受噪声样本影响,如类别向量,端到端学习。最后效果要好,统一距离度量空间,如:list-wiseloss, Softmax & Cross Entropy。为此,他们提出了LabelEmbedding的方法,以增强意图识别的鲁棒性。

他还介绍了提出了DeepQA平台,该平台的目标是提效+规模,帮助前台业务先赢,完成中台算法能力沉淀。中台提供各类场景的知识定位能力,支持了小蜜全系列产品,中台为业务运营人员提供业务分析方法论和运营平台,让零算法基础的运营人员可以完成也无需求分析、算法能力选择、算法模型定制和迭代优化。

该平台内置了面向各种场景、各类任务的性能和效果,兼具的算法模型。比如RE2-短文本匹配模型,相比相同效果的模型(CSRAN),在线推理的速度提升8倍。此外,中台通过bert+MTL+distill的流程,盘活各类数据,让bert对线上真实业务产生价值。

演讲最后,陈海清指出,智能服务机器人将以多模态的方式,不仅提供自动服务模式,同时提供更好的人机协同模式,为用户和客服人员提供更复杂问题的解决能力和决策支持能力。而持续探索的技术方向有生成模型、强化模型、迁移学习、机器阅读理解、情感分析等。

阿里发布 NLP与MT自学习平台

NLP自学习平台

大量低算法基础的客户,对文本实体抽取、文本分类、关键短语抽取等算法有定制化需求,需要一个可以低成本、易操作,可私有化输出及持续优化的NLP应用平台。

面向算法基础用户的NLP行业自适应标注、训练和服务平台,用户无需算法背景,仅需标注或上传适量文档数据,即可通过平台获得优质的NLP算法模型。

机器翻译自学习平台

传统的云端AI服务是由算法专家基于多种场景的需求和目标开发,有时不能完全匹配用户需要,但基于自身真实场景优化AI模型对用户的算法能力提出了很高要求。

机器翻译自学习平台为算法“小白”提供了直观、易用、可视化的 AI 优化工具,用户无需拥有丰富的算法背景,仅需上传适量双语文档数据,即可通过平台快速创建算法模型并使用。

目前,已支持中英和英中两个语向的机器翻译定制化算法能力,未来还将上线更多的语向能力支持,让人人都可轻松创建属于自身场景的专属模型。

(*本文为 AI科技大本营原创文章,转载请微信联系作者 1092722531)

阿里发布NLP和MT自学习平台,还剖析了小蜜平台的NLP技术实践相关推荐

  1. 阿里小蜜数字人多模态交互实践

    来源:DataFunTalk本文约7000字,建议阅读10分钟 本次分享主要围绕多模态与人机交互技术在电商直播中的应用. 分享嘉宾:赵中州 阿里巴巴 高级算法专家 编辑整理:贾惠然 北京理工大学 出品 ...

  2. 京东商城总架构师、基础平台负责人刘海锋:京东双11创新技术实践

    [CSDN现场报道]2016 年 11 月 18 日- 20 日,由 CSDN 重磅打造的年终技术盛会 -- "2016 中国软件开发者大会"(Software Developer ...

  3. 【云上创新】阿里云视频云分享全场景音视频服务背后的场景探索与技术实践

    简介:视频云赋能行业革新 5 月 28 日 - 29 日,2021 阿里云峰会在北京国家会议中心隆重召开,从 "全面上云" 到 "云上创新",标志着阿里云在 2 ...

  4. 云上创新,阿里云视频云分享全场景音视频服务背后的场景探索与技术实践

    5 月 28 日 - 29 日,2021 阿里云峰会在北京国家会议中心隆重召开,从 "全面上云" 到 "云上创新",标志着阿里云在 2021 年的全新重磅升级! ...

  5. 机器如何猜你所想?阿里小蜜预测平台揭秘 1

    阿里妹导读:阿里小蜜是2015年阿里发布的一款智能客服机器人.2017年双11期间,阿里小蜜的服务量达到643万,其中智能解决率达到95%,占整体服务量的95%.经过近几年的发展,能否更进一步解决智能 ...

  6. 颠覆传统的电商智能助理-阿里小蜜技术揭秘

    http://www.infoq.com/cn/articles/electricity-supplier-intelligent-assistant 一.双11的挑战与服务模式的转型 在全球人工智能 ...

  7. 未来已来!阿里小蜜AI技术揭秘

    原文链接 1.双11的挑战与服务模式的转型 在全球人工智能领域不断发展的今天,包括Google.Facebook.Microsoft.Amazon.Apple等互联公司相继推出了自己的智能私人助理和机 ...

  8. 小蜜智能对话开发平台

    内容来源:2018 年 08 月 05 日,阿里巴巴算法专家唐呈光在"人工智能技术沙龙(杭州站)"进行<小蜜智能对话开发平台>演讲分享.IT 大咖说(微信id:itda ...

  9. 阿里云小蜜优势与应用场景

    云小蜜(Intelligent Service Robot)是一款基于自然语言处理(NLP)和人工智能(AI)技术提供智能会话能力的云服务.无需亲自掌握NLP.AI等技术,您就可以使用云小蜜创建自己的 ...

最新文章

  1. Kruskal算法 - C语言详解
  2. Redis缓存穿透问题及解决方案
  3. 移植2.6.38内核到s3c6410问题
  4. 计算机应用基础18春在线作业1答案,东师计算机应用基础-18春在线作业1.docx
  5. ftp服务器PDF文件在线查看
  6. 校园招聘最重要的有2点 第一个是不要抱死一家公司
  7. 消息中间件kafka集群搭建
  8. 深度学习2.0-普通BP神经网络
  9. iptables禁止国外ip访问-脚本
  10. 311 复制文件的异常处理
  11. NLP - AIML
  12. 大气传输、大气辐射传输
  13. 安卓夜神模拟器设置代理
  14. java 变量监听_java main函数里面的变量i怎么获取addActionListener监听里jtf_username.getText()的值?...
  15. PHP调用wsdl接口实例化SoapClient抛出异常
  16. web前端常用网站收藏
  17. 3D 池化(MaxPool3D) 和 3D(Conv3d) 卷积详解
  18. Centos7系统下使用Docker部署SpringBoot项目及安装Mysql
  19. 山东大学单片机原理与应用实验 汇编程序实验2
  20. 【django】settings.py配置文件内容详细介绍

热门文章

  1. nacos注册中心发现不到服务
  2. 华为云分布式全系列产品组合,帮助企业轻松上云
  3. TCP三次握手四次挥手及time_wait状态解析
  4. 类变量类方法,main方法,代码块,单例设计模式,final,抽象类
  5. Webpack 自动刷新和HMR
  6. 了解 RISC-V 架构,它可以替代 ARM吗?
  7. 正向代理、透明代理、反向代理
  8. Python+Requests实现接口自动化
  9. HackBar插件绕许可
  10. SQL联合注入结合hackbar