京东DNN Lab首席科学家:用深度学习搞定80%的客服工作

发表于2014-12-30 18:05| 6968次阅读| 来源CSDN| 8 条评论| 作者周建丁

深度学习京东dnn自然语言处理机器学习deep learning
width="22" height="16" src="http://hits.sinajs.cn/A1/weiboshare.html?url=http%3A%2F%2Fwww.csdn.net%2Farticle%2F1970-01-01%2F2823378&type=3&count=&appkey=&title=CSDN%E8%AE%B0%E8%80%85%E5%AF%B9%E8%AF%9D%E4%BA%AC%E4%B8%9C%E6%B7%B1%E5%BA%A6%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E5%AE%9E%E9%AA%8C%E5%AE%A4%EF%BC%88DNN%20Lab%EF%BC%89%E9%A6%96%E5%B8%AD%E7%A7%91%E5%AD%A6%E5%AE%B6%E6%9D%8E%E6%88%90%E5%8D%8E%EF%BC%8C%E8%AF%9D%E9%A2%98%E6%B6%89%E5%8F%8A%E4%BA%AC%E4%B8%9C%E5%A6%82%E4%BD%95%E7%90%86%E8%A7%A3%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E3%80%81%E4%B8%BA%E4%BD%95%E8%A6%81%E5%81%9A%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E3%80%81%E5%A6%82%E4%BD%95%E5%B1%95%E5%BC%80%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E7%9A%84%E7%A0%94%E7%A9%B6%E3%80%81%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%8A%80%E6%9C%AF%E5%9C%A8%E4%BA%AC%E4%B8%9C%E7%9A%84%E5%BA%94%E7%94%A8%E7%8E%B0%E7%8A%B6%E4%BB%A5%E5%8F%8A%E4%BA%AC%E4%B8%9C%E5%9C%A8%E7%A0%94%E5%8F%91%E8%BF%87%E7%A8%8B%E4%B8%AD%E7%9A%84%E4%B8%80%E4%BA%9B%E5%BF%83%E5%BE%97%E7%AD%89%E3%80%82&pic=&ralateUid=&language=zh_cn&rnd=1464318635180" frameborder="0" scrolling="no" allowtransparency="true">摘要:CSDN记者对话京东深度神经网络实验室(DNN Lab)首席科学家李成华,话题涉及京东如何理解深度学习、为何要做深度学习、如何展开深度学习的研究、深度学习技术在京东的应用现状以及京东在研发过程中的一些心得等。

说深度学习(Deep Learning)算法是当前“人工智能皇冠上的明珠”并不过分。通过深层神经网络(DNN)模型的运用,深度学习已成为目前最接近人脑的智能学习方法,不仅Google、Facebook、百度、腾讯等国内外搜索和社交公司为之疯狂,电商巨头京东和阿里也已经加入竞争。京东更是已经实现深度学习的初步运用。

深度学习技术在电商运营中的价值如何实现?未来的应用趋势是什么?在近日的京东技术狂欢节上,CSDN记者采访了京东深度神经网络实验室(DNN Lab)首席科学家李成华,就此问题进行了讨论,具体的话题涉及京东如何理解深度学习、为何要做深度学习、如何展开深度学习的研究、深度学习技术在京东的应用现状以及京东在研发过程中的一些心得等。

京东深度神经网络实验室(DNN Lab)首席科学家 李成华

李成华介绍,京东DNN Lab主要专注于人工智能和机器学习领域前瞻性的研究,涉及神经网络、知识层次、异构计算等技术的研发。DNN Lab目前主要成果包括命名实体识别、用户意图识别、用户画像和自动问答等,产品化是JIMI智能机器人,已经成功应用于售前咨询、售后服务和生活伴侣三个场景,承担超过30%的京东客服任务。作为一个“新生儿”,JIMI会把处理不了的问题转到人工客服,但京东希望未来JIMI可以包揽至少80%的客服工作。

同时,京东也将会探索利用深度学习算法提升产品销量预测、互联网金融、智能硬件、智能搜索、推荐广告等方面的效果。

大数据催熟深度学习

深度学习是模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释和处理各种数据,包括文本数据、图像数据和语音数据等。

人工神经网络具有良好的学习能力和解决问题的能力,但传统神经网络一般只有两三层的神经网络,其有限的参数和计算单元,对复杂函数的表示能力有限,学习能力受到制约,特征的开发和筛选也极为耗费人力。包含多个隐藏层的深度学习模型则不一样,根据机器学习泰斗、多伦多大学计算机系教授Geoffery Hinton的论文,它的优势更大:

  1. 多隐藏层的人工神经网络具有优异的特征学习能力,学习到的特征对数据有更本质的刻画,从而有利于可视化或分类。
  2. 深度神经网络在训练上的难度,则可以通过“逐层初始化”(Layer-wise Pre-training)来有效克服。

在李成华看来,相比传统神经网络,深度学习更懂用户、更智能、更精准,更符合京东的业务需求。

目前深度学习推广的条件已经成熟。一方面,传统神经网络在大数据量的学习上性能较差,不符合大数据所需的时效性。另一方面,大数据的演进催生了软硬件系统的进步,分布式架构的产生,使得算法的性能已经不是瓶颈,并行化框架和训练加速方法,让深度学习的前景变得光明。同时,大数据也会让深度学习的效果越来越好。所以,从某种意义上说,深度学习是大数据的最佳拍档。

根据业界报道,深度学习在几个主要领域都获得了突破性的进展:

  • 语音识别领域,深度学习用深层模型替换声学模型中的混合高斯模型(GMM),获得了相对30%左右的错误率降低;
  • 图像识别领域,通过构造深度卷积神经网络(CNN),将Top5错误率由26%大幅降低至15%,又通过加大加深网络结构,进一步降低到11%;
  • 自然语言处理领域,深度学习基本获得了与其他方法水平相当的结果,但可以免去繁琐的特征提取步骤。

李成华表示,随着深度学习的发展和成熟,80%的(传统)机器学习算法将会被取代。

京东研究深度学习的初衷

客服对电商发展的重要性毋庸置疑。京东虽然有近5000人的人工客服团队,但应付618或者双十一大促仍然显得捉襟见肘。2012年12月,京东开始筹划成立JIMI智能客服团队,通过一些机器算法模拟人的思维,达到客服跟用户交流的效果。随后深度学习技术的风靡,加深了京东完善JIMI的想法。2014年9月9日,京东成立了京东深度神经网络实验室(DNN Lab),旨在通过神经网络、知识层次、异构计算等新兴领域的研究和应用来确保京东技术的领先性,提高JIMI的智能性及其应用的广泛性是实验室的首个直接目标。

该实验室直接隶属于京东副总裁马松——马松本人是电商及人工智能领域的资深专家,在美国日本做过多年的研究,并曾在eBay担任要职。担任首席科学家的李成华是加拿大约克大学的博士后、美国麻省理工大学的访问科学家,在神经网络领域有超过十年的研究基础和行业经验。团队课题负责人之一张晓鑫博士则毕业于清华大学,曾任职于Google公司,在机器学习和自然语言处理领域有深入的研究。另外,团队成员还有来自华为的刘丹和阿里的杨洋等行业专家。

深度学习技术固然有很大的应用价值,但随着IBM Watson、百度大脑等平台的开放,这种能力的获得并不困难,产品化的好坏才是直接影响客户服务能力的因素。京东没有采用战略合作的方式,而是选择在这个领域投入豪华的阵容自主研发,这说明,深度学习和数据挖掘技术已经被电商企业视为核心竞争力,立志做技术驱动型企业的京东,必须自己掌握核心这些技术,让数据更好地服务于自己。

京东DNN Lab的研发方向

与Google、百度、腾讯在图像和语音识别领域投入重金不同,京东DNN Lab目前更注重自然语言的处理。李成华强调,京东深度学习算法目前用于破解传统机器学习算法的瓶颈,提升JIMI在各个环节的性能、智能程度,从而提升用户满意度。基于这样的目标,DNN Lab主要进行如下4个方面的研发:

  1. 意图识别:针对用户输入的文本,通过意图识别之后对应到订单、售后、商品、闲聊等不同的类别。意图识别对JIMI非常重要,用户的每一句问话,JIMI首先要判断他的意图,到底说的是订单问题、商品咨询还是售后问题,抑或单纯的闲聊,才会给出更好的反馈。
  2. 命名实体识别:先对用户输入的文本进行识别,在对识别后的命名实体进行抽取,对应到人名、地名、商品名、机构名等不同类别,更好地理解用户的语言。所以,命名实体识别其实也是用户意图识别的必须步骤。
  3. 自动问答:在明确用户的意图之后,通过自动问答系统匹配答案,抽取和排序候选答案,给用户反馈最佳答案和建议。通过深度学习的算法,可以提高自动问答的准确率。与此同时,京东还开发了一个知识库,让JIMI能够通过深度学习算法识别用户使用不同的词语背后的各种情绪,从而提供有针对性的回答。
  4. 用户画像:通过用户各个维度的数据,比如性别、能力、身高,历史浏览记录,购物记录,是不是有小孩,最近购物倾向是什么,关注什么商品,对用户做很细的刻度,分成很多维度的画像,标注土豪还是屌丝,用户价值维度是高是低还是中等,用户是什么类别、性质的,是理性保守型还是购物冲动型的,根据这种细粒度的画像提供个性化的服务。

由于人工智能和深度学习技术与大数据相结合的研究和应用都是在探索之中,DNN Lab还没有详细的长期规划。李成华表示,未来的6个月之内,DNN Lab的主要精力还是放在JIMI智能机器人的完善上——JIMI背后的用户画像、自然语言处理、各种自然问答、命名实体抽取等,每一个技术点其实都是一个很大的课题。因此,他同时表示出对深度学习人才的渴求。

不过,李成华也透露,京东对深度学习算法的主要预期,将在产品销量预测、互联网金融、智能硬件、商品搜索/推荐/广告等方面。

DNN在京东的应用

京东基于其人工客服和用户交互产生的上亿条数据对JIMI进行训练,模拟每一个用户场景。JIMI的应用如前文所述,主要分为三类场景。它在2014年双十一期间接待了近百万用户,有效缓解了人工客服的压力。

从实际效果来说, JIMI在一定程度上能够让不解内情的用户单从对话无法区分对方是智能机器人还是人工客服。不过,京东以用户满意度提升、用户体验的提升、用户愿意使用、服务占比提高等指标是来衡量其技术的好坏或者应用的效果,在每个课题上,都有识别的准确性、评判分类的准确性的不同标准。在这些标准下,京东内部对JIMI现阶段的服务效果较为满意。

从神经网络层级来说,李成华介绍,目前工业界用得最多的已经到了十几层甚至几十层,京东目前能够做到八九层,明年可以达到十几层。

在对京东其他大数据应用场景的支持,DNN Lab目前主要是根据项目合作的形式来做,兄弟部门的算法工程师加入项目,提供数据和业务需求,看看哪些点上能用到深度学习,共同改进业务。

李成华希望能够做到深度学习的平民化,即研究一种深度学习算法的架构,把很多参数固定起来,通过预处理,封装成跟数据相关性很小的标准化的API或者云服务,提供给京东内部,让他们很容易地应用于各种数据,最终还将会向京东产业链输出。

DNN Lab阶段性成果的经验

京东DNN Lab正式成立至今不过短短的几个月,JIMI智能机器人就已经取得如此的成绩,确实有骄傲的资本。总结一下,京东的成功主要有以下的几个原因:

  1. 业务导向。相对于财大气粗的Google、百度,京东的体量要小一些,这也让京东以更加务实的姿态进入这个领域,以为业务带来价值为宗旨,譬如第一个目标直指JIMI智能机器人的打造。所以,具体操作上,京东DNN Lab以项目组的方式运行,由一位副总裁直接领导,同时网罗全球优秀的、有经验的技术人才,形成了一个高效的团队。
  2. 数据量与数据质量。得益于开放生态系统的构建,京东拥有庞大的业务量并积累了较为完善的数据,因而深度学习才能达成较好的结果。李成华介绍说:“我们数据比较突出,从大数据来说京东的数据可能是所有电商中数据链最长的,包括经销商的数据、用户一开始浏览我们的数据,可能别的电商有,最后我们做到客服有没有返修,返修的时候跟我们人交互的时候他的情绪是什么样的,这是别的平台他们没有的,因为他们服务不是自己做的,我们推送服务全是自己做的,所以我们对用户数据掌握非常全,所以我们的描述也是最准的。”
  3. 模型优化。这又包括三个层面:针对输入向量非常长的文本(京东的词有将近十万的维度),首先做特征的降维,而且能够找到并应用非常重要的有区别度的,有利于业务提升的特征。第二是说调节各种参数,使得算法能够更快地收敛。第三是通过底层的分布式集群加速算法运算。李成华表示,京东借助于GPU加速运算构建分布式集群,实现性能的提升与大数据量的支持,其单台服务器能比纯CPU运算性能提升8~10倍。

当然,这仅仅是京东在深度学习领域的初步应用。当被问及DNN纵深研发的挑战,李成华表示,其中的一个方面是训练的时间会比较长,因为它的迭代、交叉、神经元的连接时间比较长。甚至如果参数调节不当,训练就没有任何效果——随着深度增加,参数调节需要很多的经验,然而这是一个新兴领域。换句话说,人才的缺乏也是一大难题。未来,我们期待有破解这两个挑战的分享。

京东DNN Lab首席科学家:用深度学习搞定80%的客服工作相关推荐

  1. 点选式验证码?使用深度学习搞定它

    方案要点: 点选式验证码的一般解决流程 如何使用 xyolo 训练自己的目标检测模型 不借助 OCR 功能解决中文验证码的识别问题 爬虫,反爬虫,反反爬虫--一个无限循环. 验证码是反爬虫手段中的常用 ...

  2. 手把手搭建游戏AI—如何使用深度学习搞定《流放之路》

    翻译 | 彭硕,姜沂,reason_W 编校 | reason_W DeepMind开源<星际2>AI平台,OpenAI人工智能系统打败Dota2游戏顶级玩家......越来越多的科技巨头 ...

  3. 世界顶级机器学习科学家黄恒加入京东,出任京东大数据首席科学家

    雷锋网消息,京东集团今日宣布,美国匹兹堡大学John A. Jurenko 杰出冠名讲席教授黄恒博士加入京东. 雷锋网(公众号:雷锋网)注:黄恒教授 黄恒教授是机器学习.人工智能.大数据.计算机视觉等 ...

  4. 基于深度学习的相位恢复及处理相关工作

    ​    大佬王凯强是西北工业大学赵建林老师的博士生,他在光学与光学工程博生联赛第七场上介绍了基于深度学习的相位恢复及处理相关工作.相关视频在公众号"中国光学",实况直播,光学与光 ...

  5. 到底什么是几何深度学习?Twitter 首席科学家Bronstein深度解读

    Bron 作者 | Mr Bear 编辑 | 青暮 前不久,帝国理工学院教授.Twitter 首席科学家 Michael Bronstein 发表了一篇长达160页的论文,试图从对称性和不变性的视角从 ...

  6. tensorrt轻松部署高性能dnn推理_NVIDIA TensorRT高性能深度学习推理

    NVIDIA TensorRT高性能深度学习推理 NVIDIA TensorRT™ 是用于高性能深度学习推理的 SDK.此 SDK 包含深度学习推理优化器和运行时环境,可为深度学习推理应用提供低延迟和 ...

  7. pytorch深度学习_用于数据科学家的深度学习的最小pytorch子集

    pytorch深度学习 PyTorch has sort of became one of the de facto standards for creating Neural Networks no ...

  8. 国外科学家使用深度学习还原古代文字代码开源

    下面这张图是考古中发现的一块损坏的铭文:关于一项关于雅典卫城的法令(公元前485/4). 概述 深度学习可以帮助学者恢复古希腊文字. 牛津大学的研究人员(Thea Sommerschield和乔纳森· ...

  9. Ubuntu16.04 ROS 深度学习_传智播客 智能机器人软件开发 学习路线图出炉!首发优惠!!...

    黑马程序员 微信号:heiniu526 传智播客旗下互联网资讯,学习资源免费分享平台 智能机器人软件工程师学习计划 很多朋友对机器人软件开发和人工智能感兴趣,不知道怎么学习,传智播客武汉校区在今年3月 ...

最新文章

  1. 【python教程入门学习】Python函数定义及传参方式详解(4种)
  2. blob html 预览_Blob | HTML 5 API | JavaScript 权威指南
  3. 关于js里的document.compatmode
  4. Service Mesh 和 API Gateway 关系深度探讨
  5. QT的QCommandLineOption类的使用
  6. CA knowledge study
  7. windows环境下Oracle数据库冷备份和恢复
  8. 一台7纳米光刻机月产能有多大,何为能卖上亿美元?
  9. 上下文异常中的上下文属性_在没有适当上下文的情况下引发异常是一种不良习惯...
  10. 不同格式的json解析
  11. 故宫学生网页设计作品 dreamweaver作业静态HTML网页设计模板 旅游景点网页作业制作
  12. (53)FPGA面试题-利用任务task实现单字节乘法功能(Verilog语言实现)
  13. HP 360G5 IO性能提高方法
  14. 通过反射认识泛型的本质
  15. 递归算法JAVA实现
  16. MCAFEE卸载软件测试初学者,win7系统完全卸载McAfee杀毒软件的两种方法
  17. 计量模型 | 前定变量#时间FE
  18. Texstudio + sumatraPDF 正反向搜索关联设置
  19. 影响红外测温的主要因素分析
  20. 顶会竞赛最后5天被Facebook超越,又大比分反超夺冠是什么体验?

热门文章

  1. java 状态迁移图_kafka 实战笔记
  2. 三目运算法求一个大值,以及指定位数的应用,以及函数的声明,以及函数的嵌套,以及函数的递归,以及用递归法求阶乘
  3. SharedPreferences记住用户密码 态判断应用是否首次启动等
  4. C++基类和派生类的构造函数(一)
  5. ubuntu 安装 postgres
  6. python 栈实现
  7. php调用接口接口代码无法执行,php调用c接口无错版介绍
  8. numpy 笔记:setdiff1d
  9. 文巾解题 27. 移除元素
  10. python文件操作2:在指定目录下查找指定后缀名的文件