ArchSummit全球架构师峰会深圳站将于2017年7月7日~8日在深圳·华侨城洲际酒店召开,大会设置了相关专题来深入解读电商大促背后的技术故事,大会还邀请了eBay、WalmartLabs等国外顶尖技术专家,分享AI促销、搜索引擎、异地多活、库存物流等核心架构实践。

\\

目前,人工智能正在以前所未有的姿态汹涌而来,快速杀入人们的视野。京东一直致力于用技术驱动业务成长,全面提高用户体验,基于对未来客服人力成本可能的提升,以及人工智能技术的发展趋势,早在2012年,京东就决定研制智能机器人以应对业务不断拓展带来的客服成本和压力。

\\

JIMI的发展:智能进化,全面拓展

\\

2012年JIMI顺势诞生,初期以售后服务为主,14年5月开放售前服务,逐渐拓展到移动端、微博、微信等多平台端口,为用户提供推荐商品、告知优惠、砍价、下单、直接支付的售前全流程闭环体验,让用户可以边咨询边购物,成为用户贴心的购物助手。同时,我们也将智能机器人拓展到各个业务层面,店铺JIMI、京东金融JIMI、京东到家JIMI相继诞生,此外,我们还将JIMI的服务能力平台化,推出了JIMI开放平台,接入长虹、华西等外部企业。

\\

\\

在这全面应用和不断推广的过程中,JIMI也为京东商城节约了数千万的人力成本。日接待量高达百万次,覆盖京东10亿+的商品,应答准确率90%以上,用户满意度高达80%以上,减少客服压力的同时为用户提供更好的服务,也帮助外部企业也减少了至少50%的人力成本。

\\

JIMI产品技术体系揭秘

\\

JIMI 整体产品架构如下图所示:

\\

\\

目前JIMI推出的覆盖全平台的用户端产品,商家和企业一旦启用,也就将JIMI的能力赋能给商家和企业,让商家和企业可以定制自己的智能机器人。JIMI在多领域多终端以拟人化的交互体验为用户进行服务,多领域语义识别、情感分析和领域知识图谱等能力是JIMI的核心。基础平台支撑起JIMI服务能力,让JIMI可以快速高效进行数据标注、清洗、挖掘,以及模型训练等。

\\

为了更灵活高效的支撑 JIMI 产品发展路线,在技术上 JIMI 采用了平台服务化架构技术体系,如下图:

\\

\\

从上到下,顶部展示的是目前 JIMI 支撑的所有业务场景,包括:京东自营业务的导购、售后和虚拟业务,京东 POP 店铺机器人,京东金融机器人等。其下,是统一接入层。界面按照终端接入组件化思路,所有界面交互统一把交互和展示逻辑封装,按照 Web(PC)、SDK、M 页面分三类。前后端数据交互通道,浏览器走 HTTPs 和 WebSocket 方式,移动 SDK 走 TCP 方式,若是服务端接口,走京东内部标准化 JSF RPC 方式。这样就整合了所有来自不同终端不同业务场景机器人请求,所有请求统一转发到“调度引擎”服务进行请求调度分发。

\\

“调度引擎”相当于一个请求路由服务,根据终端机器人请求类型的不同,会调度分发给后端不同服务流程处理。后端的服务整体分为“算法”、“工程”、“数据”三类。对于聊天机器人来说,“算法”是大脑、“工程”是躯体、而“数据”是血液。下面,分别简单介绍下三类服务的作用与协作方式。

\\

“工程”是系统的躯体,它负责了在线问答请求各服务的内部流转,如下图所示的服务交互流程:

\\

\\

“算法”是系统的大脑,它的核心是自然语言处理(NLP)。NLP 负责对用户的问题进行分析并产生答案,包括:用户的意图识别,关键词的识别、歧义分析等。对于问答机器人而言,语言理解的关键在于用户意图识别。当用户存在明确意图时,结合相应商品等信息就能给出准确的答案。在实际应用中,意图识别往往看作机器学习的多分类问题。

\\

为了让JIMI更精准地理解用户的提问,从而给出针对性更强的回答,2015年,京东成立DNN实验室(深度神经网络实验室),将NLP和DNN进行结合,这种新算法具有一定的上下文识别能力,相对于传统的分类算法,会更准确。

\\

我们只要将京东客服能够回答的问题归纳成一个个的业务点:如退换货相关、运费相关、商品属性相关等。意图识别需要做的就是对用户问题进行分类,决定用户意图到底是在哪一个业务点上。即分类模型输入为用户问题,输出为当前咨询所属业务点。在引入深度神经网络模型后,JIMI意图识别整体准确率由原先的76% 提升至84.1%。在命名实体识别(关键词识别)环境上,结合深度神经网络,JIMI抽取用户问题关键信息的准确率比传统方法提高了6.6%。这也是JIMI与其它同类产品的本质区别。

\\

意图识别模块除了分类外,后续的维护工作也相当重要。一方面需要优化当前的分类效果,解决线上的 bad case;另一方面随着时间迁移,会出现新的业务点,用户提问方式也会发生改变。我们的分类模型也需要随之做出调整。为了减少人力,做到模型自学习,还需要引入线上数据收集模块,整个意图识别框架如 
\下:

\\

\\

这样线下和线上的工作联动运作,就能保证JIMI的意图识别不断优化,跟得上业务的不断升级。

\\

“数据”是系统的血液,其架构体系如下:

\\

\\

数据经过采集(采集方式包括:SDK、HTTP 和事件采集)、预处理、数据格式校验,通过传输通道(JMQ、Kafka 消息队列异步传输、HTTP 同步传输)进入数据存储层。通过建立的元数据进行实时或者离线加工处理,并建立索引服务,供查询搜索使用。对于清洗后的数据,进行数据聚合,供机器学习语料训练;并提供数据自助查询,报表展现。能支撑 10 亿级数据实时上报,做到秒级延迟、秒级查询,提升了JIMI的应答效果。

\\

用户画像也是JIMI重要的技术手段之一,目前我们主要致力于挖掘用户与用户、用户与商品之间的深层次联系,通过深度学习、大数据处理等核心技术,建立起复杂的用户、商品特征关联网络,用于精准的刻画用户特性。我们把每个用户的特征,都加入到模型的训练和预测中,比如根据画像数据,当前用户是有小孩的,且历史有过购买奶粉的记录,那我们预测时就会结合用户画像特征,推测用户可能会问奶粉购买相关的问题,并直接将问题展示出来供客户点选,用户点击感兴趣的问题进行咨询即可。

\\

JIMI的未来:全能的智能AI与开放的平台

\\

前不久,AlphaGo对战柯洁获全胜的新闻引起了大众的广泛讨论,对于JIMI是否会像AlphaGo一样在某些方面进行训练,以达到人类水平或超过人类这个问题,我们已经可以说,JIMI在一些品类的客服满意度已超过人工客服。目前在日常情况下,JIMI的接待量已与人工客服接待量持平,大促期间甚至会超越人工客服。

\\

未来JIMI也会继续不断进化,除客服行业,也会积极拓展其它领域的深度学习,提升服务质量,推动人工智能技术成长。同时,我们也会通过我们的人工智能开放平台,给不同行业的商家或机构提供智能咨询服务解决方案,让智能JIMI的身影能够进入各个垂直领域,实现京东技术能力的开放与经验共享。

\\

作者介绍:

\\

刘丹,京东智能通讯部总监,京东深度神经网络实验室(DNN-Lab)核心成员之一,资深电商专家。在实时通讯、测试架构、稳定性框架、智能电商服务等领域均有涉猎,精通业务通用 性架构、用户行为、智能客服、稳定性提升等多项理论及实践,京东咚咚、智能聊天机器人和无人客服系统研发负责人。

京东618:智能机器人JIMI的进击之路相关推荐

  1. 京东618:六年历程步步为营,京东商城的安全保卫战

    电商网站在为广大用户提供网购便利的同时,在安全方面也不可以掉以轻心.那么作为一家高流量的电商,京东是怎样做安全防护的?在618备战期间又需要特别注意哪些事项?京东安全的现状和未来是怎样的?为此,Inf ...

  2. 京东618技术解析之高可用多中心交易平台

    京东618技术解析之高可用多中心交易平台 分流是应对互联网业务流量峰值时保证系统高可用的常规方法,但涉及交易系统的分流是很难的.京东在备战2015年618时就开始了多中心交易的改造,让用户就近访问交易 ...

  3. 互联网日报 | 天猫京东618再创新纪录;字节跳动成立抖音电商部门;全国普速铁路20日起实施电子客票...

    今日看点 ✦ 天猫618累计下单金额6982亿元,京东618累计下单金额2692亿元,均创造新高 ✦ 字节跳动成立抖音电商部门,否认收购蓝色光标 ✦ 东航推出全民航领域首款"周末随心飞&qu ...

  4. 京东618和双十一,我如何做好京东旗舰级营销活动(附诀窍)

    作者:赵飞谭,个人微信:zhao_feitan[添加时烦请备注下公司行业岗位] 全文共 9824 字 23 图,阅读需要 22 分钟 ---- / BEGIN / ---- 本篇为 " 电商 ...

  5. 淘宝/天猫/京东618活动任务自动助手,自动完成任务领取奖励,附上源码,技术交流,欢迎指教

    下载地址:https://www.lanzoui.com/b01cfbrbi "ui"; var color = "#009688"; //开始时间,提前时间量 ...

  6. 华丽京东 618 背后,刘强东的梦想与焦虑

    点击上方"CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 一年一度的京东618狂欢终于落下帷幕,累计下单金额达1592亿元,冲顶新高.年中大促是京东对 ...

  7. 彻底取代Redis+数据库架构,京东618稳了!

    作者介绍 京东零售在线存储部,致力于分布式系统.开源数据库技术的研究,主要负责数据库性能调优.监控和架构设计. 过去十年,随着移动互联网指数级的增长,企业和用户对应用程序的响应性能要求越来越高, 如何 ...

  8. 多细胞生命进击之路:单细胞为何放弃自由,长成复杂的多细胞?

    来源:集智俱乐部 作者:Veronique Greenwood 译者:赵雨亭 审校:张澳 编辑:邓一雪 导语 人类作为复杂的多细胞生命,似乎理所当然地认为,多细胞生命相对单细胞生命有绝对的优势.但实际 ...

  9. 京东618单日销售超10亿,B2C网购正成主流

    刚看到一条关于京东的新闻.消息称,京东商城618店庆日再次刷新销售记录,单日成交10.16亿,有效订单达150万.面对这个惊人的数据,笔者并不感到意外.这是作为B2C领头羊的京东商城在投入了巨额促销后 ...

最新文章

  1. LINUX在逻辑卷基础加盘操作步骤
  2. im即时通讯源码_IM消息ID技术专题(六):深度解密滴滴的高性能ID生成器(Tinyid)
  3. docker脚本安装 阿里云_让运行在 Docker 中的 Ghost 支持阿里云 OSS
  4. 一些Python情结
  5. nginx服务器的文件大小的限制解决方法
  6. .NET 使用 ILRepack 合并多个程序集(替代 ILMerge),避免引入额外的依赖
  7. Java 10迁移建议
  8. [No0000D7]img生成器.bat合并所有图片到html网页中
  9. ulead gif animator_搞笑GIF趣图:这风看来很大啊,今天回不来家了7
  10. golang 代理地址
  11. Eclipse中安装TestNG插件
  12. Learning to rank 特征抽取
  13. ASP.NET MVC 5 学习教程:数据迁移之添加字段
  14. 关于webpack升级过后不能打包的问题;
  15. 【道高一尺,魔高一丈】Python爬虫之如何应对网站反爬虫策略
  16. windows 2008 R2 断电进入修复模式,并且无法使用usb键盘鼠标的解决方法
  17. 中国大学mooc慕课python答案_中国大学mooc慕课_Python游戏开发入门_章节测试答案...
  18. CStdioFile类的使用1
  19. python假分数约分,数学中假分数怎么约分
  20. 3年100亿!苏宁易购与倍科达成重磅战略合作

热门文章

  1. 2016百度实习编程题:括号序列
  2. [Java基础] Java如何实现条件编译
  3. Java Web整合开发读书笔记
  4. NFS 文件共享的创建过程
  5. android zip解压缩(含有子目录)
  6. Label控件属性AssociatedControlID
  7. 第一篇文章,做个纪念
  8. springBean生命周期----来自spring实战总结
  9. Zend Framework Mail通过网易免费邮箱发送邮件
  10. vivado烧写bin文件到flash 中