编辑导语:当今人们已经进入到一个大数据时代,人们每天都在生产者各种各样的数据,这些数据又在不断被循环利用推动着行业和社会的进步。不同行业都有着不同的数据指标体系,本文作者对评估智能对话机器人的数据指标维度展开了梳理,与大家分享。

如果你正负责一款智能对话机器人产品,不管是软件还是硬件,不管叫“小a”还是叫“小b”,总要遇到一个对于产品本身好坏的衡量指标的难题。如果你是leader更要弄清楚到底怎么给做这款产品的下属制定OKR及考核指标。

其实,当前多数对话机器人产品都还是一些长远战略布局的产品定位,既不能要求它达成百万千万的gmv,也不能要求它实现app那样的日活月活高留存。理解它的产品定位,理解当前你所在的对话机器人的领域,才能更清楚的去评判自家产品的好坏以及在竞品中的排名地位。

智能对话机器人,或者有些公司会将其命名为“智能助理”“智能小助手”,多数是以“工具+闲聊”的组合方式出现的,因此通常支持多个领域的支持多轮对话。而市面上的产品形态也以是否有GUI分为纯语音对话交互和多模态对话交互两种。

而本文讨论的目标产品主要聚焦在支持多模态对话交互的“工具+闲聊”的软硬件产品。当然,单轮指令式机器人或只有VUI的纯语音机器人也可以进行部分指标维度的借鉴,在此不做特别指出。

评估智能对话机器人产品的数据指标维度分为2大部分:产品维度指标、技术维度指标。本文重点聚焦产品维度的7大数据指标,同时给出3个核心技术维度指标供参考。

一、产品维度七大指标

1. 产品使用率

指标目的:分析用户对于产品的感兴趣度(与之相关的指标就是N日留存率,不在赘述)

指标含义:使用了对话机器人产品的用户数占用户总数或者曝光用户数的比例。

计算公式:使用用户数 / 总用户数或曝光用户数。其中分母根据产品类型有区分:如果是硬件类产品那么分母则是所售出的硬件总数;如果是软件类产品,则要分2种情况:1.独立对话机器人app则分母是每天打开app的用户数;2.寄生于主app上的对话机器人则分母是每天机器人入口的曝光用户数。

统计周期:按日、周、月

2. 最终结果触达率

指标目的:分析对话流程的流畅度

指标含义:使用了对话机器人产品的用户在有效会话中有多少比例获得了最终的结果(比如一段文本答案、一条图文链接等)

计算公式:最终结果数 / 会话session数

统计周期:按会话session,或按日

3. 结果准确率

指标目的:与上一个指标是关联指标,用于分析结果的准确程度

指标含义:每次有效会话结束,虽然产品给予了用户最终结果,但不一定是用户想要的正确结果。

计算公式:反馈给用户的正确的结果数 / 反馈结果总数。其中分子的统计口径有2种,一种是用户反馈的好评度(如果产品设计有这样的功能点),一种是人工抽样。

统计周期:按日

4. 平均对话轮次

指标目的:分析任务型对话机器人的对话流程健康度

指标含义:某一类任务(或技能)的对话轮次的平均数

计算公式:某类任务的对话轮次/某类任务的对话总数

统计周期:按日

5. 跳出率

指标目的:分析对话机器人的产品设计友好度

指标含义:某一类任务(或技能)对话中断的比例

计算公式:某类任务的对话中断数 /某类任务的对话总数

统计周期:按会话session,按日

6. 异常率

指标目的:分析对话机器人的异常率找出关键问题并快速修复

指标含义:用户使用对话机器人过程中的异常状况出现的比例

计算公式:异常报错数 / 会话session数

统计周期:按时、日

7. 推荐结果点击率

指标目的:分析有GUI的产品推荐内容的精准度

指标含义:在初始化场景或某类特定场景,产品给出推荐内容的用户接受比例

计算公式:推荐答案或内容的点击(或采纳)次数 / 推荐次数

统计周期:按会话session,按日

二、技术维度三大参考指标

1. 意图识别准确率

指标目的:意图识别直接影响最终结果是否准确,所以用于分析产品所涉及的领域内用户意图识别的准确率

指标含义:正确识别单次会话session用户意图识别的准确程度

2. 文本泛化能力

指标目的:好的泛化能力才能更好的支持人类语言表达的复杂性理解,也是nlp的核心指标

指标含义:对指定模块进行抽样,看是否支持提问文本、槽位等多种表达形式的识别

3. 纠错/同义/歧义处理能力

指标目的:用户进行文本/语音输入时,有概率产生错误的、别名类的、或者有歧义的表达,而系统能否根据上下文识别准确的含义或给出多种含义的可能性则直接影响产品的用户体验

指标含义:对用户的对话进行分析,找到三种细分场景的case进行抽样或模型比对给出相应的正确处理比例

评估智能对话机器人的7大数据指标相关推荐

  1. Rasa 3.X 智能对话机器人案例开发硬核实战高手之路 (7大项目Expert版本)

    课程标题:Rasa 3.X 智能对话机器人案例开发硬核实战高手之路(7大项目Expert版本) 课程关键字:Rasa Application.Debugging.E-commerce.Retail.C ...

  2. 自然语言处理NLP星空智能对话机器人系列:Gavin大咖 Transformer 101问答集 第一问

    自然语言处理NLP星空智能对话机器人系列:Transformer 101问答集 第一问 Gavin大咖:请大家多多贡献问题,我们共同做好Transformer 101 问答,送个全世界不同国家的Tra ...

  3. 自然语言处理NLP星空智能对话机器人系列:业界动态信息分享 京东零售数据智能探索实践沙龙

    自然语言处理NLP星空智能对话机器人系列:业界动态信息分享 京东零售数据智能探索实践沙龙 目录 京东客服全链路数智化的应用实践 京东智能商客之推荐卖点的技术介绍 星空智能对话机器人系列博客 京东客服全 ...

  4. mxm智能教育机器人无法智能对话_零代码使用腾讯TBP打造智能对话机器人

    点击观看大咖分享 心疼你独自一人承担生活的苦难,寂寞夜里陪伴你的只剩无人倾诉的压抑和无处安放的焦虑.养个宠物,它却不能get到你的"宠言宠语".找个伴侣,还要浪费吵架的时间和精力. ...

  5. 《智能对话机器人开发实战20讲》--学习笔记--AIML基础功能拓展-与互联网的集成

    一.学习笔记 环境要求: aiml bs4 语料库: tuling.aiml search_web.aiml <that>WHICH SEARCH ENGINE WOULD YOU LIK ...

  6. 蚂蚁金服崔恒斌:金融智能——对话机器人新形态

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 转自 | 中国人工智能学会 本篇整理自蚂蚁金服人工智能部高级算法专家崔恒斌主题为<金融智能--对 ...

  7. 智能对话机器人开发实战视频教程-张子良-专题视频课程

    智能对话机器人开发实战视频教程-308人已学习 课程介绍         机器人开发实战教程.该视频课程共涵盖四大方面: 1.案例驱动:三大智能对话机器人需求场景,三个完整案例: 2.源码操作:内含完 ...

  8. 自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 WMT数据处理

    自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 WMT数据处理 目录 Finalizing the preprocessing of the datasets 星 ...

  9. 自然语言处理NLP系列:第二次星空智能对话机器人Zoom线上演示安排

    第二次星空智能对话机器人Zoom线上演示安排 时间:北京时间2021年9月1号晚上9-10:30 地点:Zoom (会议前一天会在群中发布会议链接,大家可以通过https://zoom.us/down ...

最新文章

  1. 对PInvoke函数函数调用导致堆栈不对称。原因可能是托管的 PInvoke 签名与非托管的目标签名不匹配。...
  2. 博通收购高通12张PPT深度解析!
  3. Vertica 高可用性测试
  4. 远程安装oracle 10.2.1 for redhat 5.0 2.6.18-53.el5xen【转】
  5. python读取excel画散点图-matplotlib两种画散点图的方式
  6. Ubuntu 16.04下用Wine运行的软件出现方块的解决思路(应该是兼容现在所有平台的Wine碰到这个的问题)...
  7. 【PAT乙级】1029 旧键盘 (20 分)
  8. java中的几种泛型类——HashSet、HashMap、TreeSet、TreeMap,遍历map,排序,HashTable比较
  9. javamail腾讯企业邮箱发送邮件
  10. PAT乙级(1017 A除以B)
  11. iOS开发之UIApplication
  12. [置顶] java除0问题探究
  13. python游戏开发库_Python库之游戏开发及虚拟现实
  14. 2017《Java技术》预备作业 杨阳
  15. 二、bootstrap table 父子表和行列调序
  16. java代码餐馆管理系统_Java 餐厅收银管理系统
  17. 局域网计算机维护工具,局域网共享工具,教您局域网共享工具
  18. git与gitlab使用教程
  19. JS基础——选项卡列表显示隐藏缩略图(函数传参)
  20. [SP]梦网masterSP模式下的sp生存

热门文章

  1. 京东探索研究院NLP水平超越微软 织女Vega v1模型位居GLUE榜首
  2. android html 布局设计工具,教你使用Android SDK布局优化工具layoutopt
  3. 微信朋友圈视频变长从6秒增加为10秒
  4. Django+Vue开发生鲜电商平台之2.开发环境搭建
  5. O2O到家业务:如何在配送履约环节,做到极致优化?
  6. 乘S10热销的东风,三星四机齐出再攻中国手机市场
  7. Ubuntu18.04使用Xorg创建虚拟屏幕
  8. iOS主线程卡顿监测
  9. jdk-17下载与安装(window10)
  10. 2018 Arab Collegiate Programming Contest (ACPC 2018) E - Exciting Menus AC自动机