前言
人机交互简单来说,就是“人和机器打交道的方式”。人和计算机打交道根源于人类把计算机当成一种有效的计算服务工具。计算机自产生以来,计算能力日益强大,人类对计算机的态度也开始在计算机只是呆板的“机器”,还是可能变得像“人”一样聪明,甚至比人更聪明之间摇摆。这种模糊的态度伴随着计算机的进化不断演变。随着深度学习技术的崛起,进一步加速了这个进程。人与机器人指尖的交流也逐步从指令交流转向情感交流,而在这种交互的进化过程中,也伴随着一些难题与挑战。
百度为2018人工智能创意赛集训营邀请了百度AI交互设计院体验架构师李士岩,为你解答这些难题的解决方案。

机器人和人机交互体验需要重构


图一: 1921年捷克剧作家卡尔·恰佩克(Karl Capek)在名为《罗素姆万能机器人》(Rossums Universal Robot)的戏剧作品中创造了“robot”(机器人)这个名词。这个词源于捷克语的“robota”,意思是“苦力”。
机器人自从在人们想象中诞生的那天起承载了人类巨大的梦想,这个梦想是将人类从繁重的劳动中解放出来。人类的劳动从交通设计角度有两个部分,第一部分来自于人类与世界的交互,比如搬运;刷碗;洗衣服。第二部分来自于人与人的交互,比如心理辅导;讲故事;指路。机器人完成人类的梦想必须解决两个层面的交互问题,第一个机器人与世界的交互,第二个维度是机器人与人的交互。机器人与世界的交互严重的依赖科学和技术主导,目前这部分取得了长足的进步。用设计将技术转化为机器人类体验较好的交互方式是机器人与人的交互,而目前这部分依旧处于初级的水平。现在主要存在三个问题:
第一个问题是语音交互唤醒不够自然,每次的发出指令前必须有一个唤醒的方式,这样使得使用机器人的效率非常非常低,比如在家里面用支持语音的智能电视看电视的时候,要不停地通过唤醒输出指令。
第二个问题是机器人不关注人的情绪,经过试验我们发现当人交互的对象越接近于人的时候,人类越倾向于输出情绪和情感。比如人类会跟语音系统说你怎么这么笨,但是不会跟影子、茶杯这么说。人类有六种基本情绪,27种丰富情感,但是目前无论你有怎样的情绪,他不会在意你的情绪。
第三个问题是目前机器人依然不够主动。经过调研发现有85%的用户对机器人的主动交流有明确的期待,但目前机器人连怎样主动交流不知道。这三个问题使得用户逐步丧失了对机器人的信心,使得机器人不再具有很强的吸引力,这种情况下一定要重构机器人人机交互体验。所以今天跟大家介绍机器人自然情感任意交互模型。
Frequency Percent(%)
非常不需要 73 6
比较不需要 109 9
一般 393 32.5
比较需要 347 28.7
非常需要 287 23.7
Total 1209 100
表一:85%的用户对主动交流有期盼
自然情感语音交互模型
机器人自然语音交互模型是机器人使用传统的语音的原创交互模型,它具备三个维度:
第一个维度是唤醒。服务机器人与人进行交互的时候,大部分场景是镜像交互。所以我们设计了新的进场模型,第一个节点是距离检测,第二个节点是人脸锁定,第三个节点是唇动检测:检测到用户正在与机器人对话时,会自动开启语音交互的流程。


图二:近远场的唤醒检测方式
第二个维度用户的情绪应对模型,人机交互发展几十年里,机器人的IQ取得了巨大的进步,而机器人的EQ一直没有得到发展,而情感是人类的刚需。当两个产品的IQ差不多时,一个更具情商的产品一定是更具市场竞争力的。机器人的EQ包含两个部分,一部分情绪的识别,一部分情绪的应对。关于情绪的识别,我们用东方人的情绪面部数据进行训练的适合东方人的情感识别系统。比如你很开心的跟智能音箱说给我放一首歌和很悲伤的说跟我放一首歌结果应该是不一样的。
在附带情绪任务的悲伤场景下,机器人回馈的语音语调应该是具有同样的悲伤的情绪,而策略应该是先完成任务后安抚情绪。在负向情绪的化解这个维度,语音语调也是悲伤,但是策略是先安抚再引导任务。通过这种方式,我们能够使得机器从不关心人类的主观情感变成对每一种情感都有个性化应对方式,这种策略可以赋予机器情商。

图三:赋予机器情商的方式
第三个维度是机器人的主动交流模型,主动交流的难度在三点。1. 要根据场景,语气程度和会话形式,而什么场景下机器要主动交流,并且不侵犯用户的隐私。主动交流到什么程度也是一个值得考虑的问题,过分主动的机器人往往会给用户造成干扰,而完全不主动的机器人,通常让用户觉得不够智能。通过试验发现家庭场景中更适合主动交流,而公共办公场景下会不一样,所以主动交流的程度是和用户的注意力承负相关关系。并且表达方式和场景有密切的关系,所以每个场景下主动交流的方式是不一样的。

图四:主动交流的程度是和用户的注意力承负相关关系
通过一系列的设计我们可以为机器由被动接受指令到主动交流指名一个方向。在百度的NIRO(Nature Language · Initiative Interaction · Emotion Reflection · Origin Models)中每个模型分为三个层次,人类情景包括识别层、策略层和表现层,机器人主动交流模型包括输入层、策略性和主动层。服务机器人另外一个在行业内重大的问题是怎样让服务机器人低成本的进入到广域智能,机器人的生存环境是人类的生存环境。比如打开一个门,进入并操作一个电梯,清理一个障碍物对人类很容易,但是对机器人非常难。目前的解决方案把大厦里每一个门换成电动的门,一扇电动门可以跟机器人系统进行数字交互。若想让机器人清理障碍物,需要给机器人安装昂贵的机械手臂,这些情景都阻止了机器人向真正的广域场景和大规模的应用。那我们的解决方式是什么?我们的答案最佳方式是协同智能。
协同智能
协同智能的时代是非常美好的,在未来机器低成本的,利用NIRO人机交互的设备,可以让机器人产品快速进入智能时代。在科技发展每一个阶段,都会出现一些代表性的产品,比如PC可以作为游戏机、打字机,比如手机可以作为指南针、MP3、照相机,而在人工智能时代我们认为这个产品是机器人。机器人与前者们出现的逻辑极其相似,都是以技术为基础,并且通过技术设计人机交互模型,将人机交互模型应用到更多产品。比如说应用了触屏的技术,打造了交互模型,将交互模型应用到平板电脑、手机、桌面型的设备才造成移动端的繁重。人机交互模型的设计需要不仅仅是技术,还有创意,现在AI技术有了大的技术的提升,这部分更需要创意和技术融合在一起。

图五:Niro可以给机器赋能协同智能
----实录结束----

李士岩
百度AI交互设计院体验架构师。曾主导百度智能路由器、百度智能家居操作系统、Duwear智能手表人机交互系统、Jarvis智能语音管家等产品的人机交互设计,拥有多个世界和中国发明、外观专利。2017年加入百度AI交互设计院从事交互模型的创新、标准制定等工作。

转载于:https://blog.51cto.com/13970240/2292333

人机交互,加速机器人拟人化相关推荐

  1. 用 Kubernetes 系统加速机器人应用开发

    用 Kubernetes 系统加速机器人应用开发 | Accelerating Robot Application Development with Kubernetes - Chunxu Hu, J ...

  2. 网络化沟通及协作的人机交互编程语言-机器人语言2

    对这于这编程语言,要把概念理清也不是件很容易的事情,先是想到叫云语言,就是一种可以聚合工作,社交,人机交互的语言,但是感觉不太明确,百度下有个云语言的百科,是个假大空的东西. 又考虑叫微语言,象是微博 ...

  3. “机器人迟钝一点,会更有人情味”,迪士尼提出新型人机交互系统

    来源:机器人大讲堂 导读 打篮球时,当球向你飞来,你总会下意识地或者说有意识地伸手去接住球.生活中,有人递给你一个东西时,你也会伸手去接住,礼貌或者仓促地.那么在如今拟人机器人越发"聪明&q ...

  4. 再聊机器人设计:如何加速开发流程?

     01 一套机械臂系统引发的思考  想让机器人与人类配合无间,或许是机器人领域里最难做的事了. 近日,来自加拿大舍布鲁克大学的研究人员开发出了一种固定在腰间的机械臂系统,它可以帮助你完成多种任务. 包 ...

  5. Sami Haddadin:研发「会痛」机器人,让人机交互更安全|42问AI与机器人未来

    42个AI与机器人大问题之-- 「要创造现代版阿西莫夫机器人定律吗?」 本届大会由腾讯 AI Lab 携手Nature Research(自然科研)及旗下<自然-机器智能>.<自然- ...

  6. ROS1中Gazebo案例都有哪些机器人呢(Noetic2022)

    indigo/kinetic/melodic所支持的ROS机器人也非常多,数百种.如下只列出ROS1Noetic官方支持的.其他之前版本,通过源码改写都支持ROS1. ROS2需要专用定制包,与ROS ...

  7. 真·人机合一!MIT推出人形机器人“爱马仕”,远程遥控操作救援

    大数据文摘出品 编译:王缘缘.李雷.宋欣仪 你是不是也做过机动战士高达梦,幻想过将人类意识植入机器? 麻省理工学院近日推出了人形机器人Hermes,它可以通过遥控操作实现灵活移动. 研究人员希望它可以 ...

  8. 机器人4.0时代来临!四大核心技术助推大规模商用部署

    来源:北京物联网智能技术应用协会 当前,全球机器人市场规模持续扩大,工业机器人市场增速稳定,服务机器人增速突出.2018 年,全球机器人市场规模达 298.2 亿美元, 2013-2018 年的平均增 ...

  9. 基于自学习的机器人决策系统(达闼科技赵开勇)

    2020年9月25-26日,2020年中国科技峰会系列活动青年科学家沙龙将迎来新的一期-"人工智能学术生态与产业创新".本次活动由中国科学技术协会主办,清华大学计算机系.AI TI ...

最新文章

  1. iOS UITableView的方法解析
  2. IdentityServer4 配置负载均衡
  3. 从flink-example分析flink组件(3)WordCount 流式实战及源码分析
  4. Spring Security实现登录权限控制,记住我等功能
  5. 从一个案例看系统优化
  6. VerifyRenderingInServerForm 和EnableEventValidation引发的两个问题
  7. 前端学习(2673):vite
  8. js string转number_【虚拟机系列】JS虚拟机——实现setTimeout
  9. C++基础--static的用法
  10. 4、python简单线性回归代码案例(完整)_Python:简单线性回归(不需要调用任何库,math都不要)...
  11. 短信接口——阿里云短信接口
  12. recy拖动item
  13. H3C光模块专题笔记
  14. matlab信道容量函数,信息论-matlab求信道容量(迭代法)
  15. 中国地质大学英语语音学习笔记(四):英语连读——弱读、冠词连读方法(包括元音字母前添加an的原因)和词间辅音加元音的连读方法
  16. 深度操作系统20.7正式发布
  17. 2021-基于深度学习的人脸检测综述文献-摘要
  18. 数据库 SQL Server 检测到基于一致性的逻辑 I/O 错误 页撕裂 执行 读取 期间,发生了该错误 恢复
  19. 快来看,这些心理学家与诺贝尔奖有关系
  20. 计算机视觉 图像形成 几何图形和变换 3D变换

热门文章

  1. 《Pro ASP.NET MVC 3 Framework》学习笔记之一【MVC的历程,优点,HelloWorld】
  2. linux磁盘格式化
  3. [转]XHTML+CSS兼容性解决方案小集
  4. Object Detection: Face Detection using Haar Cascades
  5. 《SaaS架构设计》试读:前 言
  6. UE4: 学习虚幻引擎4的16条准则
  7. win7桌面便签。自带的
  8. linux之netstat与lsof
  9. windows做ntp server,linux做ntp client端的配置方法
  10. 2010-04-01 4over6tunnel配置——折腾了一天