对比声控式交互、触控交互和视觉交互方式的优缺点如下表:

 

声控式交互

触控交互

视觉交互

优势

性能优异;

准确度高;

输入更高效;

感官和精力占用更少;

便利程度高;

学习成本低

不会导致公开环境下交互的心理负担;

技术应用范围广;

成本低;

稳定流畅;

学习成本低;

符合人的认知过程

用户体验更加自然、高效;

灵活性高;

传递的信息量大;

拓展交互显示与系统的功能范围

劣势

信息接收效率低,更适用于单向指令;

环境影响导致识别精度降低;

公开环境下语音交互具有心理负担

将人类与显示器上内容的交互限制在设备平面进行;

传递的信息量小;

输入较低效

有限的效率提升;

不符合人体工学;

触感缺失;

公开环境下视觉交互具有心理负担;

学习门槛较高

接下来对声控式交互手段进行详细阐释如下:

优势

首先,语音交互的准确率和性能优异。

  1. 性能优异。2010年,语音识别性能的些许进步引起了大家的注意,因为纽约时报报道了总体口令的错误率不到1%。虽然大多数对讲系统并未显示接近该水平的性能,但通过改进算法、增加运算和使用更大的训练数据库等联合手段,其性能仍在逐年提高。
  2. 准确度高。事实上在一项识别多个说话人同时说话的特殊任务中,语音识别系统能够表现出比真人更高的语音识别能力。准确度的提高意味着语音识别已经成为了解决复杂自然语言处理的有效前端,从而催生出一批崭新的界面程序。
  3. 输入更高效。研究结果表明,语音输入比键盘输入快3倍。如果你从解锁手机到设置闹钟需要两分钟,直接说一句话设置闹钟,可能只需要10秒钟。
  4. 感官和精力占用更少。一张嘴,将人的双手、眼睛从图形界面交互中解放出来,想象一下当你手握方向盘时,说一句话就直接接听电话、播放音乐,是无疑更方便也更安全。腾出来的感官,意味着可以并行处理其他任务,理论上有更高的效率。

其次,语音交互拥有克服现存“收缩桌面”式的移动UI固有缺陷的能力,主要通过从有声语言输入中精准地推断用户意图。

  1. 便利程度高。通常,执行单个触摸屏装置指令需要多个步骤,语音交互使用户的使用过程更加便利。例如,一个简单的银行转账事项需要用专门的移动应用程序来回切换十几个应用屏幕。在这样的背景下,语音识别(VR)和自然语言理解(NLU)代表了一个强大的自然控制机制,它可以穿过多重视觉层次、中间应用或网页。
  2. 传递的声学信息量大。自然语言的表达紧凑地对大量信息进行了编码,因此使用语音交互方式要比使用常规界面、横贯多层菜单结构更简单,且交互过程更加接近日常生活,交互方式更加自然。这些功能的实现能够创造一个新的UI——一个可以通过对话与用户互动并提供强大功能的虚拟助手(VA)。这种融入其他服务的方式有效地拓宽了传统界面应用使那些很难用点选式界面明确说明的指令在语音界面上容易表达的。
  3. 使用便利。在符合用户需求的条件下,还可以用其他方式减少一些步骤。用户甚至可以自然地对设备说出自己的需求而无需开启设备。在一种称为“无缝唤醒”的模式下,装置运用节能算法的数字信号处理器(DSP),能够持续地接收到重要事件的发生。
  4. 学习成本低。语音交互使得对语言的理解和对话、推理得以实现。这样能够在交互过程中解决高级任务,拓宽了交互程序的应用范围。而且语音交互比界面交互更自然,学习成本更低。

劣势

  1. 信息接收效率低,更适用于单向指令。语音输出是线性的,当别人说话时,你可能得等全部说完后才能理解,无法像文字一样可以跳过阅读;语音交互也会增加用户的记忆负担,尤其是面临多项选择并且选项内容较长时。因此,它无法同时输出很多内容,在接受信息和多选择交互时,视觉具有更大的优势,声音的效率不高。总结来讲,语音交互针对单向指令是更有效的,而双向交互不是很有效。
  2. 环境影响导致识别精度降低。实际上,语音交互的技术依然存在巨大挑战,还很难在复杂的环境和不确定的情景下,真实的理解用户的行为和意图。语音交互的可靠性随环境的变化会受到影响。例如,一个患上感冒的人有可能被错误的拒认而无法使用该语音识别系统。同时还有许多其它因素影响其准备性,比如说,声音样本的质量、情绪、背景噪音以及随着时间推移声音的变化等。
  3. 公开环境下语音交互具有心理负担。语音交互的心理障碍是用户不能预设和预先判断的。在同一情况下,不同的人可能会产生完全不同的行为和期望。这给设计者带来了很大的麻烦,也给用户带来了不确定性。从心理体验来看,没有多少人愿意对着机器说话,因为有可能会得到毫无感情甚至是错误的反应。另外,公共场合下使用语音交互常常使用户陷入可能给他人留下无礼印象的心理压力中。

人机交互-语音交互的优势和劣势相关推荐

  1. 人机交互-语音交互方法综述

    上图展示了智能语音的界面架构,从中可以看出,语音交互所涉及的技术模块有 4 个部分,如下图所示: 首先,通过应用自动语音识别技术听到用户说的话,然后应用自然语言理解来分析语句的含义,随后用自然语言生成 ...

  2. 语音交互有哪些优势与劣势?

    转载自公众号[谈人工智能],转载请联系授权 语音交互是指人与人.人与设备之间,通过自然语音进行信息传递的过程.人与人之间通过语音来传递信息.交流感情等等,其实就是一种最基本的人与人之间的语音交互. 为 ...

  3. 硬核干货,老曹解密“语音交互”背后的黑科技!

    点击▲关注 "中生代技术"   给公众号标星置顶 更多精彩技术内容 第一时间直达 第 6 期出席<大咖来了>直播栏目的嘉宾是百度 DuerOS 首席布道师曹洪伟,进行了 ...

  4. 揭秘“语音交互”背后的AI硬核黑科技!

    第 6 期出席<大咖来了>直播栏目的嘉宾是百度 DuerOS 首席布道师曹洪伟,进行了主题为<面向交互的人工智能>的分享. 主要讲解了语音交互中用到的 AI 技术,如 ASR. ...

  5. 超全面的语音交互知识总结:从原理、场景到趋势

    1. 什么是语音交互? 语音交互(VUI)指的是人类与设备通过自然语音进行信息的传递.一次完整的语音交互需要经历ASR→NLP→Skill→TTS的流程: (1)ASR 用于将声学语音进行分析,并得到 ...

  6. 面向NLP的AI产品方法论——寻找语音交互的业务场景

    本系列文字是一位创业者的投稿<面向NLP的AI产品方法论>,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第一篇. 这是一个创业者的复盘,主要内容分为两个部分. 一个创业者成长的心路 ...

  7. 车载人机交互语音android,手机与车机如何实现语音智能交互?

    上一代系统使用汽车内置功能来提供娱乐与信息系统,而下一代汽车信息娱乐系统的功能将源于驾车者的移动设备,如iPhone.iPad和其它智能手机及平板电脑.这是一个巨大的变化.信息时代,屏幕已成为信息输出 ...

  8. 假如把二维码类似的标签识别技术做成语音片段,优势劣势有哪些?

    假如把二维码类似的标签识别技术做成语音片段,优势劣势有哪些? 优势1:如果能把二维码信息转到人耳朵识别不到对人体无害的频率,那语音二维码的用户体验应该更高. 优势2:在o2o产业里以往的一个二维码只能 ...

  9. 智能语音交互中的人机交互场景分析改进

    文章目录 智能语音交互中的人机交互场景分析改进 智能语音交互中的人机交互场景分析改进 引言 1.1. 背景介绍 智能语音交互技术作为人工智能领域的重要分支之一,近年来取得了长足的发展.语音交互已经成为 ...

  10. 语音交互设计探究——以车载场景为例

    从Siri .Amazon echo Alexa.google home .小冰.国内的叮咚.天猫精灵.小爱同学以及各种你听说过的,没听说过的.然而,随着技术的进步,语音交互将运用到越来越多的场景: ...

最新文章

  1. 2016-08-29
  2. 用OpenCV实现图像的水平镜像(翻转)变换和竖直镜像(翻转)变换(垂直镜像变换)的源码
  3. 深度学习之线性回归模型
  4. 推荐两本旧书 recommend two CM books,which are not up-to-date
  5. Feature Map of Pytorch示例
  6. 简析Kubernetes八大重要特性
  7. iOS音频的后台播放总结(后台网络请求歌曲,Remote控制,锁屏封面,各种打断)...
  8. echarts可以去掉边距吗_又有近视又有散光怎么办?近视手术可以同时去掉吗?...
  9. Python编程题汇总(附答案)
  10. 【备忘】Android开发视频教程[共72课时] 视频下载
  11. 【第三方支付通道】第三方支付接口如何对接?
  12. pycharm备份还原
  13. 半导体随机存储器(random access memory)
  14. fastadmin-微信小程序实战课程:todolist项目文档(课件)整理汇总
  15. oppo云服务器怎么卸载,oppo手机小布助手卸载方法_oppo手机小布助手怎么卸载-硬件之家...
  16. python中label组件参数_Tkinter:Label组件
  17. html自动跳转加微信好友,底部固定div并跳转复制微信号添加好友
  18. 清除缓存-Ctrl+Shift+Delete
  19. 机器学习笔试精选 100 题
  20. 偏差,残差,方差在机器学习中的区别

热门文章

  1. js监听只读文本框_javascript 监听文本框输入
  2. 操作系统的基本类型、工作流程及其优缺点
  3. 幂运算的O(lgn)算法
  4. 获取某一天的开始时间
  5. openwrt网关服务器性能,单一ipv6地址做网关的三种方法之openwrt篇
  6. foobox 2.11(foobar2000 CUI配置)
  7. 小米、搜狗、TW等机器学习算法工程师面试总结
  8. IOS下,利用捏合手势实现图像缩放和显示
  9. 使用Word制作签名电子版
  10. html竖线分割符的特殊符号,网站标题用什么分隔符号