语音是HoloLens三大重要输入形式之一。它允许你直接通过语言控制全息图像,而不用借助手势。你只要凝视全息图像然后说出语音命令即可。语音输入是自然的交互方式,它能够很好的改善复杂的交互,因为通过一条语音命令即可以减少很多复杂的UI菜单。

HoloLens语音输入是由同UWP应用一样的语音识别引擎支持。

选中命令 The "select" command


即使没有特地为应用添加语音命令特性,用户还是能够通过说:“select”来简单地激活你的全息图像。这个行为和用手或点击器点击类似。你将会听到一声提示音,同时会看到一条提示:“Select”,用以确认你的语音指令。“Select”命令是由低功耗关键词识别算法来保证的,所以任何时候你都能使用它,这只会带来极低的电量生命周期影响。

激活Cortana Hey Cortana


任何时候你都可以通过说:"Hey Cortana"来激活它,并且不用等待它出现,即可继续问它问题或给出指令。关于Cortana的更多信息和你能做什么,你直接询问它即可。可以说:"Hey Cortana, What Can I Say?",然后它会更出作业和推荐的语音命令列表。如果你已经进入Cortana应用,点击 ? 按钮同样可以获得提示列表。

HoloLens特定语音命令 HoloLens-specific commands

  • Go Home - 唤出开始菜单
  • Launch <应用名> - 打开应用
  • Take a picture
  • Start recording
  • Stop record
  • Increase the brightness
  • Decrease the brightness
  • Increase the volume
  • Decrease the volume
  • Shut down the device
  • Restart the device
  • Reboot the device
  • Go to sleep
  • What time is it?
  • What is my IP address?
  • Am I connected to the network?
  • Are you listening?
  • How much battery do I have left?
  • Call <联系人> - 需要安装HoloSkype
  • Web search

"See It, Say It"模式


对于语音输入,HoloLens有一个"See It, Say It"模式,在此模式内按钮上会出现文本提示来告诉用户应该使用什么语音命令来使用它。例如,我们看向一个2D应用,当我们看到Holobar上的Adjust按钮时,会出现文本提示框,此时我们直接说:"Adjust"命令即可调整应用在世界中的位置。

当应用遵循此规则时,用户可以很容易地明白应该说什么命令来控制系统。为了加强此特性,当用户凝视按钮时,你可以显示一个语音命令提示栏,来使用户明白此按钮支持语音输入同时明白应该说什么指令。

语音转文字 Dictation


和通过点击手势输入一样,语音听写能够更有效地在应用中输入文本。这能更好地加快用户输入,以减少输入对用户体验的影响。

任何时候全息键盘激活后,你都能将输入模式切换到听写模式。可以通过点击文本输入框左边的麦克风按钮来开始听写操作。

通信 Communication


对于那些想要使用HoloLens自定义语音输入处理选项的应用来讲,理解音频流类别(audio stream categories)很重要。Windows 10支持数种音频流类别,同时为了优化为语音输入、通信和其他辅助周边环境音频捕获场景量身定制的麦克风音频质量,HoloLens支持其中3种类别来保证自定义音频处理。

  • AudioCategory_Communications流类别被自定义用于通话质量和叙述场景,提供给客户端用户声音的16kHz 24位单声道音频流.
  • AudioCategory_Speech流类别被定制用于HoloLens(Windows)语音识别引擎,提供它们 16kHz 24位单声道用户音频流。如果需要的话,此流类别亦可用于第三方语音识别引擎。
  • AudioCategory_Other流类别被定制用于周边环境声音录制,提供给客户端 48kHz 24位立体声音频流。

所有的音频处理都通过硬件加速,这意味着此特性会大大降低电池消耗,如果与CPU处理同样音频作业相比的话。通过避免在CPU上处理其他音频输入进程,可以最大化系统电池生命周期,同时能够利用上内置的音频处理作业。

问题诊断 Troubleshooting


如果你在使用"select"和"Hey Cortana"语音命令中遇到任何问题,请尝试移动到安静的空间,远离噪音来源,或者尝试大声说话。此时,HoloLens上所有的语音识别都将特地为美式英语调整和优化。

HoloLens开发手记 - 语音输入 Voice input相关推荐

  1. HoloLens开发手记 - 手势输入 Gesture input

    手势是HoloLens三个首要输入形式之一.一旦你使用凝视定位了一个全息图像,手势允许你与它交互.手势输入允许你使用手或者点击器原生地与全息图像交互. 手势之外,你也可以在应用中使用语音输入来交互. ...

  2. HoloLens开发手记-硬件细节 Hardware Detail

    微软HoloLens是世界第一款完全无线缆的全息计算机.通过在新方式上赋予用户的全息体验,HoloLens重新定义了个人计算(Personal Computing).为了将3D全息图形固定到你周围的真 ...

  3. HoloLens开发手记-全息Hologram

    全息 Hologram HoloLens使我们可以通过周边世界的光线和声音来创建全息场景和物体,使得它们像真实物体那样.全息场景能够响应你的凝视.手势和语音指令,同时还会和你周边世界的表面交互.借助全 ...

  4. HoloLens开发手记 - HoloLens shell概述 HoloLens shell overview

    使用HoloLens时,shell是由你周围的世界和来自系统的全息图像构成.我们将这种空间成为混合世界(mixed world). shell包含了一个可以让你将全息图像和应用放置在世界中的开始菜单( ...

  5. HoloLens开发手记-配置开发环境 Install the tools

    随着Build 2016开发者大会的结束,HoloLens开发包也正式开放下载.Hololens没有独立的SDK,开发特性被集成到最新的Visual Studio Update 2中.如果你没有Hol ...

  6. HoloLens开发手记 - Unity development overview 使用Unity开发概述

    Unity Technical Preview for HoloLens最新发行版为:Beta 24,发布于 09/07/2016 开始使用Unity开发HoloLens应用之前,确保你已经安装好了必 ...

  7. HoloLens开发手记 - 使用HoloLens模拟器 Using HoloLens emulator

    首先下载HoloLens模拟器 HoloLens模拟器运行在没有真机的情况下在你的PC上测试应用,属于HoloLens开发工具系列.模拟器使用了Hyper-V虚拟机.通常通过传感器获取的人体和环境输入 ...

  8. HoloLens开发手记-凝视 Gaze

    凝视 Gaze 在全息应用中,凝视是第一种输入形式,被用于定位物体(功能和PC的光标指针类似).凝视告诉你用户正在看向世界中的位置,让你能够确定他们的意图.在现实世界中,你通常会盯着你打算与之交互的物 ...

  9. HoloLens开发手记 - 空间映射(SpatialMapping)

    空间映射提供了HoloLens周围环境中真实世界表面的详细表示,允许开发人员创建令人信服的混合现实体验.通过将真实世界与虚拟世界合并,应用可以使全息图看起来是真实的.通过提供熟悉的现实世界行为和交互, ...

最新文章

  1. server sql 数据c盘迁移d盘_oracle 11g dbf数据文件从C盘迁移到D盘
  2. java transient关键字_小伙子,你真的搞懂 transient 关键字了吗?
  3. 怎样才能使二级网页窗口最大化
  4. 面向对象的特点封装、继承、多态
  5. (chap2 TCP/IP基础知识) TCP/IP协议分层模型
  6. CodeForces - 859C Pie Rules(dp+博弈)
  7. 19年8月 字母哥 第一章 spring boot 2.x基础及概念入门 这里全部看完了 热部署没出来 第二章在前面2页 用热点公司网不行
  8. arXiv与文献调研神器Connected Papers强强联合
  9. 进入多个页签_俄罗斯学生落地签如何办理?
  10. 人类自然语音频率范围
  11. 一步一步SharePoint 2007之十九:解决实现注册用户后,自动具备访问网站的权限的问题(1)——配置Provider...
  12. 俄亥俄州立大学计算机专业排名,俄亥俄州立大学计算机工程专业大学排名
  13. 如何解决Harbor的502问题
  14. (轉貼) 完全用Linux工作,摈弃Windows (OS) (Linux)
  15. 如何给excel的单元格添加斜线并在对角线
  16. 微信的转账记录删除了还能恢复吗?2个办法教你找回
  17. 2022 CCF中国软件大会(CCF ChinaSoft)“CCF-华为胡杨林基金-软件工程专项”论坛成功召开...
  18. Altera timing analyzer理解
  19. 不得了了!刚刚腾讯官宣 Python 开发人才这样选
  20. 信息化领导小组关于我国电子政务建设指导意见

热门文章

  1. SAP HUM 锁住一个HU?
  2. Caffe 运行平台支持DenseNet模型
  3. 阿里发布2019十大科技趋势:AI依然最热
  4. 吴恩达机器学习笔记 —— 8 正则化
  5. SAP LSMW 因物料描述里有换行符或者引号导致数据导入失败
  6. SAP MM Return Purchase Order之使用
  7. Python 之 Pandas (一)介绍
  8. 如何下载指定版本的torchtext
  9. 登顶Nature | DeepMind用AI首次实现数学领域重大进展,助力科学家证实两大猜想
  10. 当法律纽带变成“机器红线”,能让自动驾驶汽车更安全吗?