最近,苹果发布了一系列论文来阐释语音助手的重要工作机理,公开揭秘Siri,向业界贡献了自己在设计上的不同想法。

在第一篇论文中,苹果就语音助手中的多任务处理问题进行了阐释,它指出在Siri中,唤醒处理通常需要两个步骤:AI首先必须确定输入音频中的语音内容是否与触发短语的语音内容匹配(语音触发检测),然后必须确定说话者的语音是否与一个或多个注册用户的语音相匹配(说话者验证)。一般方法是将两项任务分别来处理,苹果则认为可以用一个神经网络模型同时解决两项任务,同时它表示,经过验证,该方法各方面性能可以达到预期。

在该论文中,研究人员给出了模型示例。他们在包含16000小时带注释样本的数据集中训练了基于两种思路下设计的模型,其中5000小时的音频带有语音标签,其余均只有扬声器标签。相比于一般训练模型去获取多个标签的思路,苹果通过将不同任务的训练数据进行级联来训练多个相关任务的模型。结果发现,在性能表现相同的情况下,苹果新提出的模型反而更适合应用,它能够在两个任务之间共享计算,大大节省了设备上的内存空间,同时计算时间或等待时间以及所消耗的电量/电池数量都将降低。

在另一篇论文中,苹果还介绍了多语言演讲场景的演讲者识别系统设计——知识图谱辅助听写系统决策。以声学子模型为例,它可以基于语音信号传输痕迹来进行预测,并且其上下文感知的预测组件考虑了各种交互上下文信号,其中上下文信号包含有关发出命令的条件信息、已安装的命令语言环境、当前选择的命令语言环境以及用户在发出请求之前是否切换命令语言环境的信息。

结果显示,这一设计的优势在于,它们可以在语音信号太短而无法通过声学模型产生可靠预测的情况下提供帮助。

此外,苹果还提出了一项补充研究,缓解错误触发问题,即忽略不适合语音助手(Siri)的语音。基于图结构设计AI模型的思路,研究人员提出了一种图神经网络(GNN),其中每个节点都与标签相连。结果显示,该模型减少了87%的错误触发。

【编辑推荐】

java可以编写siri_揭秘Siri,苹果发布论文阐释语音助手设计想法相关推荐

  1. 苹果宣布将把语音助手Siri整合到Apple Music服务中

    10月19日消息,据国外媒体报道,在周二举行的苹果发布会上,苹果宣布将把语音助手Siri整合到Apple Music服务中. 此外,该公司还将推出Apple Music Voice Plan套餐计划, ...

  2. 三分钟把ChatGPT接入Siri,让你的语音助手化身智能AI

    最近,各种各样使用ChatGPT的方式都出现了,但是有很多都需要在电脑操作,或者点击别人的各种各样的链接,而且有些可能还要魔法上网才能实现,这些都是稍微有点繁琐的. 那么,最方便的还是直接使用我们的手 ...

  3. java可以编写siri_打造Android的中文Siri语音助手(一)

    public class XiaoI { private String Webbot_Path = "http://webbot.xiaoi.com/engine/widget1007/we ...

  4. 电脑生成siri语音_Siri for Mac:苹果电脑也有语音助手

    今天,美国专利和商标局公布了苹果的一项长达92页的专利申请,描述了一种功能和复杂程度远远超过目前 Mac 听写功能的技术,这些功能介绍可以被简单的总结成 Siri for Mac.这项专利被称为&qu ...

  5. java 创建水果_java程序题:定义一个抽象类-水果,其中包括getWeight()方法,编写程序分别创建苹果、...

    java程序题:定义一个抽象类-水果,其中包括getWeight()方法,编写程序分别创建苹果. 关注:286  答案:3  信息版本:手机版 电脑版 解决时间 2021-01-17 06:08 提问 ...

  6. 小e和siri_语音助手大比拼:苹果Siri和华为小e

    2.3 实验的设备及环境 本实验对环境没有要求,为防止不同手机对实验结果的影响,选取一部iPhoneX与一部华为P20作为固定的实验设备. 图2 苹果智能语音助手Siri与华为小e产品界面比较 2.4 ...

  7. 小e和siri_小米的小爱,华为的小e,苹果的siri。哪款是你最满意的语音助手

    我最近使用的三款手机分别为小米,荣耀,和苹果.而我本身就是一个很喜欢使用语音助手的人,没事就会叫个Siri陪我聊天. 现在就分别来盘点一下这三款我又爱又恨的语音助手. 首先第一款Siri Siri是我 ...

  8. Google Cloud大规模宕机;中国正式进入 5G 商用元年!苹果发布SwiftUI |开发者周刊...

    CSDN开发者周刊:只为传递"有趣/有用"的开发者内容,点击订阅! 本周热门项目 苹果发布SwiftUI(戳标题查看完整内容) 苹果在 WWDC 上发布了全新的 UI 框架--Sw ...

  9. 苹果发布黄色版 iPhone 14,定价 5999 元起;大神李沐被曝离职投身大模型创业;Atlassian 裁员 |极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

最新文章

  1. 4安装-企业级 Hyper-v 群集部署实验方案
  2. 蚂蚁金服11.11:支付宝和蚂蚁花呗的技术架构及实践
  3. linux 性能监视命令
  4. tensorflow 转张量类型为float_5个简单的步骤掌握Tensorflow的Tensor
  5. 区块链概念——学习笔记
  6. go 依赖注入 哪个好_go与java的依赖注入实现的一些差异
  7. Linux中ftp密码输错无响应,psftp登陆输入正确用户名和密码后无响应解决办法
  8. 【免费毕设】ASP.NET通用作业批改系统设计(源代码+lunwen)
  9. python和java的区别-Python和Java的区别有哪些?如何选择?
  10. testng 忽略测试_TestNG忽略或禁用测试
  11. C语言:编写一个程序,建立一个abc.txt文本文件,向其中写入“this is a test”,然后显示该字符串
  12. PHP通过传递对象参数调用asp.net Webservice 服务
  13. python标准输出sys.stdout_使Python中的函数标准输出静音,而不会破坏sys.stdout并恢复每个函数调用...
  14. 【Linux安全审计机制模块总体描述】
  15. 时间管理--番茄工作法
  16. Win8 无法连接打网络打印机(HP LaserJ1010)
  17. CUDA+Pycharm-gpu版本+Anaconda安装
  18. java爬空教室_Java实现模拟登录正方教务抓取成绩、课表、空教室信息
  19. 读《Machine Learning in Action》的感想
  20. “创业吃过饼,国企养过老,android开发零基础

热门文章

  1. Word2016中安装MathType6.9
  2. JS纯前端实现audio音频剪裁剪切复制播放与上传
  3. 怎么找回回收站里已经删除的文件
  4. 体育生可以学计算机吗,音乐体育计算机必修课 学生都可“私人订制”
  5. 贪婪算法——十大算法
  6. 一年了.......
  7. 操作简单的pdf转word转换器
  8. webgl1到webgl2_30个令人惊叹的WebGL实验!
  9. 怎么使用在线PS对图片换背景 如何快速抠图
  10. 网络负载平衡集群NLB的搭建