文章来源:ATYUN AI平台

亚马逊推出了一系列功能,这些功能将通过其Alexa语音平台推向新的和现有的智能扬声器。其中一个是“耳语模式”,这使得Alexa能够通过耳语来回应低声说话。在今天发表的博客文章中,亚马逊Alexa语音系统专家Zeynab Raeesy透露了该功能的AI基础。

大部分工作都在一篇论文“基于LSTM的耳语检测”中详细介绍,该论文将于12月在IEEE口语技术研讨会上发表。

Raeesy表示,“如果你在一个孩子刚刚入睡的房间里,而其他人走进来,你可能会低声说话,表明你正试图让房间保持安静。另一个人也可能开始低语,我们希望Alexa以这种自然,直观的方式对会话线索做出反应。”

Raeesy解释说,使低语言难以解释的原因在于它主要是清音,也就是说,它不涉及声带的振动。与普通语音相比,它在低频带中往往具有更少的能量。

她和同事研究了两种不同神经网络的使用,数学函数层在人脑的神经元之后松散地建模,以区分正常和低声的单词。

两个神经网络在架构上有所不同,一个是多层感知器(MLP),第二个是长期短期记忆(LSTM)网络,它按顺序处理输入,但是在相同的数据上训练。所述数据包括(1)对数滤波器组能量,或记录不同频率范围内的信号能量的语音信号的表示,以及(2)“利用”低声和正常语音之间的信号差异的一组特征。

在测试中,他们发现LSTM通常比MLP表现更好,具有许多优点。正如Raeesy所解释的那样,Alexa的语音识别引擎的其他组件完全依赖于日志滤波器组的能量,并且为不同的组件提供相同的输入数据使整个系统更加紧凑。

然而,这并非一帆风顺,至少在最初阶段。因为Alexa通过短暂的沉默(一种称为“结束指向”的技术)识别命令的结束或回复,LSTM的信心度在话语的尾端下降。为了解决这个问题,研究人员对整个话语的LSTM输出进行了平均分析,最后,丢弃最后1.25秒的语音数据对于保持性能至关重要。

耳语模式将于10月份以美国英语提供。

本文转自ATYUN人工智能媒体平台,原文链接:亚马逊Alexa即将推出基于AI的耳语模式

更多推荐

扩展高质量AI数据标记的基本技巧与提示

Bloomreach:为互联数字体验提供动力

AI分析两种语言变量以预测精神疾病,准确率达93%

开发者都应该了解的SOLID原则(上)

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

亚马逊Alexa即将推出基于AI的耳语模式相关推荐

  1. 微软演示亚马逊Alexa与微软小娜的合作项目,即将推出测试版本

    内容来源:ATYUN AI平台 Alexa和微软小娜的合作计划于去年夏天首次公开,根据亚马逊和微软的联合发布,双方最初计划于2017年底开始合作. 如今,5月7日至9日在西雅图举行的微软Build会议 ...

  2. AI一分钟 | 厉害了!英特尔正式发布电动飞行汽车;贝佐斯笑了,多家PC厂商结盟亚马逊Alexa,直怼微软Cortana

    一分钟AI 1. CES 2018 专题:英特尔正式发布电动飞行汽车Volocopter:华硕发布Chromebox 3,采用英特尔8代酷睿处理器:三星宣布2018年智能电视全部搭载智能助手Bixby ...

  3. 亚马逊Alexa的深度学习与语音识别的核心技术原理

    相关推荐 随着语音巨头抢占语音入口,蓝牙设备智能化已成为下一波竞争的关键,而身处其中的无线蓝牙耳机正披着"智能... 发表于 2018-04-04 10:34 • 37次阅读 训练数据来自于 ...

  4. 亚马逊Alexa占领CES,它的致胜法宝是什么? | 分析

    ▼ 点击上方蓝字 关注网易智能 聚焦AI,读懂下一个大时代! [网易智能讯 01月11日消息]围绕在我们身边的人工智能战争不再是与让你使用音响来控制其他相关设备,而是将基于云计算的人工大脑植入各种各样 ...

  5. 云栖科技评论第28期:高通宣布芯片内置亚马逊Alexa

    1.高通宣布芯片内置亚马逊Alexa 高通宣布芯片内置亚马逊Alexa [新闻摘要]高通宣布,旗下收购公司CSR的8670/8675芯片系列将内置亚马逊Alexa唤醒词支持.CSR蓝牙芯片占据业界高端 ...

  6. re:Invent大会第十年,亚马逊云科技推出了哪些底层自研技术

    编辑 | 宋慧 出品 | CSDN云计算 头图 | 付费下载于视觉中国 一转眼, 亚马逊云科技的云计算已经推出了十五年,亚马逊云科技的年度大会 re:Invent 也举办到了第十年. 今年 re:In ...

  7. 一周AI要闻 | 微软成市值第一 亚马逊推首款云AI芯片 阿里组织架构升级

    关注网易智能,聚焦AI大事件,读懂下一个大时代! 各位看官,周末愉快,智能菌为您梳理本周AI要闻. 01 公司新闻 [雷军:未来智能音箱可能成小众产品 小米AIoT这样来布局]11月28日-29日,2 ...

  8. 解构亚马逊Alexa的1.5万种技能

     解构亚马逊Alexa的1.5万种技能:三大派系.口碑落差,长尾死亡 本文作者:邹霖 2017-07-12 18:45 导语:上周,Voicebot 对外宣称 Alexa技能突破1.5万.那么这1 ...

  9. ofo抵押单车获17.7亿元融资;董明珠回应与雷军赌局;亚马逊Alexa全球性“罢工”丨价值早报

    第[880]期早报由[周一]赞助播出 01 今日头条 ofo拿到救命钱:抵押小黄车,向阿里借款17.7亿元 3月4日,有报道称,ofo创始人戴威已通过动产抵押的方式,先后两次将其资产共享单车作为质押物 ...

  10. 亚马逊在阿联酋推出知识产权加速器(IP Accelerator)计划

    亚马逊的卖家都知道,亚马逊平台一直很重视知识产品的保护,所以很多卖家在不了解的情况下,容易上架导致侵权的产品. 武汉星起航在网上获悉,10月12日消息,亚马逊在阿联酋推出了知识产权加速器(IP Acc ...

最新文章

  1. Vue.js——60分钟组件快速入门(上篇)
  2. leetcode 169. 多数元素(不同数相消解法)
  3. 分布式系统session一致性的问题
  4. 超强!MDETR:基于Transformer的端到端目标检测神器!开源!
  5. IQueryable接口与IEnumberable接口的区别
  6. 面试准备——Java回顾:基础编程(基本语法、面向对象、异常处理)
  7. Nginx: error while loading shared libraries: libpcre.so.1解决
  8. Java使用IntelliJ IDEA创建控制台程序并通过JDBC连接到数据库
  9. django web app_妹子用半天时间开发一个员工管理系统,没错django就是这么强悍
  10. 【GZH逸佳君】简约ppt模板-答辩ppt模板-毕业季ppt模板-说课ppt模板-ppt模板免费下载-ppt模板下载免费版
  11. SCRUM浅谈,User Story,Sprint,Burn Down Chart
  12. keil5选择ST-Link Debugger时候setting点击不了问题
  13. mysql的驱动_注册驱动MySQL的驱动程序
  14. aix 到 linux的网络,通过VIOS实现AIX系统的网络虚拟化
  15. 装机出现“我们检测到您的硬盘是GPT格式但未找到ESP分区”解决方法
  16. 如何一键查询名下所有银行卡?
  17. 耗时8个小时用纯HTML和CSS写成的学成在线
  18. Linux CreateRepo创建Repomd (xml-rpm-metadata)存储库
  19. 服务器dnf虚拟机多开吃显存吗,安卓模拟器多开对显卡有没有什么要求?
  20. OrangePIPC2---bootrom

热门文章

  1. LLC谐振变换器原理及变频控制
  2. Java中的偏向锁,轻量级锁, 重量级锁解析
  3. Android中连接MQTT服务器实现发布一个消息推送给订阅者(附代码下载)
  4. shell学习笔记:变量篇
  5. 想转行程序员,参加java培训班真的有用吗?
  6. 前端面试宝典React篇03 如何避免生命周期中的坑?
  7. Antelope与 Barracude MYSQL 文件格式
  8. ping的通百度但是浏览器打不开的解决方法
  9. 2020牛客暑期多校训练营(第九场)K-The Flee Plan of Groundhog
  10. iOS Swift之RxSwift初探