苹果今天在Apple Park以线上直播的形式举行“秋季发布会下半场”。除了备受关注的iPhone 12系列以外,阔别已久的HomePod产品线新品HomePod Mini不期而至。对于苹果来说,这款产品既是一次回归,同时也是一次新征途。

苹果入门级智能音箱,新增声纹识别功能
HomePod mini相较于初代HomePod,它的重量减轻了7倍有余,重量已经不足一斤(345g),并且售价也仅有上一代的零头——99美元(HomePod现在官网售价为299美元)。颜色选择,包括白色和太空灰。

音乐服务方面,除了Apple Music和Podcast之外,目前的第三方音乐服务仅支持Pandora。

值得关注的是,HomePod mini支持声纹识别,能根据声纹判断不同用户,做出相对应的回应。比如,当用户询问今日日程的时候,它会根据询问者的声音,回答当前询问者的日程安排。这是苹果在该系列产品的全新尝试。

苹果还在发布会上展示了许多使用HomePod mini的场景,例如把它当做语音留言板使用——接入了同一家庭网络的用户,可以通过自己的iPhone,收听HomePod mini上记录的留言。如果用户向HomePod mini询问出行路线,它会把地图导航数据推送到支持CarPlay的车辆里。

一如既往地强调隐私与书记安全,苹果表示dHomePod mini的使用信息不会与AppleID相绑定。对隐私十分敏感的用户,甚至可以不与苹果共享语音数据。

苹果声纹的新尝试,是噱头还是真需求?
声纹识别是苹果HomePod mini的新尝试,究其原因,是用户体验的提升,也是行业发展的必然趋势。

在智能家居领域,语音识别已经充分的体现了自己的价值,但在实际使用场景中,仍旧会有瑕疵。以智能音箱为例,为了更好的进行定位、捕捉声音、以及降低无关噪音的影响,开发者们会采用多麦克风的形式。然而,一旦处于人声鼎沸的环境之中,智能音响的语音识别系统极有可能“罢工”,因为它很难从众多声音中准确的识别出下命令的用户。

针对这种情况,声纹识别就是一个行之有效的解决方式。

例如,若一位家庭成员呼唤音箱打开自己房间的灯,语音控制系统就能通过声纹识别技术确认说话人的身份,从而准确的打开说话人房间的灯。由此,不论是从众多人声中准确辨认用户,还是确认说话人的身份,声纹识别都能让用户体验进一步的提升。

此外,声纹识别的价值还体现在提高安全指数上。

缺少声纹识别功能的智能音箱,由于不能确认说话人的身份,只要条件允许,当非用户下达命令之时,语音控制系统也有很大可能会执行。举个例子,有人非法入侵住宅,若语音控制系统不限制说话人的身份,纵然有智能监控系统,但闯入者完全可以直接下命令关闭监控系统,得到住宅的临时控制权。

而当搭载声纹识别技术后,基于声纹的独特性,在不能识别出闯入者身份的前提下,语音控制系统会进行报警等一系列安防措施。这一性能也可以在门禁上得到充分应用,例如声纹识别企业快商通在2019年发布具备声纹识别能力的智能门禁,该产品在声纹识别与人脸识别技术的加持下,由说话人声纹特征和人脸特征的稳定性与唯一性组成双重身份认证,显然更加的安全可靠。

声纹识别备受青睐,落地应用仍有“困扰”
就目前而言,声纹识别想在智能家居领域真正落地,还面临一些难题:

首先是声纹识别技术的研究,声纹识别是一项尖端前沿技术,需要攻克跨信道识别、环境自适应及超短语音等技术挑战。纵观全球,能够规模化商业落地的声纹识别企业不过等寥寥数家。因此相关技术的研究,急需从人才以及产学研融合来解决。所幸声纹识别在国家政策与业界需求的推动下,受到多方重视:公安部发布检测标准;西南政法大学刑事侦查学院与快商通探讨共建“司法语音技术联合实验室。

声纹识别落地的另一难点,是声纹的采集。 不论是人工识别,还是依靠深度学习算法进行自动化识别,声纹库的建立都是进行一切行动的前提。当前国内,拥有公安部认证采集资质的声纹识别厂商少之又少,国内首家通过公安部标准测试的企业快商通,是在2019年完成的,随后其他声纹企业陆续通过。

除了上述两点问题,声纹识别技术应用的安全性稳定性同样不容轻视。声音冒用、声音盗用、声音伪装等行为,会对个人身份信息安全造成威胁,是声纹识别技术落地智能家居必须要解决的难题。

魔高一尺道高一丈,国内声纹识别技术企业通过长期的攻坚克难,已能有效实现技术应用的抗干扰和防攻击能力。以快商通为例,其声纹识别系统能正确区分真实和伪造的生物信息,防范录音攻击、合成语音攻击以及拼接语音攻击;具备在复杂环境下的抗干扰能力,即环境噪音和群体噪音下仍可达到声纹识别能力。

正如当前人们所言,在语音识别之后,声纹识别成了智能家居的又一个关注点。相对于其他生物识别技术而言,声纹识别在安全性方面的唯一性,表现很凸出,轻易无法模仿。在遇到智能家居之后,声纹识别在安全性与个性化交互的价值,更加被充分的挖掘出来。

不过值得注意的是,智能家居的使用习惯和声纹识别的技术仍处于成长阶段,所谓的智能还不完善,万物互联也尚未成为体系。用户体验和产品背后的内容及功能,往往更容易挑逗智能家居用户的购买需求。

声纹识别加持,苹果HomePod Mini能否“声”而不同?相关推荐

  1. android声纹识别技术,基于Android平台的声纹识别系统的研究与实现

    摘要: 社会的发展越来越快,计算机技术的应用也愈来愈广,已经渗透到生活的各个方面.在快节奏.信息化的时代,需要识别和交互的应用日益广泛,要求验证身份的场合越来越多,迅速判定一个人的身份是一个非常重要的 ...

  2. 语音识别已成红海,声纹识别正成为AI领域新热点

    https://m.jiemian.com/article/2875117_toutiao.html 相比视觉和语音识别,声纹识别是一个技术门槛相对更高的领域. 记者 | 饶文怡 过去几年有不少人工智 ...

  3. 基于Tensorflow实现声纹识别

    前言 本章介绍如何使用Tensorflow实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章<基于Tensorflow实现声音分类>.基于这个知识基础之上,我们训练 ...

  4. 声纹识别开源框架python_GitHub - yeyupiaoling/VoiceprintRecognition-Tensorflow: 使用Tensorflow实现声纹识别,博客地址:...

    前言 本章介绍如何使用Tensorflow实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章<基于Tensorflow实现声音分类>.基于这个知识基础之上,我们训练 ...

  5. 使用Tensorflow实现声纹识别

    原文博客:Doi技术团队 链接地址:https://blog.doiduoyi.com/authors/1584446358138 初心:记录优秀的Doi技术团队学习经历 本文链接:使用Tensorf ...

  6. 声纹识别(说话人识别)技术

    说话人识别(Speaker Recognition,SR),又称声纹识别(Voiceprint Recognition,VPR),顾名思义,即通过声音来识别出来"谁在说话",是根据 ...

  7. 说话人识别(声纹识别)综述

    目录 声纹识别背景介绍 声纹识别组成 数据 特征 模型 评价指标 声纹识别目前的挑战 参考文献 声纹识别背景介绍 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术.在现实生活中声纹识别的 ...

  8. 声纹识别(一)——简介

    ​一.基本概念 声纹识别也称为说话人识别,是指根据说话人语音中个性化的特征自动识别说话人身份的一种生物识别技术.说话人的声音特征不仅与其肺部.气管.喉部.声带.咽部.鼻腔.口腔.唇部等人体发声器官相关 ...

  9. 知物由学 | 听声辨人,看声纹识别技术如何保障内容安全?

    大家对"指纹"并不陌生,但听说过"声纹"吗? "违法犯罪变得越来越困难了.如今罪犯都没法使用电话了,因为侦探们可以通过他们在话筒上留下的声纹来追踪他. ...

最新文章

  1. Stuart Russell:智能本质和人工智能安全的巨大挑战
  2. margin-top的百分比是相对父元素的哪个值
  3. 青少年蓝桥杯_2020_steam考试_初级组_第三题
  4. [SCOI2008] 奖励关
  5. (零)音视频技术基础知识,现实项目
  6. Unit Three-Program test
  7. Advanced C++ -- Logic Constness and Bitwise Constness
  8. 【c语言数据结构笔记】1.2 数据结构
  9. 对应sql建表_图解SQL面试题:如何查找工资前三高的员工
  10. 从直播CDN的原理说起,谈如何解决延时和连麦的老难题?
  11. 40.服务器搭建准备
  12. “运行”窗口命令大全
  13. 数据结构:关于链表直接free(p)会不会造成断链
  14. EasyFlash 里的 EF_WRITE_GRAN
  15. Wi-Fi Sigma测试系统
  16. 2019年安徽大学ACM/ICPC实验室新生赛题解
  17. SD 格式化錯誤提示Windows無法完成格式化
  18. log4j日志输出性能优化-缓存、异步
  19. java变量_Java变量
  20. 关于 python 的 IDE

热门文章

  1. 模电学习笔记(九)——仪表放大器
  2. 2019-9月份末论文: Break it down into text and timbre and accent factors, 主要为了跨语言voice clone
  3. 计算几何——快速排斥实验和跨立实验
  4. java 逻辑运算符(韩顺平)
  5. ODPS到ADS数据迁移指南
  6. linux crontab scrapy,python3 scrapy+Crontab部署过程
  7. 磁盘rejecting I/O to offline device故障导致4TB生产数据库无法访问
  8. 编程难在哪里? 一个美国实习生的故事。(转自刘欣老师的微信公众号——码农翻身)
  9. 【数学分析】闭区间套定理及其证明
  10. LibQQt系列之十四《v2.3》