文章来源:ATYUN AI平台

7月26日,小米新品发布会如期而至,小米联合创始人王川在现场感谢了每一个合作伙伴,其中特别提到了声智科技(SoundAI)。为了让智能音箱反应更快、听得更准,把体验做到最佳,声智科技为小米提供了领先的麦克风阵列和唤醒技术方案,在硬件与算法上提供了双重支持。

硬件部分,小米音箱采用了声智科技环形6麦阵列,拥有全方向唤醒、声源定向、定向拾音、噪声抑制、混响消除等功能,能满足用户在语音交互领域的全部需求。

双名唤醒(Dual-wake),即唤醒词不再是单一的一个,音箱可以拥有两个名字,使用任意一个名字都可以将其唤醒并进行无差别的操作。如用户叫“小爱同学”或者是“小米电视”都可以将音箱唤醒。这样的设计与改进对于智能音箱的功能拓展与实现智能家电之间的联动是一个良好的开始。

任意打断(Free-cut),该技术可以让音箱任意时刻立即响应新的唤醒,并终止当前任务、执行新的任务,实现连续重复唤醒,而无需等待机器间隔,随叫随应,与人类习惯完全相同。同时该技术也优化了任务执行中设备的唤醒效果,比如大音量播放音乐时,用户也能成功唤醒音箱。

一句连控(One-shot),采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间无缝对接,用户叫了设备的名字后无需等待设备应答就可以直接说出命令。

成立仅一年多,备受青睐

声智科技此前就曾与360合作共同推出大小水滴摄像头、儿童故事机等,还与国外ARM、NVIDIA、Xilinx、Rockchip、Cypress等公司建立合作关系。不久前,公司携手百度,推出了基于DuerOS的一体化远场语音交互解决方案。如今助力小米推出智能音箱,声智科技可谓是乘风破浪,披荆斩棘。

2016年4月,当时的语音交互之争只是初见端倪,出身于中科院声学所的声智科技团队仔细的评估了未来语音交互行业的发展前景,并结合自身的技术优势,不断的对声智科技的技术方案、算法产品做深入的优化调整,主打声学感知技术与人工智能技术的融合,在AI时代最大程度发挥其人工智能交互方面的所长。

5米外识别语音命令,麦克风不再是简单的收音工具

在声学技术方面,声智科技提供从芯片、模组、OS到云服务的一系列交互解决方案,行业领先的技术,例如回声抵消、噪声抑制、声源定位等,使麦克风不再是一个简单的收音工具。人们不需要贴近设备就能与之交流,通过麦克风阵列前端处理法,对目标说话人的声音进行远场增强并匹配远场语音识别,使得即使距离麦克风5米远仍能准确识别语音命令。

专注硬科技,语音交互重构消费电子

声学算法通常需要横跨两个领域,既要用到Computer Science中的各种算法(比如唤醒的实现),也要在实验室中反复的测试打磨。也正因此,这个领域才特别需要一些像声智科技这样的硬科技公司。

本文转自ATYUN人工智能媒体平台,原文链接:声智科技亮相小米新品发布会

更多推荐

Kasisto:人类的智慧使AI更加智能

Cape Analytics以粒度启动防御空间分析

深度学习词汇表(五)

Nature:不用开口说话,AI直接将大脑信号转译成言语

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

声智科技亮相小米新品发布会相关推荐

  1. 声智科技完成B轮2亿元融资,AI方案遍布百度小米华为阿里产品

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 又一家AI公司在寒冬中获得资本加持. 又一个源自中国科学院的AI创新项目. 声智科技,B轮,2亿元,由毅达资本领投,峰瑞资本.正居资本跟投 ...

  2. 回顾声智科技助力联想智能音箱MINI亮相CES Asia

    作为唯一专注亚太市场的行业盛会,第四届亚洲消费电子展(CES Asia)在2018年6月13-15日上海新国际博览中心盛大开幕,采用声智科技3麦克风阵列远场语音交互方案的联想智能音箱MINI首次亮相C ...

  3. 声智科技完成2亿元B轮融资,将持续拓展语音交互产品的规模化落地

    整理 | 一一 出品 | AI科技大本营 寒冬之下,不少创业公司依然得到了资本青睐. AI科技大本营消息,12 月 29 日消息,声智科技(SoundAI)已于近期完成 2 亿人民币 B 轮融资,本轮 ...

  4. 定位AI交互技术服务商,声智科技完成近亿元A轮融资,将拓展安防、汽车等新场景

    来源:36Kr 摘要:"语音交互是人工智能相关技术的重要应用场景,而语音交互的核心和关键突破点在于远场.而国内真正有实力做好远场技术的团队是非常稀少的." 定位人工智能交互技术服务 ...

  5. 专访声智科技陈孝良:把自己嫁给公司,伟大都是熬出来的

    陈孝良是一个健谈的人,在雷锋网新智造抛出任何一个问题后,他就此可以围绕声智科技和当下行业发展状况侃侃而谈:他也是个很有耐性的人,在采访的四个多小时里,他甚至都没停下来多喝几口水.如果创业是一场长跑的话 ...

  6. 声智科技陈孝良:没有好的语音数据收集,语音识别和交互不可能做好

    声智科技是一家人工智能交互与声学解决方案服务商,从事语音交互芯片.模组和设备研发.设计.制造并提供整体声学技术解决方案.简单理解,他们跟思必驰.云知声类似,不直接提供面向TO C的产品,而是做产品公司 ...

  7. “锤子科技2017春季新品发布会”能否带领罗永浩度过难关?

    2017年4.月25日,罗永浩在自己的微博圈不断刷屏,转发微博#锤子科技2017春季新品发布会#并且附上文字"鬼知道我们经历了什么?" 据网上消息来源,锤子科技在过去上半年亏损1. ...

  8. 小米新品发布会2021 3月29日小米新品发布会

    小米生生不息新品发布会将在3月29日召开,由于此次将发布小米11 Pro.小米11 Ultra和小米MIX新机三款重磅的高端旗舰机,所以许多网友将小米此次发布会称作是2021年科技界的春晚.的确,仅从 ...

  9. 36 句话看完锤子科技 2018 夏季新品发布会

    锤子科技于 2018 年 8 月 20 日在北京凯迪拉克中心(原五棵松体育馆)举行了新品发布会,发布了搭载颠覆性的"无限屏"功能与"TNT"大屏幕操作系统的坚果 ...

最新文章

  1. c语言函数库学习~sscanf~格式化输入
  2. 《Unity 游戏案例开发大全》一6.5 游戏主场景
  3. Solr debugQuery使用体会
  4. JAVA_OA(bug篇)(一):SpringMVC的bug1
  5. 面向对象的三大特征继承,封装和多态性
  6. 第二十二章:动画(八)
  7. HDU 6124 Euler theorem
  8. sap系统搭建教程_SAP系统和微信集成的系列教程之十:如何在SAP C4C系统里直接回复消息给微信用户...
  9. Kardashev量表和AI:可能的床友
  10. ios 后台唤醒应用_iOS 前后台机制以及后台唤醒机制【个人学习】
  11. 学习机器视觉需要掌握哪些知识?【转】
  12. android 必读的文章- 收藏集 - 掘金
  13. ASTC纹理压缩格式(Adaptive Scalable Texture Compression)
  14. MGV2000_CW、JL、JZ、KA/KX、CNTV,零配置_S905L-B_全套固件(可救砖)
  15. 使用Excel 提取文本中的数字
  16. C语言实现之数字中的最大数字组合
  17. 如何解决失眠有效方法,五个助眠小妙招
  18. GDAL+Basemap+IDW(反距离权重)代替ARCPY,制作温度、降雨分布图
  19. 说说在CMD命令行模式下ADB命令显示为不是内部或外部命令,亦不是可运行程序和批处理文件的解决办法
  20. 南邮 | Linux实验一:Linux 基本命令 权限管理

热门文章

  1. 商品sku规格选择效果,没有商品的不能选中,选择顺序不影响展示结果
  2. min_25 JZOJ5594 最大真因数
  3. OWASP ZAP 扫描漏洞误报分析
  4. 局域网内2台ubuntu电脑共享鼠标键盘
  5. 标准正态分布变量的累积概率分布函数
  6. 视频太大,如何把视频压缩到最小
  7. 扬帆跨境电商:Shopify放量5000W扩大规模
  8. php tp6 错误接管分析,终于成功使用whoops接管tp6的异常处理!
  9. 食管癌术后患者要怎么进食才科学?
  10. ${}和`${}`的用法