7月21日,杭州国芯举办以“智慧穿戴,从「芯」启航”为主题的线上发布会,推出了超低功耗AI芯片GX8002,采用MCU+自研NPU架构,单芯片实现实时语音唤醒功能,VAD待机模式下功耗低至70uW,首批产品采用QFN20,3mmx3mm封装,可应用于TWS耳机等智能穿戴设备。下面一起来全面了解一下~


随着人工智能技术的发展,AI语音的渗透率越来越高,从智能音箱,到语音家电,再到智能车载,AI已经无处不在。

2016年AirPods横空出世打开了真无线耳机市场,AirPods 2代加入了实时语音唤醒功能,TWS+AI也成为市场的大势所趋。耳机从「耳边的播放器」进化为「耳边的AI助理」,成为下一个重要的入口级产品。
然而,TWS耳机、智能手表、手环等可穿戴产品,受限于体积小,电池容量有限,续航时间常常难以满足用户需求。而始终在线的语音唤醒,又会大大地增加功耗,当前的各种芯片都很难在功耗和性能间达到平衡。


此次国芯发布的AI芯片GX8002,肩负让可穿戴设备更加智能的使命,针对超低功耗场景下的AI唤醒实现了技术突破,能够做到无压力的「always on」语音唤醒。1、国芯GX8002采用MCU+自研NPU架构


国芯GX8002芯片结构框图

国芯GX8002采用了MCU+NPU的架构,集成国芯第二代自研神经网络处理器gxNPU V200和平头哥CK804处理器。同时芯片支持多级唤醒,集成硬件VAD,可实现超低功耗待机和自动人声感应。通过NPU的强大能力,实现语音唤醒、指令识别、AI降噪、声纹识别等众多功能。

2、VAD待机模式下功耗低至70uW

经过测试,国芯GX8002整颗芯片在VAD待机时的功耗只有70uW,运行时的功耗为0.6mW。

同时国芯GX8002可以根据用户是否说话自动切换VAD待机和工作两种模式,因此通过VAD的有效过滤,芯片日常使用的平均功耗基本低于300uW。

国芯GX8002的超低功耗背后,主要有两大技术突破——自研神经网络处理器gxNPU V200和自研硬件VAD。此次发布的gxNPU V200为国芯第二代神经网络处理器,专门针对低功耗优化,计算能效是普通DSP芯片的10倍以上。支持DNN/CNN/RNN等各种模型,自动实现网络量化压缩,可以和Tensorflow等训练平台直接对接。


国芯gxNPU结构框图

同时,国芯设计了全新的VAD模块,通过增加更多特征的分析来判断人声,具备超强过滤能力,在办公室、地铁、马路、咖啡馆等各种场合的实际测试中,国芯GX8002可以让VAD待机的比例平均高达70%以上。


3、SIP立体封装技术,3mmx3mm超小封装
为了可穿戴方案中唤醒部分占用的体积尽可能小,国芯在芯片中将唤醒所需要的部件全部做了集成,包括音频ADC、Flash、电源LDO等,甚至还有晶振!也就是说产品使用国芯GX8002时,几乎不需要外部器件,仅需一颗芯片就能完成语音唤醒的全过程,占据PCB面积极小。


同时在封装设计上,国芯GX8002采用的是SIP立体封装技术,将Flash叠封在内。首推的封装为QFN20,3mmx3mm,非常便于生成和使用。在Q3国芯还将推出更小的WLCSP封装,尺寸可达1.4mm x 2.4mm,满足更加精密产品的需求。


4、0.65美元高性价比,还有一站式服务
为了能更好地为可穿戴赋能AI,国芯不仅完成超低功耗的突破,更是将成本降到极致。现场公布了0.65美元的起步价,做到了非常高的性价比。


与此同时,国芯整合了丰富的资源,包括各种TWS和可穿戴产品需要的基础技术和算法方案,接入各大品牌手机助手和云端平台,打通了蓝牙主芯片的合作通道,输出完整可靠的「一站式服务」,降低了AI服务门槛,也大大的缩短客户的研发周期。


同时外置唤醒的方案,可以在客户原有成熟产品的基础上,相当于加上了一个语音按键,客户原有的软件和设计都可复用,让AI的研发周期变得非常可控,有形成本和无形成本都大大降低。

国芯GX8002集众多技术之大成,无论是语音唤醒、音频信号处理、NPU异构计算,还是VAD技术、无晶振设计,都是国芯在AI芯片与音视频领域多年经验的体现。超低功耗,更非一日之功,是国芯的小伙伴夜以继日努力的成果。

我爱音频网总结

TWS+AI是目前TWS耳机市场的一大趋势,品牌方把支持语音唤醒功能的TWS耳机视作AIoT的新入口,蓝牙芯片原厂像高通、瑞昱等已经开始布局,想要把ANC/ENC/VAD等功能集成到单芯片方案里,但目前都还没能像苹果H1那样大规模商用。
此次国芯发布的AI芯片GX8002为TWS耳机等产品提供了新的外置语音唤醒的方案,即单芯片集成音频ADC、Flash、电源LDO、晶振等语音唤醒所需要的元器件,采用SIP立体封装技术,尺寸为3mmx3mm,大大节省占板面积。
同时,国芯GX8002支持本地唤醒、声纹校验、AI降噪等功能,在蓝牙芯片成熟产品的基础上相当于加上了一个语音按键,原有的软件和设计都可复用,像近期非常热门的AI骨传导通话降噪技术也可以应用。
此外,国芯还整合了各种TWS和可穿戴产品需要的基础技术和算法方案,接入国内各大品牌手机助手和云端平台,打通了杰理、恒玄、络达、瑞昱、中科蓝讯等主流蓝牙芯片的合作通道,大大节省了AI TWS耳机的研发周期。
低功耗、超小体积、较高的性价比,国芯GX8002可能是现阶段在可穿戴产品中实现实时语音唤醒最为快速和理想的解决方案,我爱音频网期待早日在拆解中看到有产品应用!

音频行业年度报告持续更新中,如果你想了解消费类音频行业最新动态,欢迎关注我爱音频网呀:D

以下热门话题可以点击蓝字了解,

也可以在我爱音频网微信后台回复如下关键词获取专题

「技术专题」

LE Audio、TWS、降噪、骨传导、HWA、智能音箱报告、耳机报告、助听器、蓝牙市场报告

「拆解汇总」

300篇拆解、TWS耳机拆解、充电盒拆解、智能音箱拆解、脖挂耳机拆解、头戴耳机

「优质资源」

TWS耳机顶配芯片、TWS耳机芯片、充电盒芯片(有线)、充电盒芯片(无线)、TWS耳机电池、充电盒电池

「芯片原厂」

高通、络达、瑞昱、钰泰、楼氏、中科蓝讯

杰理、LPS微源、思远半导体、昇生微

「电池厂商」

超聚、鹏辉、诺威

「品牌专区」

手机品牌汇总

苹果、华为、SONY、OPPO、漫步者、小鸟

万魔、百度、小米、天猫精灵

「展会报道」

蓝牙耳机亚洲展、CES、ComputeX、环球资源、香港电子展、果粉嘉年华、中科院声学所峰会、Bluetooth Asia、瑞昱发布会、紫光展锐发布会

「土豆专访」

第1期、第2期、第3期、第4期、第5期、第6期、第7期、第8期、第9期、第10期、第11期、第12期、第13期

「土豆探厂」

楼氏、思必驰、由我、盛洋

内容持续更新中

商务合作联系:info@52audio.com

勇敢点,在留言板说出你的观点!

c语言实现语音检测vad_TWS+AI?国芯发布超低功耗语音芯片,可能是目前最理想方案...相关推荐

  1. 紫光国芯61亿入股台湾两企业遇挫?公司称不确定性风险加大

    1个月前收购事项还在"有序进行",而今,眼看着相关协议期限将至,紫光国芯(002049,SZ)的公告中却披露了收购事项进展不顺利的信息. 紫光国芯11月26日表示,历经3次对台湾地 ...

  2. 对话微软黄学东:语音语言技术是镶在 AI 皇冠上的明珠

    来源:AI科技评论 AI 科技评论按:上一次你和你的电脑进行有意义的对话,并感受到它能真正地理解你,是什么时候?如果微软技术研究员.微软的语言语音小组组长黄学东博士做到了的话,那么你也将可以做到.并且 ...

  3. c语言实现语音检测vad_AI大语音(二)——语音预处理

    点击上方"AI大道理",选择"置顶"公众号 重磅干货,细致入微AI大道理 ------ 1 预滤波 CODEC说得通俗一点,对于音频就是A/D和D/A转换.前端 ...

  4. 百度ai文字转语音并下载php源码,一种基于百度AI的网页版在线语音包转文字的方法与流程...

    本发明涉及语音识别技术领域,特别涉及一种基于百度AI的网页版在线语音包转文字的方法. 背景技术: 语音识别技术,也被称为自动语音识别Automatic Speech Recognit1n, (ASR) ...

  5. 简化云服务的语音检测算法部署

    正文字数:1069  阅读时长:2分钟 "在某种程度上,云服务提供商的语音算法成为芯片的黑匣子." 文 / Majeed Ahmad 原文链接 / https://www.edn. ...

  6. 浅析YOLO目标检测算法AI安全帽识别技术及场景应用

    安全帽是建筑业.制造业等工业生产中重要的劳保工具,应用十分广泛.但是在实际场景中,比如建筑工地或工厂流水线上,依然有很多工人忽视安全帽的重要性,同时,由于企业的监督不到位,因未佩戴安全帽而引发的安全事 ...

  7. 揭开KPI异常检测顶级AI模型面纱

    摘要:2020GDE全球开发者大赛-KPI异常检测告一段落,来自深圳福田莲花街道的"原子弹从入门到精通"有幸取得了总榜TOP1的成绩,在这里跟大家分享深圳福田莲花街道在本次比赛的解 ...

  8. 跟着我学习 AI丨语音识别:将语音转为数字信号

    语音识别是一种人工智能技术,其主要目的是将人类说话转化为计算机可以理解的信息.语音识别技术的应用非常广泛,包括智能家居.汽车导航.语音搜索.人机交互.语音翻译等. 语音识别的技术原理 语音识别的技术原 ...

  9. AI时代取代手机:语音交互设计漫谈

    文章翻译自Lyndon Cerejo发表于SMASHING MAGAZINE的Designing Voice Experiences,全文通过构建一个语音问答类的益智游戏来分享了作者关于语音体验设计的 ...

最新文章

  1. Ruby测试框架Rspec初探
  2. cas 注销不关闭浏览器异常_一次浏览器请求的生命周期
  3. 详解华为交换机iStack特性
  4. 在Android命令行启动程序的方法
  5. 13 Tensorflow机制(翻译)
  6. Java虚拟机(四)——运行时数据区
  7. 移远EC20 R2.0 AT指令拨号流程
  8. 分析无线遥控器信号并制作Hack硬件进行攻击
  9. PCB板设计布局原则有哪些?
  10. haproxy+rabbitmq镜像集群
  11. MATLAB模拟陀螺仪的运动轨迹(附完整代码)
  12. ps系列 -- 给人物添加光影
  13. 情感分析-英文电影评论
  14. 魔改插线板,让电视控制周边设备开关机
  15. 怀旧服一区和五区服务器位置,魔兽怀旧服战场分组怎么看?怀旧服战场分组一区五区怎么分的?...
  16. dna编码库_DNA编码化合物库,新药筛选划时代的变革
  17. Revit命令名称与命令ID
  18. 湘潭大学计算机考研复试题,湘潭大学信息工程学院2019年考研复试程序设计练习题...
  19. 马斯克成全球首富!万字最新访谈披露,信息量极大,远见令人震撼
  20. 企业经营流程重组与Synchro Workflow

热门文章

  1. 目前我们再用的即时通讯软件
  2. 飞鸽类能记住传书的人类
  3. 国产品牌“爱国者”首次杀入数码相机十强
  4. C++程序设计语言编程风格演变史
  5. Java、JavaScript、C、C++、PHP、Python都是用来开发什么?赶紧来看看!
  6. 新手程序员如何找一个靠谱的公司
  7. 官方:Angular 5 推迟到10月底发布
  8. linux红帽子版本安装报告,红帽子RedHat Linux 9.0安装图解(图c
  9. 管家婆打印自定义编辑_打印相关,人手一份!
  10. 用大数据算法得出当代移动互联网人群图鉴