语音活性检测 (Voice activity detection,VAD),检测信号中语音成分和非语音成分

关键词检测 (Keyword Spotting, KWS),检测语音信号中的关键词与非关键词部分

自动语音识别 (automatic speech recognition, ASR),  使得机器能够识别出人的语音

目前采用ASIC的方案,直接实现VAD,KWS,ASR的超低低功耗电路设计成为主流的趋势,本文总结了关于上述内容的最新论文。

KWS

1.会议:ISSCC

Shan, Weiwei, et al. "14.1 A 510nW 0.41 V Low-Memory Low-Computation Keyword-Spotting Chip Using Serial FFT-Based MFCC and Binarized Depthwise Separable Convolutional Neural Network in 28nm CMOS." 2020 IEEE International Solid-State Circuits Conference-(ISSCC). IEEE, 2020.

2.期刊:JSSC

Giraldo, Juan Sebastian P., et al. "Vocell: A 65-nm Speech-Triggered Wake-Up SoC for 10-$\mu $ W Keyword Spotting and Speaker Verification." IEEE Journal of Solid-State Circuits 55.4 (2020): 868-878.

3.会议:VLSI

Giraldo, JS P., et al. "18μW SoC for near-microphone Keyword Spotting and Speaker Verification." 2019 Symposium on VLSI Circuits. IEEE, 2019.

4.会议:ESSCIRC

Giraldo, Juan SP, and Marian Verhelst. "Laika: A 5uW programmable LSTM accelerator for always-on keyword spotting in 65nm CMOS." ESSCIRC 2018-IEEE 44th European Solid State Circuits Conference (ESSCIRC). IEEE, 2018.

5.会议:VLSI

Yin, Shouyi, et al. "A 141 UW, 2.46 PJ/Neuron Binarized Convolutional Neural Network Based Self-Learning Speech Recognition Processor in 28NM CMOS." 2018 IEEE Symposium on VLSI Circuits. IEEE, 2018.

6.期刊:JSPS

Shah, Mohit, et al. "A fixed-point neural network architecture for speech applications on resource constrained hardware." Journal of Signal Processing Systems 90.5 (2018): 727-741.

7.期刊:JSSC

Price, Michael, James Glass, and Anantha P. Chandrakasan. "A low-power speech recognizer and voice activity detector using deep neural networks." IEEE Journal of Solid-State Circuits 53.1 (2017): 66-75.

8.会议:ISSCC

Price, Michael, James Glass, and Anantha P. Chandrakasan. "14.4 a scalable speech recognizer with deep-neural-network acoustic models and voice-activated power gating." 2017 IEEE International Solid-State Circuits Conference (ISSCC). IEEE, 2017.

9.期刊

Zhang, Yundong, et al. "Hello edge: Keyword spotting on microcontrollers." arXiv preprint arXiv:1711.07128 (2017).

VAD

1.会议:ISSCC

Yang, Minhao, et al. "Design of an Always-On Deep Neural Network-Based 1-$\mu $ W Voice Activity Detector Aided With a Customized Software Model for Analog Feature Extraction." IEEE Journal of Solid-State Circuits 54.6 (2019): 1764-1777.

2.会议:ISSCC

Yang, Minhao, et al. "A 1μW voice activity detector using analog feature extraction and digital deep neural network." 2018 IEEE International Solid-State Circuits Conference-(ISSCC). IEEE, 2018.

3.期刊:JSSC

Yang, Minhao, et al. "A 0.5 V 55$\mu\text {W} $64$\times $2 Channel Binaural Silicon Cochlea for Event-Driven Stereo-Audio Sensing." IEEE Journal of Solid-State Circuits 51.11 (2016): 2554-2569.

4.会议:ISSCC

Badami, Komail, et al. "24.2 Context-aware hierarchical information-sensing in a 6μW 90nm CMOS voice activity detector." 2015 IEEE International Solid-State Circuits Conference-(ISSCC) Digest of Technical Papers. IEEE, 2015.

ASR

1.期刊:Transactions

Tsai, Wei-Yu, et al. "Always-on speech recognition using truenorth, a reconfigurable, neurosynaptic processor." IEEE Transactions on Computers 66.6 (2016): 996-1007.

2.期刊:JSSC

Price, Michael, James Glass, and Anantha P. Chandrakasan. "A 6 mw, 5,000-word real-time speech recognizer using wfst models." IEEE Journal of Solid-State Circuits 50.1 (2014): 102-112.

小知识:

集成电路学科的两大顶会一大顶刊:

会议:国际固态电路会议(IEEE International Solid-State Circuits Conference,ISSCC)

超大规模集成电路研讨会(Symposia on VLSI Technology and Circuits,VLSI)

期刊:固态电路期刊(IEEE Journal of Solid-State Circuits,JSSC)

VAD、KWS、ASR相关推荐

  1. 技术人文丨他们“说”的每一句话,都有ASR、NLP、TTS技术

    还记得前一段时间我们为言语障碍用户阿卷定制了"属于"他的声音吗?如果遗忘了,不妨回顾下<小米自研语音合成声音定制技术:让世界听见你的声音!> 在此之中,我们一直重复提到 ...

  2. 汉字转拼音,文字转语音tts (语音技术、语音识别),Asr/tts,变声

    语音识别,语音合成.语音技术主要分两块:一块是语音转文字,即语音识别:另一块是文字转语音,即语音合成.   语音相关技术研发 语音合成技术整体解决方案.一系列语音技术的相关专利,包括文本处理.韵律预测 ...

  3. 沃丰科技AI浅谈|语音交互的三驾马车:ASR、NLP、TTS

    在日常生活中,AI机器人离我们很近.你是否接到过这样的电话:"您好,检测到您已经购买某产品一周的时间了,请问您的使用感受如何?""请问您对产品满意吗?有什么建议给到这边吗 ...

  4. 语音交互的三驾马车:ASR、NLP、TTS

    http://www.woshipm.com/ai/2620327.html 语音交互是AI最重要的领域之一,也是目前落地产品比较成熟的领域,比如说智能客服.智能音箱.聊天机器人等,都已经有成熟的产品 ...

  5. 华为、百度、小米踏上造车新征程,软件如何吞噬汽车?

    [编者按]在全行业线上化的今天,新一轮的技术变革从根本上动摇了传统汽车行业的百年游戏规则,并出现了以特斯拉.蔚来.小鹏等为代表的造车新势力,和以英伟达.百度.华为等为代表的技术赋能者.传统汽车企业如何 ...

  6. 迁移学习全面指南:概念、项目实战、优势、挑战

    https://www.toutiao.com/a6685571761766924803/ 2019-04-30 14:32:56 前言 希望大家从头到尾的去看,而不是看完前面一点点感觉有用然后收藏, ...

  7. 《企业大数据系统构建实战:技术、架构、实施与应用》——第3章 企业大数据解决方案 3.1 企业大数据解决方案实现方式...

    本节书摘来自华章计算机<企业大数据系统构建实战:技术.架构.实施与应用>一书中的第3章,第3.1节,作者 吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区"华章计算机 ...

  8. 本周NLP、CV、机器学习论文精选推荐

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  9. Python 异步 IO 、协程、asyncio、async/await、aiohttp

    From :廖雪峰 异步IO :https://www.liaoxuefeng.com/wiki/1016959663602400/1017959540289152 Python Async/Awai ...

最新文章

  1. Android开源测试框架
  2. session和cookie的区别和联系---转载
  3. bigtall的敏捷日记(1)
  4. JDBC:java.sql.SQLException: Before start of result set怎么办
  5. Python常见数据结构整理
  6. Linux系统上的库文件的生成与使用
  7. CF438E:The Child and Binary Tree(生成函数)
  8. 如何让nodejs在linux后台运行
  9. 计算机cad查询,电脑端如何快速查阅CAD图纸
  10. 程序员面试逻辑题解析
  11. stephen boyd著王书宁译凸优化课后题答案
  12. matlab车牌自动定位,超级实用的车牌定位matlab程序
  13. 鱼塘钓鱼 (贪心+枚举)
  14. Android矩阵运算总结
  15. 学习光线追踪(16)---折射计算[1]
  16. 基于C#的ArcEngine二次开发教程(03):ArcEngine的接口查询技术底层分析
  17. 小程序源码:登录接口已修复梦想贩卖机V2 2.0.4 修复版
  18. win10任务栏,如何做到图标居中
  19. Python入门干货经验(免费提供资料)
  20. 九度oj-1163-素数

热门文章

  1. Mac系统升级后,无法安装Cornerstone解决办法
  2. Android HTTP边下边播
  3. 解决PHP上传文件时大小受限制问题
  4. 告别户外弱网困扰,4G多卡聚合设备增强弱网环境下应急救援信号
  5. CocosStudio(八)AtlasLabel数字标签、BitmapLabel自定义字体、Label文本框
  6. 用Git上传代码到华为云(图解详细)
  7. 学习《图说设计模式》观察者模式
  8. Python爬虫技巧--selenium解除webdriver特征值
  9. MySQL的关键技术及主要特征_生物特征识别十大关键技术解析
  10. 如何在功能、特点、价格和性能方面选择PDF编辑器?