之前分享了一款实时vad是webrtcvad,但在实际使用中发现如下问题:

  • 每次判断chunk是否是vad,chunk的长度有限制,webrtcvad只支持10ms、20ms以及30ms的判断,但我希望能一次判断100ms的chunk,无法满足。
  • 无噪声情况下webrtcvad的效果还是不错的,并且速度也很快,但实际情况中,噪声还是很常见的,而webrtcvad对这种噪声是无法过滤的,此处的噪声指的是场景白噪声(通俗来说就是麦克风在收音时录制的环境噪声,类似滋滋滋这种),而此类噪声也是很常见的~

为了解决这个问题,基本的想法是使用神经网络训练一个vad模型,但考虑到数据和周期性,无法满足,偶然发现GitHub现存一款性能很好的vad,完全可以替代webrtcvad,此处贴上官方的地址,模型转化为了onnx,我对此vad的使用做了一个简化,代码如下:

rom utils_vad import OnnxWrapper, init_jit_model, get_speech_timestamps, save_audio, read_audio

实时vad(替换webrtcvad)相关推荐

  1. 使用 OpenCV+CVzone 进行实时背景替换

    介绍 OpenCV是一个开源计算机视觉库,可提供播放不同图像和视频流的权限,还有助于端到端项目,如对象检测.人脸检测.对象跟踪等. CVzone是一个计算机视觉包,可以让我们轻松运行像人脸检测.手部跟 ...

  2. ps 替换文字_这可能是PS最难用的功能!解决PS字体列表硬伤的利器FonTags

    [PConline 应用]PS的字体列表又卡又冗,尤其对于设计师而言,安装的字体少则几十多则上百,每次查找都要花费很长时间,以至于有人说这可能是PS最难用的功能了.其实我们也可以通过一款小软件FonT ...

  3. 实时高分辨率视频抠像

    一.实验目的 视频抠像有许多实际应用.许多正在兴起的用例,例如视频会议和娱乐视频 创作,都需要在没有绿幕道具的情况下对人体主体进行实时背景替换.因此我选 择该项目作为大作业方向 1.在视频流上提取前景 ...

  4. Enlighten将被功能强大的烘焙和实时GIobal照明解决方案取代

    Unity is required to remove Enlighten but will continue support as-is through 2020 LTS. We have a ro ...

  5. 浏览器渲染机制面试_浏览器渲染原理

    本文目录结构 问题 浏览器渲染原理 渲染过程 1. 浏览器接收到 HTML ⽂件并转换为 DOM 树 当我们打开⼀个⽹⻚时,浏览器都会去请求对应的 HTML ⽂件.虽然平时我 们写代码时都会分为 JS ...

  6. 音视频技术开发周刊 | 175

    每周一期,纵览音视频技术领域的干货. 新闻投稿:contribute@livevideostack.com. PTP部署中的经验 本次演讲来自AIMS IP Oktoberfest 2020,演讲者分 ...

  7. ribbon 配置 动态更新_Netflix开源工具:在SpringBoot实现动态路由

    前言 假设你有一个服务A,要调用服务B(有三个实例,B1.B2.B3),如何只调用其中的B1和B2,屏蔽掉B3?实际上解决方法大致分为两类. 一种是外部路由,就是通过网关等组件,在请求链路上进行路由选 ...

  8. 人工智能学术论坛参会总结【附PPT】

    作者:杨鹏@yige.ai.吴金龙@yige.ai 责编:何永灿,关注人工智能,投稿请联系heyc@csdn.net或微信号289416419 10月17日,中科院自动化研究所庆祝建所60周年举办了人 ...

  9. 前端面试超全整理1( js 浏览器安全 性能)

    1.JS 基础面试题(一) 原始(Primitive)类型 涉及面试题:原始类型有哪几种?null 是对象嘛? 在 JS 中,存在着 6 种原始值,分别是: boolean null undefine ...

  10. 使用pandas清洗携程旅游数据

    1.导入模块 from pandas import DataFrame,Series import pandas as pd import numpy as np from fuzzywuzzy im ...

最新文章

  1. 五、linux总线中设备和驱动注册流程详解
  2. 职责链模式应用——下机(机房重构知识点总结)
  3. JavaScript Onclick事件解释
  4. 计算机学院迎新活动总结,大学迎新活动总结
  5. sql azure 语法_将SQL工作负载迁移到Microsoft Azure:规划迁移
  6. 再读headfirst-原则与模式摘录
  7. 4.微服务设计 --- 集成
  8. 恒生电子offer含金量_收获8个Offer,来给大家分享备战和面试经验
  9. 当电子工程师十余年,感慨万千
  10. C# 读取TXT文本文档 搜索指定字符串所在的行 保存到集合
  11. SitePoint播客#128:我最不喜欢的10岁
  12. 对象存储(OSD)及架构原理
  13. 去除Multiple markers at this line - advised by提示
  14. day 69-70 一对一 一对多 多对一联表查询
  15. NTC电阻在电源输入端的应用-测试案例
  16. Java之static静态对象
  17. 鼠标键为什么按小键盘5以及+的时候却有时变成了右键点击,如何改为左键点击
  18. 手把手教你破解Linux系统root密码——无需任何工具,有手就行
  19. 多基线干涉仪系统测向误差分析
  20. 易事特拟8600万元投资山东潍坊临朐县光伏扶贫BOT项目

热门文章

  1. TOJ 4171 L-The math problem(水题)
  2. mysql数据库用户密码_修改mysql数据库的用户名和密码
  3. 由安徽十地重拳曝光老赖,谈失信会有哪些限制?
  4. 软件环境 硬件环境java,软件环境和硬件环境都指什么?
  5. 开源 java CMS - FreeCMS2.8 移动app站点配置
  6. 我们为什么教不好自己的孩子?(云中逸客)
  7. 使用Python对视频任意矩形区域进行裁剪
  8. python爬取快代理和西刺的国内高匿代理IP
  9. 《JS修炼之道》—— 读后总结
  10. 架构师害怕程序员知道的十项技能的读后感