voice_activity_detection

Audio Split 基于双门限法的语音端点检测及语音分割

代码在我的github上voice_activity_detection

如果您觉得有一点点用,请隔空比个心(或者,去我的github上点一下 “Star” 也可以~)

根据短时能量和过零率, 基于双门限法的语音端点检测及语音分割

直接运行audio_split.py,会对./raw_audio文件夹下的所有音频文件进行分割:

  1. 首先对原音频转成16kHz,16bit,PCM格式,单通道的.wav文件,保存在./convert2wav文件夹下;
  2. 再对转换后的文件进行第一次分割,保存在./detected_split1文件夹下;
  3. 再次对分割后的文件分割,保存在./detected_split2文件夹下;
  4. 最后根据时长限制,加速音频,保存在./duration_limit文件夹下。

以上各步骤可选,参数均可自由设置,程序里有详细注释。

另外,对于acoustic_feature.py,请看我另一个仓库:声学特征提取

关于./raw_audio文件夹下的两个示例文件,运行程序会有两张plot输出:

图1 汉语:“蓝天 白云”的语音端点检测

图2 一些汉语数字的语音端点检测

Python Import

关于本程序的依赖库(其中Librosa最好和我使用的版本一致,其他版本都没测试过):

  • Librosa-0.7.2
  • Numpy-1.18.1
  • matplotlib-3.1.3
  • Scipy-1.4.1
  • Soundfile-0.9.0

License 开源许可协议

GPL v3.0 © ZZL

赞助

如果你喜欢本程序,并且它对你有些许帮助,欢迎给我打赏一杯奶茶哈~

微信:

支付宝:

基于双门限法的语音端点检测及语音分割相关推荐

  1. 基于双门限法的端点检测

    基于双门限法的端点检测 代码+论文+PPT+仿真结果下载地址:下载地址 摘要 语音端点检测是指从一段语音信号中准确的找出语音信号的起始点和结束点,它的目的是为了使有效的语音信号和无用的噪声信号得以分离 ...

  2. MATLAB语音端点检测

    第一章 绪论 Matlab是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发.数据可视化.数据分析以及数值计算的高级技术计算语言和交 ...

  3. matlab浊音段和清音段,语音端点检测及其在Matlab中的实现

    文献 计算机时代2005年第8期 25 语音端点检测及其在Matlab中的实现 刘 羽 (桂林工学院科技处,广西桂林541004) 摘要:介绍了语音的基本特征和语音端点检测的基本方法,对基于Matla ...

  4. 双门限法语音端点检测(Python实现)

    写在前面 花了几天时间写完了第一个视听觉信号处理的实验,其实还挺简单的,在这里分享一下. 本文介绍一下利用双门限法进行语音端点检测的方法,该方法主要利用了语音的短时能量和短时过零率,关于这两个语音特征 ...

  5. 语音端点检测(1):双门限法(简单教学版)

    为什么要有语音端点检测?或者换个角度说,静默检测.静音检测. 以下摘自百度. 语音活动检测(Voice Activity Detection,VAD)又称语音端点检测,语音边界检,是指在噪声环境中检测 ...

  6. matlab浊音段和清音段,基于Matlab编写的语音端点检测1

    wavread 基于Matlab编写的语音端点检测 专业: 班级: 姓名: 指导教师: 2011年6月18日 一.实验目的 1.学会MATLAB的使用,掌握MATLAB的程序设计方法: 3.掌握语音处 ...

  7. 基于短时能量的语音端点检测算法

    1 带噪语音信号 日常生活中噪声无处不在,说话声.风声.雨声.打字声.机器运行的声音等都可定义为噪声.噪声的种类也很多,每种都有其各自的特点,对有用信息的影响程度也不同.噪音主要包括稳定噪音和非稳定噪 ...

  8. 语音端点检测 matlab 论文,基于MATLAB的语音端点检测

    求助,哪位高手帮忙看看以下程序全不? 基于Matlab编写的语音端点检测程序 function [x1,x2] = vad(x) %幅度归一化到[-1,1] x = double(x); x = x ...

  9. 语音端点检测 php,几种语音端点检测方法简介

    几种语音端点检测方法简介 2011年第11期福建电脑 67 几种语音端点检测方法简介 邢亚从 (苏州市职业大学江苏苏州215000) [摘要]:语音的端点检测在语音的编码.语音识别.语音增强.说话人识 ...

最新文章

  1. [IE9] 如何让你的网站在IE9和Win7任务栏上更闪亮
  2. 初探设计:Java继承何时用?怎么用?
  3. nginx在CDN加速或使用SLB代理后,获取真实IP,做并发访问限制的方法
  4. Vulnhub靶机渗透之 AI: Web: 1
  5. memcpy,strcpy,strncpy
  6. 更新无限无线连接更新服务器,02-H3C WBC560多业务无线控制器软件升级操作指导...
  7. Bitmap头文件说明
  8. IceGrid应用 配置手册
  9. 【工具类】java数字金额转换成大写
  10. 步进电机基础(5.9)-步进电机的驱动与控制-三相步进电机的驱动电路
  11. [转载]斐讯K2 A2版免TTL刷BREED不死Bootloader
  12. PHP微信公众号登录获取openid信息
  13. 用户行为分析,就该这么做!
  14. .net微信公众号或微信打开,静默授权,获取微信登录者的openid
  15. 0211书架的制作过程(使用3DsMAX2016)
  16. 【Python上分之路】第一篇:Python是什么?
  17. 轻量级网络--ShuffleNet论文解读
  18. selenium源码通读·5 |webdriver/common/action_chains.py-ActionChains类
  19. grafana 实现自定义主题 Boom Theme
  20. 【有利可图网】PS教程:制作千图成像效果

热门文章

  1. Unity-2D游戏开发套件指南-免费资源
  2. RISCV学习笔记6.2--vcs和verdi开发蜂鸟e203
  3. bsc全能型分红,shib、doge、usdt、bnb等
  4. Stegsolve.jar打不开,jar类文件都打不开可能的解决办法
  5. Redis-什么是缓存雪崩、缓存击穿、缓存穿透
  6. springboot福佳生活超市进销存管理系统毕业设计源码261620
  7. LTP 依存句法分析
  8. 闪存Nand Flash存储结构浅析
  9. 不同品牌android手机ui,三种不同界面的安卓系统_华为手机_手机Android频道-中关村在线...
  10. 智能电表专用DC-DC芯片