python把多个人声分离_一段音频中判断多个人声?
谢邀,这个问题有几种可能的解读:
1)只需要判断人数,不需要知道他们分别在什么时间说话(number of speakers)
2)判断人数并且知道他们说话的时间点(diarization)
3)判断人数并且分离每个人的说话声(separation)
除此之外还有很多需要考虑的因素。录音环境,比如近场或者远场,单通道或者多通道,也是非常重要的信息;说话人信息也可能影响方法,比如只要求判断事先知道的某些说话人(speaker dependent)或者对任意说话人都要能判断(speaker independent);说话人之间的重叠(overlap)长度也可能影响“判断有几个人在说话”的时间区间(0.3秒内有几个人?1秒内有几个人?等等)。
从问题描述来看我就默认是近场、单通道、说话人无关的情况了(如果不准确还请告知)。多通道的情况会简单一些,因为可以提取说话人的空间信息来做判断。
1)如果只需要知道人数,一个简单的分类器一般就能满足需求,其效果类似一个多说话人的vocal activity detection (VAD)。
2)如果需要知道“谁在什么时间讲话”,问题就变成了speaker diarization问题,这方面文献很多但我不大了解,就不敢乱说了。我所知道的方法大多基于说话人的i-vector或某些能体现说话人信息的特征。
3)如果要求分离出每个人的说话声,就变成了多说话人分离问题(multi-talker separation)。以目前的发展,在单通道情况一般3人及以下的音频里,分离效果已经不错了,并且新的系统已经能够通过判断有几个人来调整输出(比如只有2个人说话,那么3个输出里有1个输出会是静音)。我们最近的一些工作也在持续提高这个问题下系统的性能。
python把多个人声分离_一段音频中判断多个人声?相关推荐
- 把音频中的某个人声去掉_怎样去掉音频中的背景音乐 只保留人声?
CE可以,软件图标如上.简单好用,方法如下.一.前提必须是标准的立体声音.分离起来非常方便,但一般都不是来.二.如果是单音轨的,也是可以去除的自,但是效果不是很好,始终能够听到一点人声百.1 打开Co ...
- 把音频中的某个人声去掉_能不能把一段音频中的人声和背景音乐分开
能不能把一段音频中的人声和背景音乐分开 能不能把一段音频中的人声和背景音乐分开 [方法一]1.可以尝试使用音频编辑软件Audacity 2.打开音频文件,在特效菜单有个Vocal Remover工具, ...
- python flask 分页前后端分离_【flask + vue 前后端分离博客】创建第一个 Flask RESTFul(一)...
1. 代码管理 1.1 创建仓库 github 上创建仓库:flask-vuejs-madblog,并选择开源协议为 MIT License(也可以选择 gitee,速度快一些比之 github). ...
- python绘制函数曲线x2sin(x2-x-2)_下面哪几个选项中的语句能够完成用fplot语句来绘制函数y=x^3+2*x^2+sin(x)在区间[-5,5]上的图形。...
[单选题]刚性绝热容器采用隔板分为两个部分,A中存在高压空气,B中保持真空,若把隔板抽掉,则整个容器中充满空气,高压空气可视为理想气体(内能(热力学能)是温度的单值函数),此时容器中空气的温度如何变化 ...
- python如何输入n个数字_如何在列表中逐个输入n个数字?
最简单的方法如下:n = int(input()) l = [int(input()) for _ in range(n)] 但是,这有一些问题:它会在无效输入时崩溃. 它评估危险的输入-用户可以修改 ...
- python怎么换行输入而不执行_关于在IDLE中怎么换行继续敲写代码而不执行语句...
查看: 44535|回复: 29 [已解决]关于在IDLE中怎么换行继续敲写代码而不执行语句 电梯直达 发表于 2016-9-30 10:05:49 | 只看该作者 |倒序浏览 |阅读模式 马上注册, ...
- python 比例之差z假设检验_假设检验在数据分析中的应用
前言 Z检验 T检验 独立样本t检验 配对样本t检验 单样本t检验 前言 在这篇文章中,我不会具体去推导检验统计量和相应拒绝域的得出,这对于大部分非统计学专业的人士来说是晦涩的,我只想通过一个案例告诉 ...
- python choice添加下拉框_自定义Django Form中choicefield下拉菜单选取数据库内容实例...
工作中遇到的问题,自定义了一个forms.form表单,某项需要作出下拉菜单,下拉菜单中的选项需要从数据库(objectForm models)中提取. form.py为: class objectF ...
- python的matplotlib库内的函数_如何在matplotlib中找到函数下面的区域?
我是python和matplotlib库的新手,我试图在绘图中得到函数行下方的区域.我有一个变量a&:b,它在我的绘图中移动一个矩形.我也许可以使用原始数学来解决这个问题,但我想知道是否 ...
最新文章
- Java 算法-异或校验和
- PIL实现两张图片合成一张,和图片加文字
- RHEL7恢复.bashrc文件
- jquery导入数据_Web技术——简单的数据库编程
- 使用TensorFlow 2.0+和Keras实现AlexNet CNN架构
- 初始化创建画布_使用HTML5,画布和开放数据创建全球降水(雨)可视化
- Go接口(Interface)的使用方法
- python字典数据的特点_Python核心数据类型之字典15
- SpringAOP 学习笔记
- 斐讯 N1 降级、刷机及 Armbian 安装 [2019.7.23]
- Office批量打印助手(Excel 批量打印、Word 批量打印)
- 精灵图(雪碧图)一招解决定位难问题,再也不用猜位置或者ps测距离了
- 暗影崛起 黑石山 英雄难度 科林酒吧
- 【Python从入门到精通】(一)就简单看看Python吧
- win7添加一个计算机图标,Win7系统任务栏添加计算机图标的步骤图解
- 【离散数学】平凡子群
- 指针练习 - 使用指针找出函数中最大值和最小值
- matlab判断系统因果性,信号与系统如何判定一离散系统的因果稳定性
- Vc++ - qt - 仿照微信聊天窗口 - demov.1.0 初步展示
- 微信小程序云函数安装wx-server-sdk依赖