谢邀,这个问题有几种可能的解读:

1)只需要判断人数,不需要知道他们分别在什么时间说话(number of speakers)

2)判断人数并且知道他们说话的时间点(diarization)

3)判断人数并且分离每个人的说话声(separation)

除此之外还有很多需要考虑的因素。录音环境,比如近场或者远场,单通道或者多通道,也是非常重要的信息;说话人信息也可能影响方法,比如只要求判断事先知道的某些说话人(speaker dependent)或者对任意说话人都要能判断(speaker independent);说话人之间的重叠(overlap)长度也可能影响“判断有几个人在说话”的时间区间(0.3秒内有几个人?1秒内有几个人?等等)。

从问题描述来看我就默认是近场、单通道、说话人无关的情况了(如果不准确还请告知)。多通道的情况会简单一些,因为可以提取说话人的空间信息来做判断。

1)如果只需要知道人数,一个简单的分类器一般就能满足需求,其效果类似一个多说话人的vocal activity detection (VAD)。

2)如果需要知道“谁在什么时间讲话”,问题就变成了speaker diarization问题,这方面文献很多但我不大了解,就不敢乱说了。我所知道的方法大多基于说话人的i-vector或某些能体现说话人信息的特征。

3)如果要求分离出每个人的说话声,就变成了多说话人分离问题(multi-talker separation)。以目前的发展,在单通道情况一般3人及以下的音频里,分离效果已经不错了,并且新的系统已经能够通过判断有几个人来调整输出(比如只有2个人说话,那么3个输出里有1个输出会是静音)。我们最近的一些工作也在持续提高这个问题下系统的性能。

python把多个人声分离_一段音频中判断多个人声?相关推荐

  1. 把音频中的某个人声去掉_怎样去掉音频中的背景音乐 只保留人声?

    CE可以,软件图标如上.简单好用,方法如下.一.前提必须是标准的立体声音.分离起来非常方便,但一般都不是来.二.如果是单音轨的,也是可以去除的自,但是效果不是很好,始终能够听到一点人声百.1 打开Co ...

  2. 把音频中的某个人声去掉_能不能把一段音频中的人声和背景音乐分开

    能不能把一段音频中的人声和背景音乐分开 能不能把一段音频中的人声和背景音乐分开 [方法一]1.可以尝试使用音频编辑软件Audacity 2.打开音频文件,在特效菜单有个Vocal Remover工具, ...

  3. python flask 分页前后端分离_【flask + vue 前后端分离博客】创建第一个 Flask RESTFul(一)...

    1. 代码管理 1.1 创建仓库 github 上创建仓库:flask-vuejs-madblog,并选择开源协议为 MIT License(也可以选择 gitee,速度快一些比之 github). ...

  4. python绘制函数曲线x2sin(x2-x-2)_下面哪几个选项中的语句能够完成用fplot语句来绘制函数y=x^3+2*x^2+sin(x)在区间[-5,5]上的图形。...

    [单选题]刚性绝热容器采用隔板分为两个部分,A中存在高压空气,B中保持真空,若把隔板抽掉,则整个容器中充满空气,高压空气可视为理想气体(内能(热力学能)是温度的单值函数),此时容器中空气的温度如何变化 ...

  5. python如何输入n个数字_如何在列表中逐个输入n个数字?

    最简单的方法如下:n = int(input()) l = [int(input()) for _ in range(n)] 但是,这有一些问题:它会在无效输入时崩溃. 它评估危险的输入-用户可以修改 ...

  6. python怎么换行输入而不执行_关于在IDLE中怎么换行继续敲写代码而不执行语句...

    查看: 44535|回复: 29 [已解决]关于在IDLE中怎么换行继续敲写代码而不执行语句 电梯直达 发表于 2016-9-30 10:05:49 | 只看该作者 |倒序浏览 |阅读模式 马上注册, ...

  7. python 比例之差z假设检验_假设检验在数据分析中的应用

    前言 Z检验 T检验 独立样本t检验 配对样本t检验 单样本t检验 前言 在这篇文章中,我不会具体去推导检验统计量和相应拒绝域的得出,这对于大部分非统计学专业的人士来说是晦涩的,我只想通过一个案例告诉 ...

  8. python choice添加下拉框_自定义Django Form中choicefield下拉菜单选取数据库内容实例...

    工作中遇到的问题,自定义了一个forms.form表单,某项需要作出下拉菜单,下拉菜单中的选项需要从数据库(objectForm models)中提取. form.py为: class objectF ...

  9. python的matplotlib库内的函数_如何在matplotlib中找到函数下面的区域?

    我是python和matplotlib库的新手,我试图在绘图中得到函数行下方的区域.我有一个变量a&amp:b,它在我的绘图中移动一个矩形.我也许可以使用原始数学来解决这个问题,但我想知道是否 ...

最新文章

  1. Java 算法-异或校验和
  2. PIL实现两张图片合成一张,和图片加文字
  3. RHEL7恢复.bashrc文件
  4. jquery导入数据_Web技术——简单的数据库编程
  5. 使用TensorFlow 2.0+和Keras实现AlexNet CNN架构
  6. 初始化创建画布_使用HTML5,画布和开放数据创建全球降水(雨)可视化
  7. Go接口(Interface)的使用方法
  8. python字典数据的特点_Python核心数据类型之字典15
  9. SpringAOP 学习笔记
  10. 斐讯 N1 降级、刷机及 Armbian 安装 [2019.7.23]
  11. Office批量打印助手(Excel 批量打印、Word 批量打印)
  12. 精灵图(雪碧图)一招解决定位难问题,再也不用猜位置或者ps测距离了
  13. 暗影崛起 黑石山 英雄难度 科林酒吧
  14. 【Python从入门到精通】(一)就简单看看Python吧
  15. win7添加一个计算机图标,Win7系统任务栏添加计算机图标的步骤图解
  16. 【离散数学】平凡子群
  17. 指针练习 - 使用指针找出函数中最大值和最小值
  18. matlab判断系统因果性,信号与系统如何判定一离散系统的因果稳定性
  19. Vc++ - qt - 仿照微信聊天窗口 - demov.1.0 初步展示
  20. 微信小程序云函数安装wx-server-sdk依赖

热门文章

  1. postsql——存储(TableSpace)
  2. Eclipse 安装ADT
  3. 给大家一些很经典MLDN李兴华的java web的学习资料 主要是框架部分的
  4. Oracle-数据库对象的使用
  5. Editplus配置
  6. 【操作教程】如何正确使用海康demo工具配置通道上线?
  7. OMG!重磅福利!超大高清显示器免费赠送给读者粉丝!
  8. 奥的斯OTIS电梯电气原理图一般讲解通则-识图
  9. 芒果数据库(MongoDB)学习记录(一)——安装
  10. iOS 源生推送和极光推送