声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。

Summary On The ICASSP 2022 Multi-Channel Multi-Party Meeting Transcription Grand Challenge

本文为阿里等单位在2022.02.08更新的文章,主要对icassp 2022 M2MeT挑战赛的方案总结​:speaker diarization  and multi-speaker ASR ​。具体的文章链接https://arxiv.org/pdf/2202.03647.pdf


(文章只摘要具体方案的结果,不做详细讲解,该领域的读者看看各种方案也就了解的差不多。另外我对于Speaker diarization也不熟悉)

1 简介

现实的多人会议场景转录的任务是近几年研究的热点,The ICASSP 2022 Multi-Channel Multi-Party Meeting Transcription Challenge (M2MeT)挑战赛是对该场景提供交流​的平台。本挑战赛主要分为speaker diarization和multi-speaker ASR赛道,使用的数据为120小时的8通道现实会议场景数据AliMeeting 。评价指标分别为Diarization Error Rate (DER) and Character Error Rate (CER) 。

2 方案总结

Speaker diarization基准系统为Kaldi-based diarization system

Multi-speaker ASR基准系统为 single speaker baseline  is ConfomerA​,multiple speakers baseline  is Serialized Output Training (SOT)。基准系统在测试集上的性能分别为table 1和table 2。

​Speaker diarization赛道有14支队伍参赛,其中top8的采用的方案如table 3所示。Multi-speaker ASR赛道的top5的方案如table 4所示​。(其实这些参赛方案的各种技巧组合仅作为参考)

语音识别(ASR)论文优选:Icassp 2022 M2MeT方案总结相关推荐

  1. 语音识别(ASR)论文优选:端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  2. 语音识别(ASR)论文优选:A comparison of streaming models and data augmentation methods for robust speech recog

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  3. 语音识别(ASR)论文优选:车内场景粤语指令数据集CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command Recogni

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  4. 语音识别(ASR)论文优选:性能测试Wav2Vec2.0 on the Edge: Performance Evaluation

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  5. 语音识别(ASR)论文优选:关注语音识别系统Fairness问题Towards Measuring Fairness in Speech Recognition

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  6. 语音识别(ASR)论文优选:挑战ASR规模极限Scaling ASR Improves Zero and Few Shot Learning

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  7. 语音识别(ASR)论文优选:Adapting GPT, GPT-2 and BERT Language Models for Speech Recognition

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.如转载,请标明出处.欢迎 ...

  8. 语音识别(ASR)论文优选:Tied Reduced RNN-T Decoder

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.如转载,请标明出处.欢迎 ...

  9. 2022年2月语音合成(TTS)和语音识别(ASR)论文月报

    论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://yql ...

最新文章

  1. 网络推广方案分享网站想要更快的优化到首页的技巧!
  2. 如何在VB例程中接收自定义消息
  3. Android WebView 和 javaScript的互相调用(二)
  4. [数据库]---mysql 插入sql之 INSERT INTO和INSERT IGNORE INTO和REPLACE INTO和ON DUPLICATE KEY UPDATE比较应用
  5. jdbc版本低MySQL版本高_Mysql JDBC驱动版本与Mysql版本的对应问题解决
  6. 一些算法(最短路,线段树,01,完全背包,STL)的基本参考资料
  7. Linux安装中文字体_宋体
  8. 出现警告defaultlib library conflicts with use of other libs; use /NODEFAULTLIB:library .
  9. jstl之c:forEach的使用
  10. macOS Big Sur无法安装 Big Sur为什么安装不了?
  11. Firebird 问题总结
  12. Involution: Inverting the Inherence of Convolution for Visual Recognition(CVPR2021)
  13. 老男孩教育运维班100台规模集群存储系统搭建及数据实时备份上机实战
  14. dell服务器 指示灯_Dell PowerEdge服务器或PowerVault存储诊断LED指示灯(QuadPack)故障排除...
  15. 用c# 实现一个爬虫
  16. 维生素C(抗坏血酸)摄入过多有啥后果?
  17. android app自动拍照6,6款手机拍照处理软件,大片生成,值得点赞收藏,不快来看一下?...
  18. linux后台运行服务
  19. 为什么HTTPS通信中需要CA机构颁发的SSL证书
  20. android 渠道排名,10月安卓渠道数据分析:网游收入榜MMO占26%排名第1

热门文章

  1. HTML中字体和字体图标的应用
  2. java面试题_度小满一面_java面经汇总
  3. 比亚迪元EV汽车拆解报告
  4. 研发人员的工时为何需要管理?
  5. at89c2051 定时器用法 c语言编程资料,用AT89C2051单片机制作的数字电容表.doc
  6. 检测用户中的异常--UEBA方法
  7. Windows找不到文件‘Chrome‘。请确定文件名是否正确后,再试一次
  8. 这三个移动互联网案例让你大胆追梦
  9. nvm 安装node版本报错clang: error: no such file or directory: ‘CXX=c++‘
  10. C语言笔记本电脑销售系统课设