Zheng-Hua Tan 的主页:

http://kom.aau.dk/~zt/index.htm#Research interests

(谭政华博士曾经是美国麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的客座科学家/教 授,上海交通大学电子工程系副教授以及韩国科学技术 院计算机科学系人工智能实验室的博士后。他现在是丹麦奥尔堡大学电子系统系教授,声学信号处理研究中心的联合创始人和联合负责人。他于1999年在上海交 通大学获博士学位,1990和1996年在湖南大学分别获学士和硕士学位。

他的研究兴趣包括机器学习,深度学习,模式识别,语音识别,说话人识别,噪声鲁棒语音处理(语音增强和分离,鲁棒特征,语音活动检测),多模式(视听)信 号处理,社交机器人(建立了一个称为iSocioBot的多模式互动社交机器人),以及推荐系统,这是他过去二十年来的主题。他在IEEE / ACM-TASLP,IEEE-TNNLS,IEEE-TKDE,IEEE-TMM,IEEE-TAC,IEEE-TCE,IEEE-TSG,IEEE- J-STSP,IEEE-SPL IEEE INTELL SYST,Neurocomputing ,CSL,SpeechComm,ICASSP,INTERSPEECH等上发表了180篇论文。 他主持编写的《移动设备和通信网络中的自动语音识别》由Springer出版(2008)。

他是IEEE信号处理协会,机器学习用于信号处理委员会(MLSP TC)的当选成员,以及2018年IEEE第28届机器学习用于信号处理国际研讨会(MLSP2018)的主席。 他是或曾是 Elsevier 计算机语音和语言学报,Elsevier 数据信号处理学报,Elsevier 计算机和电气工程学报,和Inderscience 数据挖掘建模和管理学报的编委(Editorial Board Member / Associate Editor)。他曾是IEEE信号处理选题 学报的首席客座编辑,和 Elsevier 计算机和电气工程学报以及Neurocomputing等的客座编辑。同时,他担任过许多重要国际 会议的总主席,程序委员会主席,领域主席,特殊程序主席,专题报告演讲人,组委会和程序委员会成员。他是国际电气和电子工程师协会高级会员和国际语 音通信联合会(ISCA)会员。

他曾获得欧盟委员会“地平线2020”,丹麦自主研究委员会,丹麦创新基金会,丹麦战略研究委员会以及工业界的研究经费,从事机器学习,深度学习,语音和 多模式信号处理领域的研究,并用于智能互动机器。)

**

Israel Cohen的主页:

**

https://israelcohen.com/software/

(以色列科恩(M’01-SM’03-F’15)是以色列海法以色列理工学院的电气工程教授。他还是中国西安西北工业大学的客座教授。他获得了理学士学位。(Summa Cum Laude),理学硕士 和博士 以色列海法以色列理工学院分别于1990年,1993年和1998年获得电气工程学位。从1990年到1998年,他是以色列国防部海法RAFAEL研究实验室的研究科学家。1998年至2001年,他是美国康涅狄格州纽黑文耶鲁大学计算机科学系的博士后研究员。2001年,他加入了以色列理工学院的电气工程系。他是Springer语音处理手册(Springer,2008)的多声道语音处理部门的编辑,是信号增强和阵列信号处理基础(Wiley-IEEE Press,2018)的合着者,以及2010年的通用联合主席国际声学回声和噪声控制研讨会。

他曾担任欧洲信号处理协会期刊的客座编辑,该期刊是关于多麦克风语音处理进展的信号处理特刊和Elsevier语音通信期刊的一个特别问题。他的研究兴趣是阵列处理,统计信号处理,声学信号分析和建模,语音增强,噪声估计,麦克风阵列,源定位,盲源分离,系统识别和自适应滤波。

他被授予Norman Seiden学术卓越奖(2017年),SPS信号处理快报最佳论文奖(2014年),Alexander Goldberg卓越研究奖(2010年),以及Muriel和David Jacknow卓越教学奖( 2009)。他是IEEE音频和声学信号处理技术委员会的准会员。他曾担任IEEE语音和音频处理交易副主编(2004-2007); IEEE SIGNAL PROCESSING LETTERS副主编(2004-2008); 会员,IEEE音频和声学信号处理技术委员会(2012-2017); 和 IEEE语音和语言处理技术委员会成员(2013-2015)。

他是IEEE“为语音增强的理论和应用做出贡献”的研究员。他是IEEE信号处理协会(2019-2020)的杰出讲师。)

Lawrence Rabiner的主页:

https://www.ece.ucsb.edu/Faculty/Rabiner/ece259/

(数字信号处理,数字语音处理,多媒体通信,多模处理(声音、视觉、触觉输入的融合),共享现实系统)

Xie Lei的主页:

http://lxie.npu-aslp.org/intro2aslp.htm

(谢磊,西北工业大学计算机学院教授、博士生导师,音频语音与语言处理研究组负责人。2001年至2002年,在比利时布鲁塞尔自由大学担任访问学者。2004年至2007年,分别在香港城市大学创意媒体学院和香港中文大学系统工程与工程管理学系从事研究工作。2007年作为海外引进人才受聘于西北工业大学计算机学院。获得教育部“新世纪优秀人才支持计划”、陕西省青年科技新星、西安市青年科技奖、亚太信号与信息处理协会(APSIPA)杰出讲学专家等荣誉。研究领域包括音频、语音与语言处理、多媒体技术、机器学习、人机交互等。在包括IEEE/ACM Transactions on Audio, Speech and Language Processing、IEEE Transactions on Multimedia, IEEE Journal of Selected Topics in Signal Processing、Pattern Recognition, ACL,ACM Multimedia,Interspeech, ICASSP在内的重要期刊和会议上发表论文150余篇,获得多项学术会议最佳论文奖和重要国际评测第一名。主持多项国家级科研项目,同时与华为、百度、微软、腾讯、阿里巴巴、搜狗、小米、京东、三星、云知声、出门问问、同盾、字节跳动等十余家业界著名企业开展了广泛深入的技术合作,研究成果在企业中获得广泛应用。担任重要学术会议各类主席30余次,包括第十届国际中文口语语言处理学术会议(ISCSLP2016)程序委员会主席、第十一届全国人机语音通讯学术会议(NCMMSC2011)程序委员会主席、2018中国多媒体大会(ChinaMM2018)程序委员会主席、第三届亚太信号与信息处理协会年度峰会(APSPA ASC2011)组织主席等。谢磊教授目前担任语音领域顶级期刊IEEE/ACM Transactions on Audio, Speech and Language Processing的编委。谢磊教授是中国计算机学会(CCF)语音对话与听觉专业组常务委员、中国中文信息学会理事、中国中文信息学会语音信息专业委员会副主任,亚太信号与信息处理协会(APSIPA)语音语言与音频学术委员会委员、国际中文口语语言处理兴趣小组(SIG-CSLP)工作组主席、NCMMSC常设机构委员、中国计算机学会多媒体专业委员会委员、IEEE高级会员、中国计算机学会高级会员等。)

Philip Loizou的主页:

https://ecs.utdallas.edu/loizou/

(他的研究兴趣是信号处理,语音处理和人工耳蜗移植。Loizou博士目前致力于语音处理算法的开发,这将有助于听力障碍人群,特别是人们佩戴人工耳蜗。他对人工耳蜗植入物的研究由美国国立卫生研究院(NIH)资助,并获得NIH颁发的1998年香农奖。他是教科书语音增强:理论与实践(CRC出版社,2007年)的作者,也是教科书“信号与系统实验室互动方法”(National Instruments,2008)的合着者。 现代盲信号分离算法的进展:理论与应用(Morgan&Claypool Publishers,2010。Loizou博士是美国声学学会会员。他曾 在美国国立卫生研究院(NIH )担任听觉系统(AUD)研究部门(2007-2011)的指定成员,负责审查R01关于听觉和前庭系统结构和功能的申请。他目前是IEEE生物医学工程学报和国际听力学杂志的副主编。他是 IEE E语音和音频处理交易 (1999-2002),IEEE信号处理快报(2006-2009)的副主编,并担任IEEE信号处理协会(2007-2009)语音技术委员会成员。他是德克萨斯州达拉斯市(2010年3月14日至19日)举行的声学,语音和信号处理国际会议(ICASSP)组委会成员, 并担任该会议的教程主席。)

Jacob Benesty的主页:

http://externe.emt.inrs.ca/users/benesty/

(Jacob BENESTY于1987年获得法国Pierre&Marie Curie大学的微波硕士学位,并获得博士学位。1991年4月 在法国奥赛大学获得控制和信号处理学位。在博士期间 (从1989年11月到1991年4月),他在法国巴黎的国家电信中心(CNET)从事自适应滤波器和快速算法研究。从1994年1月至1995年7月,他在巴黎电信大学工作,研究多通道自适应滤波器和声学回声消除。从1995年10月到2003年5月,他首先担任美国新泽西州Murray Hill贝尔实验室的顾问,然后成为技术人员。2003年5月,他加入魁北克大学,INRS - EMT,位于加拿大魁北克省蒙特利尔,担任教授。他还是以色列海法的以色列理工学院的客座教授,以及丹麦奥尔堡大学的兼职教授(音频分析实验室,AD:MT,奥尔堡大学)。

他的研究兴趣是信号处理,声学信号处理和多媒体通信。他是许多重要技术的发明者。特别是,他是贝尔实验室的首席研究员,他构思并设计了世界上第一个实时免提全双工立体声电话会议系统。此外,他构思并设计了世界上第一个基于PC的多方免提全双工立体声会议系统,通过IP网络。他是该系列丛书的编辑:Springer信号处理专题。他是许多国际会议的主席和技术主席,也是几个IEEE技术委员会的成员。他的四篇期刊论文由IEEE信号处理协会授予,并于2010年获得罗马尼亚学院颁发的Gheorghe Cartianu奖。他与人合着并共同编辑/合着了许多声学信号处理领域的书籍。)

Sharon Gannot的主页:

http://www.eng.biu.ac.il/gannot/

(自2010年1月起成为IEEE 音频和声学信号处理(AASP)技术委员会的成员,并自2017年1月起担任委员会主席。本人也是声学特别区域小组的成员, 欧洲信号处理协会(EURASIP)的语音和音乐信号处理。自2005年以来,我还是国际声学信号增强研讨会(IWAENC)的技术和指导委员会成员,并且是2010 年8月在以色列特拉维夫举行的IWAENC 2010的联合主席 。我还担任过IEEE信号处理应用于音频和声学研讨会(WASPAA)的联合主席)于2013年10月在美国纽约州新帕尔兹举行。我被选中的国际会议声学,语音和信号处理(ICASSP)2012年提出指导课程,欧洲信号处理会议(EUSIPCO)2012,ICASSP 2013年和EUSIPCO 2013年,并在IWAENC主题演讲2012亚琛德国,LVA / ICA 2017 Grenoble France,以及2018年10月在德国奥尔登堡举行的第13届ITG语音通信会议。我的研究兴趣包括统计信号处理,统计推断和机器学习以及语音处理应用。特别是:

A.单麦克风语音增强和源分离。

B.用于源定位和采集以及降噪的阵列处理技术。应用于语音增强,回声消除和去噪。

C.线性和非线性最优滤波。递归贝叶斯和非贝叶斯推断应用于语音处理。

D.系统识别技术和自适应滤波。

E.助听设备的语音处理。

F.用于无线和ad hoc麦克风阵列的分布式算法。

G.语音处理中的数据驱动方法(例如流形学习,深度学习)。)

Deliang Wang的主页:

http://web.cse.ohio-state.edu/~wang.77/

(该实验室最近的工作重点是机器学习算法,特别是深度神经网络(DNN),用于听觉场景分析。为了实现构建在鸡尾酒会环境中实现人类能力的鸡尾酒会处理器的最终目标,必须理解个体分析,例如音调,位置,幅度和频率调制,起始/偏移,节奏等。还必须包括自上而下的信息,包括注意力和认可度。该实验室在计算视听的一般主题下进行各种研究,包括语音分离和强大的语音识别/说话人识别。例如,这个实验室起源于理想二元掩模的概念(Wang,2005),将声音隔离定义为分类问题。该公式使得能够使用监督学习来解决源分离问题(称为监督分离)。本实验室是第一个将DNN引入语音分离或增强领域的实验室(Wang&Wang,2013),由此产生的基于DNN的算法首次为听力受损的听众提供了大量的语音智能改进(背景噪音)Healy等。)

作者:king_audio_video
来源:CSDN
原文:https://blog.csdn.net/king_audio_video/article/details/87874233
版权声明:本文为博主原创文章,转载请附上博文链接!

语音信号预处理大牛信息相关推荐

  1. VsCode 语音注释, 让信息更丰富 (上)

    前端瓶子君,关注公众号 回复算法,加入前端编程面试算法每日一题群 vscode语音注释, 让信息更丰富 (上) 这个系列我会将我制作"语音注释"插件的完整过程分享出来, 还是那句话 ...

  2. 用于深度神经网络的语音信号预处理

    1. 预备知识(基础概念) 详见 https://blog.csdn.net/shanx_s/article/details/52947007 详见 https://blog.csdn.net/Bar ...

  3. 语音信号处理-1-----语音信号预处理

    From:BUPT某非著名小白研究生,因研究语音信息处理,因基础知识薄弱,又不甘颓废当个咸鱼,写一些赵力<语音信号处理>此书的一些理解.写博客以鞭策自己前进.(实在觉得书本上好多废话,就在 ...

  4. Python文字转换语音,抠脚大汉秒变撒娇萌妹

    APP 也有文字转换为语音的功能,虽然听起来很别扭,但是基本能解决长辈们看不清文字或者眼睛疲劳,通过文字转换为语音来获取信息. 我们用 Python 能否实现文字转语音呢,可以的,百度有个语音接口,可 ...

  5. MATLAB语音端点检测

    第一章 绪论 Matlab是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发.数据可视化.数据分析以及数值计算的高级技术计算语言和交 ...

  6. 《MATLAB语音信号分析与合成(第二版)》:第8章 基音周期的估算方法

    <MATLAB语音信号分析与合成(第二版)>:第8章 基音周期的估算方法 前言 1. 数据与函数路径设置 2. MATLAB仿真一:基音周期提取的预处理 3. MATLAB仿真二:倒谱法的 ...

  7. 《MATLAB语音信号分析与合成(第二版)》:第10章 语音信号的合成算法

    <MATLAB语音信号分析与合成(第二版)>:第10章 语音信号的合成算法 前言 1. 数据与函数路径设置 2. MATLAB仿真一:重叠相加法语音合成 3. MATLAB仿真二:重叠存储 ...

  8. 语音情感识别--理论篇

    这是之前看的一些论文,然后提炼一下可能经常想看到的东西吧. 语音情感识别主要包括语音语料库的采集,语音信号预处理,语音情感特征提取,语音情感分类.以上为语音情感识别主要步骤. 语音情感特征提取(1): ...

  9. 语音合成的思路、语音的声学特征、声音采样的一些资料

    语音合成:把语音波形文件重现,以一种灵活的方式,只用极少数的基础数据,比如元音辅音的语音参数,那么首先需要研究元音辅音的语音学性质. 先从元音开始,根据相关资料,不同的元音是由相同的原始声带音通过不同 ...

最新文章

  1. 2016012017+小学四则运算练习软件项目报告
  2. linux死锁检测的一种思路【转】
  3. Fragment中调用getActivity为null的问题
  4. 获取SQL Server 2000数据库和表空间使用信息
  5. 如何删除Cookie?
  6. 运动检测(前景检测)之——ViBe
  7. oracle 连 db2,数据库连接客户端使用(db2,oracle,mysql)
  8. SQL Server 2008 阻止保存要求重新创建表的更改问题的设置方法
  9. vmware安装mac
  10. hdu 1421 动态规划
  11. Keras和TensorFlow的关系和区别
  12. 华为鸿蒙麒麟玉兔_华为P50除了麒麟9000,还预装鸿蒙系统,比iPhone12值得买
  13. java 7 的新特性
  14. (5)通过输入参数(测量数据)构建二维体模型(01)
  15. 什么是VR、AR和MR
  16. 【转】拉勾网 - 《2016互联网职场生态白皮书》
  17. 洛谷P1005 矩阵取数游戏
  18. 用c 语言的英文标识 阶乘,求10000的阶乘(c语言代码实现)
  19. COCOS-BCX|区块链项目介绍
  20. python可以做数据库功能吗_python可以用哪些数据库

热门文章

  1. 【好工具】在线免费无限制的PDF处理工具(转换、编辑、分割、合并、压缩)...
  2. 论文笔记——基于多传感器融合的移动机器人SLAM算法研究
  3. 大华大屏显示高清服务器4u,大华DAHUA国内大华视频综合平台增强型主机DH-M70-4U-E-I产品中心_DAV数字音视工程网...
  4. tvOS UICollectionViewCell上添加UIButton改变焦点Focus
  5. 学习 《大话设计模式》笔记
  6. VISIO 2007 修改形状默认字体 自定义模具
  7. Gilab pipeline 报错 fatal: unable to access https://gitlab-ci-token ... Could not resolve host
  8. 计算机网络课程设计网络嗅探器
  9. vue中使用xlsx导出Excel 并设置样式,解决未完全合并单元格框线的BUG
  10. 使用alter table tabname ENGINE=InnoDB后占用的空间更大