在深度学习、大数据和大算力的推动下,以语音增强、识别和合成为代表的智能语音技术已经在众多应用中落地。特为大家整理了一些比较前沿的报告,文末可免费获取

No.1

智能语音技术新进展与发展趋势

主讲人:谢磊

西北工业大学教授,博导

西工大音频语音与语言处理实验室负责人

摘要:

本次报告将结合西工大音频语音与语言处理研究组的近期研究结果和大家交流智能语音技术的发展现状,重点关注语音增强、识别和合成等方面的最新进展。同时探讨随着场景和应用的不断拓展,智能语音技术的挑战性问题以及展望未来发展。

No.2

端到端声源分离研究进展

主讲人:罗艺

PhD student at Neural acoustic processing lab (Naplab),Columbia University.

摘要:

Recent progress in deep learning methods for the task of source separation have significantly advanced the state-of-the-art.

Among all the recent proposals, end-to-end systems that take waveform as input and directly generate waveforms have shown their advantage on both the system performance and the flexibility. In this talk, I will briefly go through some of the recent advances in the problem of end-to-end neural source separation. I will start with the general problem definition of source separation, then introduce several single-channel and multi-channel approaches, and conclude with the challenges and future works in this area.

扫码免费领取全部报告
↓↓↓

No.3

基于深度学习的多说话人分割聚类

主讲人:张超

剑桥大学Research Associate

京东技术顾问

摘要:

本次公开课首先介绍剑桥大学的传统多说话人分割聚类系统,该系统曾获得ASRU 2015 MGB挑战赛说话人分割聚类任务的冠军,然后介绍团队最近在使用深度神经网络实现分割聚类系统不同部分的一些工作。最后还包括了对多说话人分割聚类研究的一些热点问题的探讨,包括如何实现完整的全神经网络端到端(可训练的)系统以及如何将分割聚类与语音分离和识别进行整合。

No.4

弱标注下的声音事件检测

主讲人:王赟 

Facebook 人工智能应用研究组研究科学家

卡内基梅隆大学(CMU)计算机学院技术研究所(LTI)博士

摘要:

声音事件检测(sound event detection),是指在音频中检测枪声、狗叫等事件,并标出它们的起止时间。由于为训练数据手工标准起止时间很麻烦,所以实际训练数据常常只带有弱标注——只标注了每段声音包含的事件类型,但未标注起止时间。本场讲座讨论如何使用「多样例学习」(multiple instance learning)方法,利用弱标注数据训练声音事件检测系统,重点在于如何选取聚合函数,保持误检和漏检的平衡。本场讲座得到的经验,也可以借鉴到其它使用「多样例学习」的任务中。

No.5

智能语音发展现状以及数据集介绍

主讲人:陈果果

SEASALT.AI联合创始人

约翰霍普金斯大学博士

摘要:

针对目前语音领域问题进行分享与探讨,例:智能语音在嵌入式设备端落地时,相比于服务器端有哪些需要考虑因素;同时结合自身科研及创业经验给到科研同行、在校学生、一些实用建议,让大家少走弯路!

No.6

口音与方言语音识别研究进展

主讲人:汤志远

中科院与清华联培博士

清华博士后

摘要:

语音识别技术已广泛应用于日常生活当中,然而其在口音或方言上的性能或体验仍不尽如人意。本次报告对近几年口音与方言语音识别上的研究进展进行了快速的回顾,并进一步介绍了口音或方言语音识别相关的数据、基准和竞赛,以及一些可行的研究方向。

扫码免费领取全部报告
↓↓↓

2022 智能语音技术最新进展与发展趋势相关推荐

  1. 智能语音技术新进展与发展趋势

    在深度学习.大数据和大算力的推动下,以语音增强.识别和合成为代表的智能语音技术已经在众多应用中落地. 本次报告特邀西工大谢磊教授结合西工大音频语音与语言处理研究组的近期研究结果与大家交流分享-(文末免 ...

  2. 智能语音技术新发展与发展趋势

    本文总结于西工大音频语音与语言处理实验室(ASLP@NPU)负责人-谢磊教授在深蓝学院的公开课--智能语音技术的新进展与发展趋势-NPU-ASLP视角. 大家好!感谢深蓝学院的邀请!我代表西工大音频语 ...

  3. 技术解读 | 科大讯飞语音技术最新进展之二:语音识别与语音合成

    这一篇内容将围绕语音识别与合成方向,继续为大家带来相关技术解析. "风物长宜放眼量".面向人机交互更加自然流畅的未来,智能语音技术进展如何?该走向何方? 以下内容根据讯飞研究院杰出 ...

  4. 西工大实验室负责人谢磊教授:智能语音技术新发展与发展趋势

    本文总结于西工大音频语音与语言处理实验室(ASLP@NPU)负责人-谢磊教授在深蓝学院的公开课--智能语音技术的新进展与发展趋势-NPU-ASLP视角. 大家好!感谢深蓝学院的邀请!我代表西工大音频语 ...

  5. 太赞了!智能语音技术年终报告:谢磊教授、王赟博士、罗艺博士…

    1.智能语音技术新进展与发展趋势 谢磊 西北工业大学教授,博导 西工大音频语音与语言处理实验室(ASLP@NPU)负责人 2.弱标注下的声音事件检测 王赟 卡内基梅隆大学(CMU)计算机学院语言技术研 ...

  6. 2022业界广告推荐技术最新进展与趋势:阿里、腾讯、字节、微软

    猜你喜欢 0.淘宝首页猜你喜欢推荐建模实践 1.[免费下载]2022年8月份热门报告 2.[实践]小红书推荐中台实践 3.微信视频号实时推荐技术架构分享 4.对比学习在宽狩推荐系统中的应用实践 5.微 ...

  7. 2022 SpeechHome 语音技术研讨会-回顾

    2022年11月13日,第二届SpeechHome语音技术研讨会和第七届Kaldi技术交流会圆满落幕.本届SpeechHome语音技术研讨会由中国计算机学会.深圳市人工智能学会.小米集团.腾讯天籁实验 ...

  8. 推荐系统[一]:超详细知识介绍,一份完整的入门指南,解答推荐系统相关算法流程、衡量指标和应用,以及如何使用jieba分词库进行相似推荐,业界广告推荐技术最新进展

    搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排精排重排混排).系统架构.常见问题.算法项目实战总结.技术细节以及项目实战(含码源) 专栏详细介绍:搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排 ...

  9. 智能语音技术的深度解析

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯云AI中心发表于云+社区专栏 广义上来讲智能语音技术有各种各样的定义,以上是常见的一些热门的场景.语音识别,刚才罗老师也分享了部分 ...

最新文章

  1. BackboneFast
  2. python3 安装 mysql 用pip install PyMySQL
  3. UF_DRAW_set_view_display 使用问题
  4. 算法------------数组----------------两个数组的交集 II
  5. 仪器和软件通讯测试软件,软件定义的仪器-测试测量-与非网
  6. JavaWeb——Get、Post请求中文乱码问题
  7. Flask安装首页显示
  8. iOS中,在类的源文件(.m)中,@interface部分的作用?
  9. 中小学教师计算机应用,关于中小学教师计算机应用教育的思考
  10. PHP常用函数总结(一):
  11. 无线路由器和无线网卡的普及知识贴及选择(2019.05更新802.11AX网卡,3T3R wave2路由器推荐)
  12. HTML编辑器-HTML网页表单可视化在线编辑器插件大全
  13. 金山要剥离WPS词霸等,会不会是Google的一大阴谋?!
  14. 【校招VIP】产品行测考察之逻辑推理
  15. 总和生育率模型matlab,中国人口增长预测 灰色模型——全国数学建模大赛
  16. ubuntu工作站配置
  17. 今日学习之Javascript
  18. win10计算机本地连接属性在哪里,Win10系统打开本地连接属性的方法
  19. Cube、Cuboid 和 Cube Segment
  20. 腾讯云从业者认证的作用是什么?考试包含哪些内容?

热门文章

  1. 头部互金科技负责人领路知识图谱
  2. 风控上模型中的大小卡、主路旁路的应用
  3. 风控成长之路---必知必会工具与业务
  4. MYSQL的递归查询
  5. selenium的定位方式
  6. 用R设定随机种子的目的和方法
  7. Git学习笔记总结和注意事项
  8. 第十三讲 ASP.NET中的错误处理和程序优化
  9. 志愿者公交车上当导游(图)
  10. JAVA---事件适配器----用内部类,匿名类实现事件处理