【语音之家】AI产业沙龙—如何应用k2开发语音识别系统
由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、小米集团、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—如何应用k2开发语音识别系统,将于2022年9月22日19:00-20:35线上直播。
参会嘉宾
姚增伟
嘉宾简介:姚增伟,小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,硕士毕业于哈尔滨工业大学,主要研究方向为语音识别。
分享主题:新一代 Kaldi 中的 Reworked Conformer 模型以及基于多码本向量量化的蒸馏方案
摘要:本报告将介绍近期新一代 Kaldi 项目的两个核心贡献点。针对 Conformer 模型存在的问题进行改进,实现了训练稳定、性能更优的 Reworked Conformer 模型,其核心思想已拓展应用于 Emformer 和 LSTM 等模型中。基于多码本向量量化的蒸馏方案,通过将 teacher 模型的高维(如 1280 维)的 float 向量量化为极少数个(如 8 个)uint8 类型的码本索引,显著地降低了存储空间,并基于量化结果进行高效蒸馏。
匡方军
嘉宾简介:匡方军,小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,主要研究方向为语音识别。
GitHub:https://github.com/csukuangfj
分享主题:新一代 Kaldi 部署框架 sherpa 分享
摘要:本报告将介绍如何使用新一代Kaldi 部署框架sherpa 在不同平台 (Linux/macOS/Windows/Raspberry Pi 等) 进行语音识别。
沙龙议程
参加方式
点击下方传送门进入CSDN直播间:
【语音之家】AI产业沙龙—如何应用k2开发语音识别系统-CSDN直播
【语音之家】AI产业沙龙—如何应用k2开发语音识别系统相关推荐
- 【语音之家】AI产业沙龙—火山语音在AI视频译制方向的技术探索与实践
由CCF语音对话与听觉专委会 .中国人工智能产业发展联盟(AIIA)评估组.火山语音.语音之家.希尔贝壳共同主办的[语音之家]AI产业沙龙-火山语音在AI视频译制方向的技术探索与实践,将于2022年1 ...
- 【语音之家】AI产业沙龙—语音技术在贝壳的应用
由CCF语音对话与听觉专委会 .中国人工智能产业发展联盟(AIIA)评估组 .贝壳找房语音团队.语音之家.北京希尔贝壳科技有限公司共同主办的[语音之家]AI产业沙龙-语音技术在贝壳的应用,将于2022 ...
- 【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍
由CCF语音对话与听觉专委会 .中国人工智能产业发展联盟(AIIA)评估组.快商通.语音之家.北京希尔贝壳科技有限公司共同主办的[语音之家]AI产业沙龙-VoxSRC-22说话人识别挑战赛快商通方案介 ...
- 【语音之家】AI产业沙龙—自动语音识别利器 - NVIDIA NeMo
由CCF语音对话与听觉专委会 .中国人工智能产业发展联盟(AIIA)评估组.NVIDIA.语音之家.希尔贝壳共同主办的[语音之家]AI产业沙龙-自动语音识别利器 - NVIDIA NeMo,将于202 ...
- 【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践
由CCF语音对话与听觉专委会 .中国人工智能产业发展联盟(AIIA)评估组.京东科技.语音之家.希尔贝壳共同主办的[语音之家]AI产业沙龙-京东在AI语音方向的技术探索与实践,将于2022年11月29 ...
- 助力AI语音开发者的社区-语音之家
语音之家简介 语音之家成立于2021年4月,是一家助力AI语音开发者的社区,我们希望通过知识传播.在线学习.资源分享.各类活动等方式提供全生命周期的服务,帮助全球的AI语音开发者获得成长,洞见AI语音 ...
- 让一群脑洞清奇的开发者告诉你,AI+产业的N种可能
作者:藏狐 来源:脑极体(ID:unity007) 一般来看,一场成功的.胜利的AI行业大会,往往是这样的:主持人大谈AI技术是多么神奇.智能转型多么重要.产业价值多么庞大.然后一群专家(最好有外国人 ...
- 语音识别系统报告_2018-2024年中国语音识别系统行业市场发展格局及投资价值评估研究报告_中国产业信息网...
报告目录: 章语音识别系统行业相关概述 第一节语音识别系统行业相关概述 一.产品概述 二.产品特点 三.产品分类 四.产品用途 第二节语音软件行业经营特征 第三节语音识别系统行业经营模式分析 第二章语 ...
- python语音输入功能_“在Python中如何实现一点按钮就出现语音输入语音,输入语音后可以自动翻译为文字的程序?“python语音识别教程...
Python用什么模块开发语音识别系统 使用YQ5969,这个语音识别模以支持1--8个咪头,还可以支持本地和识别不同需求.5米内本地识别 93%以上,云端识别率97%.这个语音识别模块可以滤除噪声. ...
最新文章
- 编译报错field has incomplete type
- urb数据结构【转】
- 安全访问服务边缘(SASE)是什么?
- mysql 小数点后几位不足补0初始化
- Python模块内置函数
- php毕设周记_毕设周记
- Windows 安装Angular CLI
- pytorch学习——构建多元线性回归的网络结构
- python大神读取_大神教你python 读取文件并把矩阵转成numpy的两种方法
- 使用严苛模式打破Android4.0以上平台应用中UI主线程的“独断专行”
- 计算机制图基本知识6,机械制图基础知识
- Voldemort启动失败案例一则
- window7电脑调屏幕亮度的方法
- IndexedDB数据库
- 计算机分子模拟聚乙烯,高分子物理虚拟实验讲义
- python中新式类和经典类的区别
- 2020年30岁IT人失业的一些感悟,希望对年轻人有帮助
- flutter, `get_ip` does not specify a Swift version and none of the targets (`Runner`) integrating...
- Zephyr启动过程与中断响应
- Navicat导出pdf