语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

\\

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

\\

Mozilla计划从2017年六月份开始收集总时长约10,000个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It's a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla有可能会将该语音识别引擎集成到Firefox中。

\\

该项目在Github上的链接:https://github.com/mozilla/voice-web

\\

查看英文原文: Project Common Voice

\\


感谢蔡芳芳对本文的审校。

\

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号:InfoQChina)关注我们。

Mozilla “Common Voice” 开源语音识别项目相关推荐

  1. TFASR 开源语音识别项目解构

    TFASR 开源语音识别项目解构 模型下载 AM pan.baidu.com/s/1NPk17DUr0-lBgwCkC5dFuQ 7qmd aishell-1(20 epochs) LM pan.ba ...

  2. Mozilla发布最大公共语音数据集Common Voice

    近日,Mozilla发布了当前可使用的,规模最大的公共语音数据集Common Voice,数据集涵盖18种语言,由42000多名贡献者提供的近1400小时的语音数据构成. 文 / George Rot ...

  3. Mozilla发布最大的人类语音数据集(Common Voice)

    Common Voice 项目是 Mozilla 发起的倡议,旨在帮助教会机器真人的说话方式.昨天发布了最大的人类语音公共数据集,称为Common Voice.该数据集由18种不同的语言(包括英语,法 ...

  4. 最新C#开源资源项目

    一.AOP框架 Encase 是C#编写开发的为.NET平台提供的AOP框架.Encase 独特的提供了把方面(aspects)部署到运行时代码,而其它AOP框架依赖配置文件的方式.这种部署方面(as ...

  5. 开源python语音识别_5 款不错的开源语音识别/语音文字转换系统

    语音文字转换(speech-to-text)(STT)系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式. 语音文字转换技术非常有用.它可以用到许多应用中,例如自动转录 ...

  6. .NET开源开发项目

    .NET开源开发项目 本文列出了.NET开源开发项目(open source developer projects).意在包括对开发过程的所有方面有所帮组的项目.对于消费项目(con 本文列出了 .N ...

  7. .NET 开源开发项目【翻译】

    原文地址 本文列出了 .NET 开源开发项目(open source developer projects).意在包括对开发过程的所有方面有所帮组的项目.对于消费项目(consumer project ...

  8. .NET 开源开发项目

    2019独角兽企业重金招聘Python工程师标准>>> 本文列出了 .NET 开源开发项目(open source developer projects).意在包括对开发过程的所有方 ...

  9. 这 25 个开源机器学习项目,一般人我不告诉 Ta

    本文为 AI 研习社编译的技术博客,原标题 : 25 Open-Source Machine Learning Repos to Inspire Your Next Project 作者 | Khoa ...

最新文章

  1. Xcode中通过删除原先版本的程序来复位App
  2. 【跃迁之路】【448天】刻意练习系列207(2018.04.29)
  3. eclipse打包项目为aar_eclipse中将项目打包成jar的两种方法,及其问题与解决方法...
  4. [数据库] Navicat for Oracle基本用法图文介绍
  5. 跟踪源码运行流程---SpringMVC学习笔记(四)
  6. android webview控件的缩放问题 隐藏缩放控件
  7. 【HDU - 6231】K-th Number(二分,思维)
  8. linux操作-centos下载mysql
  9. 为什么学习Python数据分析,python数据分析有什么用?
  10. Git命令集十四——抓取命令
  11. python中io中的+模式_Python的高级特性,模块和IO操作
  12. HTML day02(html列表与菜单的制作)
  13. 基于JEECG框架,前台VUE,后台java,导入导出
  14. 易语言文件夹加密解密助手
  15. 商淘多b2b2c商城系统怎么在个人电脑上安装_真正开源免费可商用的电子商务系统...
  16. 【读书笔记】《Web全栈工程师的自我修养》
  17. 教你如何简单快速有效的添加微信好友
  18. 分布式链路追踪系统深入理解
  19. Merriam-Webster's Vocabulary Builder 学习笔记 Unit 6
  20. 解决Windows 下git官网下载很慢

热门文章

  1. Python2.7安装ncmbot时提示:Microsoft Visual C++9.0 is required
  2. SpringBoot中整合Quartz
  3. 安装Scrapy时:Microsoft Visual C++ 9.0 is required
  4. Flutter:使用复选框进行下拉多选
  5. Java实现素数的判断
  6. 1、SpringBoot整合JPA
  7. python列表类型用什么表示_python内置类型:列表,包括 list 和 tuple
  8. 启帆工业机器人综合收入如何_发那科工业机器人ROBOGUIDE如何更方便的查看机器人报警日志...
  9. 神策数据张涛:AARRR 模型面临的新挑战
  10. 写一个“特殊”的查询构造器 - (四、条件查询:复杂条件)