首次开源!一行代码轻松搞定中英文语音识别、合成、翻译核心功能!
导读
要说生活里最常见的AI应用场景,语音合成与识别当属大家最为耳熟能详的场景之一了。
寻常到平时地图导航的播报、微信语音转文字、手机语音输入,以及小度智能音箱,都离不开语音技术的加持。
语音技术到底是怎么实现的?有哪些现成可用的开源代码可以快速集成到项目里?可以说是每一名开发者非常关心的问题。
那么,福利时间到了,今天这个集成了中英文语音识别、语音翻译、语音合成、声音分类能力,而且一行代码轻松试验效果的开源项目,你一定不能错过!
项目介绍
话不多说,先来看项目中给出的效果展示。
语音识别
输入音频 1
识别结果 1
I knocked at the door on the ancient side of the building.
输入音频 2
识别结果 2
我认为跑步最重要的就是给我带来了身体健康。
语音翻译(英译中)
输入音频
识别结果
我 在 这栋 建筑 的 古老 门上 敲门。
语音合成
输入文本 1
Life was like a box of chocolates, you never know what you're gonna get.
合成音频 1
输入文本 2
早上好,今天是2020/10/29,最低温度是-3°C。
合成音频 2
可以看到,无论是中英文的识别,还是中英文的合成,这个开源项目都有不错的效果,特别的,项目中还包含了语音翻译能力,可以实现英文语音同传翻译为中文字幕,这个确实太强大了。
传送门:
GitHub 地址:
https://github.com/PaddlePaddle/PaddleSpeech
有读者肯定想问,这么强大的语音能力,是不是想要用起来比较麻烦?
不得不说,这个项目在易用性上真的也是考虑得非常周到。
安装测试效果
我们按照首页的引导:
一行命令安装:
一行命令快速开始使用:
这里,小编抱着试一试的态度,在本机上安装了这个项目,安装完成之后,先使用语音合成试一下。
生成的效果大家可以听一下~
然后,带着好奇心,我们再把合成的结果送到语音识别试一下,看看效果:
最终输出结果:
可以看到,这一套循环下来,效果非常不错!
除了出色的效果,易用的体验,我们再看看这个项目中还有什么宝藏可以挖掘,果然我们发现项目中还包含丰富的预训练模型,并且语音识别和语音合成均支持自定义训练。
丰富的预训练模型
语音识别包含声学模型和语言模型,详情如下:
语音合成主要包含三个模块:文本前端、声学模型和声码器。声学模型和声码器模型如下:
完善的文档教程
并且开源以来,收到开发者的广泛关注,已经有大量开发者投入到项目的建设中并且贡献内容。
真·干货满满!
别的不需要多说了,请大家访问GitHub亲自体验吧:
https://github.com/PaddlePaddle/PaddleSpeech
如果大家满意的话,欢迎点个小星星鼓励下我们的工程师!
直播课程,大牛带学
为了帮助大家了解更多语音技术前沿进展,玩转开源项目,12月21日-24日每晚20:15-21:30,由百度研究院深度学习实验室(美研)主任黄亮老师领衔,多位语音领域资深工程师为大家带来一套精品技术直播课,详解语音方向的核心技术。
扫码报名直播课,加入技术交流群
精彩内容抢先看
PaddleSpeech项目地址:
GitHub: https://github.com/PaddlePaddle/PaddleSpeech
Gitee: https://gitee.com/paddlepaddle/PaddleSpeech
首次开源!一行代码轻松搞定中英文语音识别、合成、翻译核心功能!相关推荐
- 重磅!一行代码轻松搞定中英文语音识别与语音合成|代码开源!
导读 要说生活里最常见的 AI 应用场景,语音合成与识别当属大家最为耳熟能详的场景之一了. 寻常到平时地图导航的播报.微信语音转文字.手机语音输入,以及小度智能音箱,都离不开语音技术的加持. 语音技术 ...
- [JavaScript]只需一行代码,轻松搞定快捷留言-V2升级版
前天熬了大半宿发了一篇[一行代码轻松搞定快捷留言功能],同时发布了V1.0beta版的快捷留言功能和源代码,之所以是beta版,就是当时感觉虽然基本功能有了,但是还不够完善,特性也不一定合理,今天不知 ...
- 重磅!百度飞桨开源语音基础模型库|中英文语音识别、语音翻译、语音合成、声音分类通通一行代码轻松搞定...
导读 要说生活里最常见的AI应用场景,语音合成与识别当属大家最为耳熟能详的场景之一了. 寻常到平时地图导航的播报.微信语音转文字.手机语音输入,以及小度智能音箱,都离不开语音技术的加持. 语音技术到底 ...
- 首次开源 一行代码中英文语音识别、合成、翻译核心功能
导读 要说生活里最常见的 AI 应用场景,语音合成与识别当属大家最为耳熟能详的场景之一了. 寻常到平时地图导航的播报.微信语音转文字.手机语音输入,以及小度智能音箱,都离不开语音技术的加持. 语音技术 ...
- 一行代码轻松搞定各种IE兼容问题,IE6,IE7,IE8,IE9,IE10
在网站开发中不免因为各种兼容问题苦恼,针对兼容问题,其实IE给出了解决方案Google也给出了解决方案百度也应用了这种方案去解决IE的兼容问题? 百度源代码如下: <!Doctype html& ...
- [JavaScript]只需一行代码,轻松搞定快捷留言-V2升级版javascript
评论 2243573 #1楼 回复 引用 查看 文章不错,支持! 2010-04-02 02:52 | 夜雨瞳 #2楼 回复 引用 查看 文章不错,支持! 2010-04-02 07:56 | kea ...
- 一行代码快速搞定Flowable断点下载(下)
一行代码快速搞定Flowable断点下载(下) 其实这个主题对应的三篇文章真的真的非常难写,首先是感觉非常多人对于函数式编程不太熟悉,然后又有一些人对于kotlin不太熟悉.这就导致了,写这三篇文章的 ...
- 一行代码快速搞定Flowable断点下载(中)
一行代码快速搞定Flowable断点下载(中) 感觉上一篇家常聊了太多,这一篇就直接进入正题,首先来看一下,通过存储化以及方法拓展技术将mComposableDisposable的相关逻辑也从抽象Ac ...
- 一行代码快速搞定Flowable断点下载(上)
一行代码快速搞定Flowable断点下载(上) 之前我们大致讲了讲,到底怎么完全将disposable相关代码完全隐藏. 然后到了这里,可能有些杠精就会说了,你那个方式,我们不是完全不能拿到Flowa ...
最新文章
- 乐视手机权限开启方法
- 【转贴】Decoda Tutorial LUA调式器
- Java向数据库中插入Boolean类型的字段
- 中小企业应如何选择合适的数据保护工具?
- Redis报错:redis.exceptions.ResponseError: MISCONF Redis is configured to save RDB snap
- 纯新手搭建VS2017+QT5.9.9+QGIS过程中的问题
- 5天学会jaxws-webservice编程第一天
- 数据可视化分析软件开发_大数据系统建设解决方案
- zk的watcher机制
- P1434 [SHOI2002]滑雪 【记忆化搜索】
- 申报绿色工厂对企业意义
- IOS端使用WebRTC实现一对一音视频通话
- ADS2019如何导入 SPICE模型
- pytorch搭建Resnet50实现狗狗120个品种类的分类
- SM2国密公钥格式开头04
- H3C防止同网段arp欺骗攻击配置
- 半导体器件物理【11】载流子输运现象 —— 散射率Ρ、迁移率μ、电阻率ρ(电导率σ)、砷化镓
- php生成11位不重复数字,【PHP】php生成一个不重复的数字(订单号、会员号)
- 【转】数据挖掘,你不应该错过的六本书
- MySQL数据库常用命令与SQL简介(一)
热门文章
- python阿里巴巴排名_python使用urllib模块和pyquery实现阿里巴巴排名查询
- Kubernetes入门——Kubernetes应用部署
- 公益性岗位计算机考试内容,公益性岗位公共基础知识:计算机概述-计算机硬件系统(1)...
- CF1012B Chemical table 题解【二分图】【构造】
- W3School-CSS 表格实例
- 《javascript高级程序设计》第五章知识点总结
- 找工作笔试面试那些事儿(10)---SQL语句总结
- Javascript 常用功能收集-blogjava
- Lingoes 2.8 手动去广告步骤
- 保留关键字 (Transact-SQL) user 也是,哎