【SpeechX—统一高性能语音部署工具】SpeechX Architecture
(以下内容搬运自 PaddleSpeech)
背景
- 用户C++部署需求强烈。如 #1187
- ASR支持输出timeline信息。如 #1257
Layout of Source File
The layout structure is as follows:
speechx/
├── base
│ ├── basic_types.h
│ ├── common.h
│ ├── flags.h
│ ├── log.h
│ ├── macros.h
│ └── thread_pool.h
├── CMakeLists.txt
├── codelab
│ └── feat_test
│ └── frontend_main.cc
├── decoder
│ ├── CMakeLists.txt
│ ├── common.h
│ ├── ctc_beam_search_decoder.cc
│ ├── ctc_beam_search_decoder.h
│ ├── ctc_decoders -> ../../../third_party/ctc_decoders
│ ├── ctc_tlg_decoder.cc
│ ├── ctc_tlg_decoder.h
│ ├── param.h
│ ├── recognizer.cc
│ └── recognizer.h
├── frontend
│ ├── audio
│ │ ├── audio_cache.cc
│ │ ├── audio_cache.h
│ │ ├── CMakeLists.txt
│ │ ├── cmvn.cc
│ │ ├── cmvn.h
│ │ ├── data_cache.h
│ │ ├── db_norm.cc
│ │ ├── db_norm.h
│ │ ├── fbank.cc
│ │ ├── fbank.h
│ │ ├── feature_cache.cc
│ │ ├── feature_cache.h
│ │ ├── feature_pipeline.cc
│ │ ├── feature_pipeline.h
│ │ ├── frontend_itf.h
│ │ ├── linear_spectrogram.cc
│ │ ├── linear_spectrogram.h
│ │ ├── mel-computations.cc
│ │ ├── mel-computations.h
│ │ ├── mfcc.cc
│ │ ├── mfcc.h
│ │ └── normalizer.h
│ ├── CMakeLists.txt
│ └── text
│ └── CMakeLists.txt
├── kaldi
│ ├── base
│ │ ├── CMakeLists.txt
│ │ ├── io-funcs.cc
│ │ ├── io-funcs.h
│ │ ├── io-funcs-inl.h
│ │ ├── kaldi-common.h
│ │ ├── kaldi-error.cc
│ │ ├── kaldi-error.h
│ │ ├── kaldi-math.cc
│ │ ├── kaldi-math.h
│ │ ├── kaldi-types.h
│ │ ├── kaldi-utils.cc
│ │ ├── kaldi-utils.h
│ │ ├── timer.cc
│ │ ├── timer.h
│ │ └── version.h
│ ├── CMakeLists.txt
│ ├── decoder
│ │ ├── CMakeLists.txt
│ │ ├── decodable-itf.h
│ │ ├── lattice-faster-decoder.cc
│ │ ├── lattice-faster-decoder.h
│ │ ├── lattice-faster-online-decoder.cc
│ │ └── lattice-faster-online-decoder.h
│ ├── feat
│ │ ├── CMakeLists.txt
│ │ ├── cmvn.cc
│ │ ├── cmvn.h
│ │ ├── feature-common.h
│ │ ├── feature-common-inl.h
│ │ ├── feature-fbank.cc
│ │ ├── feature-fbank.h
│ │ ├── feature-functions.cc
│ │ ├── feature-functions.h
│ │ ├── feature-mfcc.cc
│ │ ├── feature-mfcc.h
│ │ ├── feature-plp.cc
│ │ ├── feature-plp.h
│ │ ├── feature-spectrogram.cc
│ │ ├── feature-spectrogram.h
│ │ ├── feature-window.cc
│ │ ├── feature-window.h
│ │ ├── mel-computations.cc
│ │ ├── mel-computations.h
│ │ ├── online-feature.cc
│ │ ├── online-feature.h
│ │ ├── pitch-functions.cc
│ │ ├── pitch-functions.h
│ │ ├── resample.cc
│ │ ├── resample.h
│ │ ├── signal.cc
│ │ ├── signal.h
│ │ ├── wave-reader.cc
│ │ └── wave-reader.h
│ ├── fstbin
│ │ ├── CMakeLists.txt
│ │ ├── fstaddselfloops.cc
│ │ ├── fstdeterminizestar.cc
│ │ ├── fstisstochastic.cc
│ │ ├── fstminimizeencoded.cc
│ │ └── fsttablecompose.cc
│ ├── fstext
│ │ ├── CMakeLists.txt
│ │ ├── determinize-lattice.h
│ │ ├── determinize-lattice-inl.h
│ │ ├── determinize-star.h
│ │ ├── determinize-star-inl.h
│ │ ├── fstext-lib.h
│ │ ├── fstext-utils.h
│ │ ├── fstext-utils-inl.h
│ │ ├── kaldi-fst-io.cc
│ │ ├── kaldi-fst-io.h
│ │ ├── kaldi-fst-io-inl.h
│ │ ├── lattice-utils.h
│ │ ├── lattice-utils-inl.h
│ │ ├── lattice-weight.h
│ │ ├── pre-determinize.h
│ │ ├── pre-determinize-inl.h
│ │ ├── remove-eps-local.h
│ │ ├── remove-eps-local-inl.h
│ │ └── table-matcher.h
│ ├── lat
│ │ ├── CMakeLists.txt
│ │ ├── determinize-lattice-pruned.cc
│ │ ├── determinize-lattice-pruned.h
│ │ ├── kaldi-lattice.cc
│ │ ├── kaldi-lattice.h
│ │ ├── lattice-functions.cc
│ │ └── lattice-functions.h
│ ├── lm
│ │ ├── arpa-file-parser.cc
│ │ ├── arpa-file-parser.h
│ │ ├── arpa-lm-compiler.cc
│ │ ├── arpa-lm-compiler.h
│ │ └── CMakeLists.txt
│ ├── lmbin
│ │ ├── arpa2fst.cc
│ │ └── CMakeLists.txt
│ ├── matrix
│ │ ├── cblas-wrappers.h
│ │ ├── CMakeLists.txt
│ │ ├── compressed-matrix.cc
│ │ ├── compressed-matrix.h
│ │ ├── jama-eig.h
│ │ ├── jama-svd.h
│ │ ├── kaldi-blas.h
│ │ ├── kaldi-matrix.cc
│ │ ├── kaldi-matrix.h
│ │ ├── kaldi-matrix-inl.h
│ │ ├── kaldi-vector.cc
│ │ ├── kaldi-vector.h
│ │ ├── kaldi-vector-inl.h
│ │ ├── matrix-common.h
│ │ ├── matrix-functions.cc
│ │ ├── matrix-functions.h
│ │ ├── matrix-functions-inl.h
│ │ ├── matrix-lib.h
│ │ ├── optimization.cc
│ │ ├── optimization.h
│ │ ├── packed-matrix.cc
│ │ ├── packed-matrix.h
│ │ ├── qr.cc
│ │ ├── sparse-matrix.cc
│ │ ├── sparse-matrix.h
│ │ ├── sp-matrix.cc
│ │ ├── sp-matrix.h
│ │ ├── sp-matrix-inl.h
│ │ ├── srfft.cc
│ │ ├── srfft.h
│ │ ├── tp-matrix.cc
│ │ └── tp-matrix.h
│ └── util
│ ├── basic-filebuf.h
│ ├── CMakeLists.txt
│ ├── common-utils.h
│ ├── const-integer-set.h
│ ├── const-integer-set-inl.h
│ ├── edit-distance.h
│ ├── edit-distance-inl.h
│ ├── hash-list.h
│ ├── hash-list-inl.h
│ ├── kaldi-cygwin-io-inl.h
│ ├── kaldi-holder.cc
│ ├── kaldi-holder.h
│ ├── kaldi-holder-inl.h
│ ├── kaldi-io.cc
│ ├── kaldi-io.h
│ ├── kaldi-io-inl.h
│ ├── kaldi-pipebuf.h
│ ├── kaldi-semaphore.cc
│ ├── kaldi-semaphore.h
│ ├── kaldi-table.cc
│ ├── kaldi-table.h
│ ├── kaldi-table-inl.h
│ ├── kaldi-thread.cc
│ ├── kaldi-thread.h
│ ├── options-itf.h
│ ├── parse-options.cc
│ ├── parse-options.h
│ ├── simple-io-funcs.cc
│ ├── simple-io-funcs.h
│ ├── simple-options.cc
│ ├── simple-options.h
│ ├── stl-utils.h
│ ├── table-types.h
│ ├── text-utils.cc
│ └── text-utils.h
├── model
│ └── CMakeLists.txt
├── nnet
│ ├── CMakeLists.txt
│ ├── decodable.cc
│ ├── decodable.h
│ ├── nnet_itf.h
│ ├── paddle_nnet.cc
│ └── paddle_nnet.h
├── protocol
│ └── CMakeLists.txt
├── third_party
│ ├── CMakeLists.txt
│ └── README.md
├── utils
│ ├── CMakeLists.txt
│ ├── file_utils.cc
│ ├── file_utils.h
│ ├── ring_buffer.cc
│ ├── ring_buffer.h
│ ├── simdjson.cpp
│ └── simdjson.h
└── websocket├── CMakeLists.txt├── websocket_client.cc├── websocket_client.h├── websocket_server.cc└── websocket_server.h
Common Modules
- gflag,glog,gtest:openfst 使用的是 gflag/glog。
- utils: absl-cpp
- config:使用 kaldi config
- threadpool: https://github.com/progschj/ThreadPool
- decoder:支持wfst解码,ctc beam search.
- frontend:模块组件化(方便定制新组件),流式级联(便于插入和按需组合),feature extractor进行抽象。目前支持 linear feature和fbank,与paddlespeech python端对齐。
- nnet:支持 deepspeech2 model。
- websocket:网络模块。
- examples: 使用实例,与speechx目录平级。
P.S. 欢迎关注我们的 github repo [PaddleSpeech](https://github.com/PaddlePaddle/PaddleSpeech), 是基于飞桨 PaddlePaddle 的语音方向的开源模型库,用于语音和音频中的各种关键任务的开发,包含大量基于深度学习前沿和有影响力的模型。
【SpeechX—统一高性能语音部署工具】SpeechX Architecture相关推荐
- puppet开源的软件自动化配置和部署工具——本质就是CS,服务端统一管理配置...
1. 概述 puppet是一个开源的软件自动化配置和部署工具,它使用简单且功能强大,正得到了越来越多地关注,现在很多大型IT公司均在使用puppet对集群中的软件进行管理和部署,如google利用p ...
- 全场景、简单易用、极致高效!新一代AI部署工具FastDeploy来了!
人工智能产业应用发展的越来越快,开发者需要面对的适配部署工作也越来越复杂.层出不穷的算法模型.各种架构的AI硬件.不同场景的部署需求.不同操作系统和开发语言,为AI开发者项目落地带来极大的挑战. 为了 ...
- 国内首发,这款 Serverless 云原生一体化部署工具正式开源!
12 月 19 日,腾讯在 2020 Techo Park 开发者大会上集中发布了三大开源项目.其中,云开发 CloudBase Framework 作为腾讯开源的国内首个基于 Serverless ...
- java部署工具下载_Walle部署工具-Walle(开源部署工具)下载 v2.0.1官方版--pc6下载站...
Walle开源部署工具是一款免费开源的上线部署平台,Walle开源部署工具支持各种web代码发布,php.java等代码的发布.回滚可以通过web来一键完成.walle更人性化,高颜值,支持git.多 ...
- 人脑启发AI设计:让神经网络统一翻译语音和文本
来源:图灵人工智能 作者:Glaciohound 编辑:陈彩娴 能够统一地理解语音和文本,是人类能够形成通用语言能力的重要原因.那么,人工智能是否也能如此?最近,来自字节跳动和UIUC的研究人员借鉴这 ...
- 开源自动化部署工具_6种开源家庭自动化工具
开源自动化部署工具 编者注:本文最初于2016年3月发布,现已更新,以包括其他选项和信息. 自从我们上一次在2016年发布有关家庭自动化工具的评论文章以来,物联网不仅仅是一个时髦的词,而且这个事实正在 ...
- new relic_新的Relic的Centurion Docker部署工具,DIY大脑扫描仪等
new relic 开源新闻让您阅读愉快. 2014年6月14日至20日 在本周的开源新闻摘要中,我们检查了New Relic的Docker部署工具,来自Open Ephys的DIY脑部记录装置等. ...
- Docker —— 用于统一开发和部署的轻量级 Linux 容器【转】
转自:http://www.oschina.net/translate/docker-lightweight-linux-containers-consistent-development-and-d ...
- 部署工具(deploy-tool)开源拉!
文章目录 概述 部署工具介绍 面向用户 功能特性 在线文档 快速使用 问题及反馈 License 概述 部署工具(deploy-tool)开源拉!你是否在为项目的私有部署烦恼?是否每次项目部署都得重复 ...
最新文章
- Datawhale团队第四期录取名单!
- 《计算机图形学》2.1.7 立体感和虚拟现实系统
- python 朗读-Python 文本转语音
- Boost:序列化之text_iarchive和text_oarchive
- 遇到的JDBC的一个问题
- 阿里P8架构师谈:MySQL数据库的索引原理、与慢SQL优化的5大原则
- 程序员必须知道的15件事(转)
- OpenCV3学习(11.3)关键点的描述符KeyPoint对象与匹配类DMatch
- 读四年大学,各项费用大概是多少?
- 泄密Number的数据类型转换
- mysql内存表主从复制_MySQL的内存表在主从同步的注意事项_MySQL
- SQL to ElasticSearch DSL
- 去除360安全卫士的广告弹窗(亲测有效)
- MySQL said: Authentication plugin ‘caching_sha2_password‘ cannot be loaded... 阿星小栈
- 中国银行软件中心信息技术岗(北京 )面试
- 小甲鱼python入门笔记(三)
- 经验分享 | 关于NASA VIIRS数据
- java反射机制的概念及原理
- C#入门9.14——本章小结及任务实施
- 【PL/SQL】Insert/ update/ delete/ merge