1、声学模型训练
https://montreal-forced-aligner.readthedocs.io/en/latest/aligning.html#trained-alignment
最新 2.0 版本:
https://montreal-forced-aligner.readthedocs.io/en/latest/user_guide/workflows/train_acoustic_model.html?highlight=mfa%20train

usage: mfa train [-h] [--config_path CONFIG_PATH] [-o OUTPUT_MODEL_PATH][-s SPEAKER_CHARACTERS] [-a AUDIO_DIRECTORY][--phone_set {AUTO,IPA,ARPA,PINYIN}][--output_format {short_textgrid,long_textgrid,json}][--include_original_text] [--train_g2p][-t TEMPORARY_DIRECTORY] [--disable_mp] [-j NUM_JOBS] [-v][-q] [--clean] [--overwrite] [--debug][--disable_textgrid_cleanup]corpus_directory dictionary_path output_paths[output_paths ...]

mfa train corpus_directory dictionary_path output_directory

其他参数比较正常,temp_directorynum_jobs 两项参数建议进行设置,num_jobs 参数在训练语料较大的情况下,多核机器可以很好的进行倍数加速,而temp_directory也可以防止home内存不够,导致异常。

2、其他后续补充

mfa align /data/xxxx/prepared_for_mfa/ /data/xxxx/lexicon.txt english /data/xxxx/output/ -t /data/xxxx/temp_files/ -j 20 --clean

corpus_directory
Full path to the directory to align

dictionary_path
Full path to pronunciation dictionary, or saved dictionary name (you can use mfa model download dictionary to get MFA dictionaries)

acoustic_model_path
Full path to pre-trained acoustic model, or saved model name (you can use mfa model download acoustic to get pretrained MFA models)

output_directory
Full path to output directory, will be created if it doesn’t exist

-h, --help
show this help message and exit

–config_path <config_path>
Path to config file to use for alignment

-s <speaker_characters>, --speaker_characters <speaker_characters>
Number of characters of file names to use for determining speaker, default is to use directory names

-a <audio_directory>, --audio_directory <audio_directory>
Audio directory root to use for finding audio files

–reference_directory <reference_directory>
Directory containing gold standard alignments to evaluate

–custom_mapping_path <custom_mapping_path>
YAML file for mapping phones across phone sets in evaluations

-t <temporary_directory>, --temp_directory <temporary_directory>, --temporary_directory <temporary_directory>
Temporary directory root to store MFA created files, default is /home/docs/Documents/MFA

–disable_mp
Disable any multiprocessing during alignment (not recommended), default is False

-j <num_jobs>, --num_jobs <num_jobs>
Number of data splits (and cores to use if multiprocessing is enabled), defaults is 3

-v, --verbose
Output debug messages, default is False

–clean
Remove files from previous runs, default is False

–overwrite
Overwrite output files when they exist, default is False

–debug
Run extra steps for debugging issues, default is False

–disable_textgrid_cleanup
Disable extra clean up steps on TextGrid output, default is False

–config_path 添加 config.yaml 文件

beam: 10
retry_beam: 40features:type: "mfcc"use_energy: falseuse_pitch: trueframe_shift: 10training:- monophone:subset: 10000num_iterations: 50max_gaussians: 2000boost_silence: 1.25- triphone:subset: 20000num_iterations: 50num_leaves: 2000max_gaussians: 10000cluster_threshold: -1boost_silence: 1.25power: 0.25- lda:subset: 20000num_leaves: 4000max_gaussians: 15000num_iterations: 40- sat:subset: 50000num_leaves: 4200max_gaussians: 40000power: 0.2silence_weight: 0.2fmllr_update_type: "full"- pronunciation_probabilities:subset: 50000silence_probabilities: true- sat:subset: 150000num_leaves: 5000max_gaussians: 100000power: 0.2silence_weight: 0.20fmllr_update_type: "full"- pronunciation_probabilities:subset: 150000silence_probabilities: trueoptional: true # Skipped if the corpus is smaller than the subset- sat:subset: 0quick: true # Performs fewer fMLLR estimationnum_iterations: 20num_leaves: 7000max_gaussians: 150000power: 0.2silence_weight: 0.2fmllr_update_type: "full"optional: true # Skipped if the corpus is smaller than the previous subset

Montreal Forced Aligner (MFA)基础使用教程相关推荐

  1. Montreal Forced Aligner (MFA)安装教程及异常处理

    官方地址:https://montreal-forced-aligner.readthedocs.io/en/latest/index.html 文末附常见问题解决方法: 1.FileNotFound ...

  2. 虚幻引擎虚拟现实开发基础学习教程

    流派:电子学习| MP4 |视频:h264,1280×720 |音频:AAC,44.1 KHz 语言:英语+中英文字幕(根据原英文字幕机译更准确)|大小解压后:3.93 GB |时长:5h 15m 了 ...

  3. 动画产业基础学习教程 Rad How to Class – Animation Industry Fundamentals

    如何分类--动画产业基础 大小解压后:6.2G 含课程素材 1920X1080 mp4 语言:英语+中英文字幕(根据原英文字幕机译更准确) 信息: 绘画技巧.解剖学.角色设计.透视和整体讲故事--这门 ...

  4. ue5新手零基础学习教程 Unreal Engine 5 Beginner Tutorial - UE5 Starter Course

    ue5新手零基础学习教程 Unreal Engine 5 Beginner Tutorial - UE5 Starter Course! 教程大小解压后:4.96G 语言:英语+中英文字幕(机译)时长 ...

  5. Android基础新手教程——1.5.2 Git之使用GitHub搭建远程仓库

    Android基础新手教程--1.5.2 Git之使用GitHub搭建远程仓库 标签(空格分隔): Android基础新手教程 本节引言: 在上一节中.我们学习了怎样使用Git.构建我们的本地仓库.轻 ...

  6. python怎么输出浮点数_python 零基础入门教程第 2 章:基本数据类型 (一)

    一.什么是数据类型 编程语言通过一些复杂的计算机物理底层机制,创造不同类型的数据,用来表示现实世界中的不同信息,以便于计算机更好的存储和计算. 每种编程语言都会有一些基本的数据类型用来表示现实世界中的 ...

  7. python菜鸟基础教程-python基础菜鸟教程,Python的基础语法

    原标题:python基础菜鸟教程,Python的基础语法 什么是Python?Python是一门简单直观的编程语言,并且目前是开源的,可以方便任何人使用. Python的开发哲学:用一种方法,最好是只 ...

  8. python免费入门手册-Python 基础入门教程

    Python是一种解释型.面向对象.动态数据类型的高级程序设计语言. Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年. <Python 基础入 ...

  9. Python基础入门教程:使用 Python 3 协程快速获得一个代理池

    Python基础入门教程:使用 Python 3 协程快速获得一个代理池 前言 在执行 IO 密集型任务的时候,程序会因为等待 IO 而阻塞.比如我们使用 requests 库来进行网络爬虫请求的话, ...

最新文章

  1. JLOI2015 战争调度
  2. postman api
  3. LeetCode 295. 数据流的中位数 Hard难度
  4. get方式请求接受参数的方法
  5. Java设计模式-外观模式
  6. windows手动启动mysql mysql.bat
  7. 用CURD来拯救前端的一切的一切
  8. android rom 属性 分辨率,ROM的 build.prop参数详解
  9. 一分钟搞懂NB-IoT行业发展
  10. 微信公众号开发(一)配置服务器
  11. PCB会过期?过期后先烘烤?
  12. matlab表示网络,Matlab绘制网络
  13. 【第 001 期 · 文献领读】——MRI专题
  14. 谷歌浏览器不安全的连接牵扯的系统缺陷
  15. 软件测试前景怎么样?大概要学什么?
  16. Markdown内嵌图片的解决方法
  17. Java实现权限管理的两种方式
  18. echarts3 使用((绘制各种图表,地图))
  19. local variable 'sum_size' referenced before assignment报错
  20. 湖北黄冈计算机考试,湖北黄冈2020年注会什么时候考试?是计算机考试吗?

热门文章

  1. 用单片机c51电子秤的c语言,基于51单片机的电子秤系统设计
  2. 计算机开机后桌面黑屏,电脑开机一直黑屏怎么办 电脑开机后桌面黑屏的解决方法...
  3. 医学知识-DDR数字化成像-X平片
  4. 新编c语言程序设计实验钱雪忠答案,新编c语言程序设计教程机械工业出版社钱雪忠吕莹楠...
  5. 0基础学RS(九)思科AAA认证的本地AAA认证
  6. 这场峰会,让客户运营不再Hard
  7. 出租车从业资格证什么时候换证?
  8. 深耕ElasticSearch - 过滤和聚合/多桶排序
  9. 堪破而不沉沦,一笑以渡
  10. 十所大学!计算机第二学士学位开始报名!