HTS Sinsy音源库训练方法
最近看了些方法,整理了下。
需要环境:Debain/Ubuntu x86_64系统
首先下载训练包:https://pan.baidu.com/s/1i6huEaD
下载后解压
先编译hts_engine_API,然后编译SPTK和HTS_for_HTK.编译时需要csh和libx11,记得安装。apt里就有
编译hts_engine_API和SPTK后一定要make install,HTS_for_HTK可以不用install
然后打开hts-train-demo文件夹,打开data,替换相应文件
raw文件夹为音频文件,格式为:480000Hz Little Endian 跳过前2位
可以使用ffmpeg进行转换:
ffmpeg -i input.wav -f s16le -ar 48000 -acodec pcm_s16le output.raw
label/full放入音乐的完整label,可以用Sinsy-remix导出
sinsy -x dic -m jp.htsvoice -w c -o output.lab -l infile.xml
-x 指定发音表所在文件夹
-m 指定任意一个htsvoice(不影响输出结果,必须指定一个htsvoice是bug)
-w 指定语言,j代表日语,c代表中文
注:如果需要使用其他语言进行训练,需要更改question文件(只需更改开头的音素不封,也就是LL-Phone到RR-Phone的区域),具体请查看:关于HTS问题集(question)的解析(一)
label/mono指定的歌词和对应时间,元音和辅音要拆开来,时间一定要准确,否则影响音源合成效果
注意:pau这个音的作用类似UTAU里的R,代表无声的范围,不能缺少。sil是用来填补曲子还没开始前的“上一个音”的空位
具体怎么写可以参照官方的例子
开始训练,需要的时间较长(6-12小时),建议在screen里运行
screen -S train
配置时一定要指定HTK的位置
./configure --with-hts-search-path=../HTS_for_HTK/htk/HTKTools
然后就可以开始make了
make all
如果训练时,perl提示找不到对应类,请手动执行下面的指令:
perl scripts/Training.pl 当前的绝对路径/scripts/Config.pm
大约6小时训练完成
训练结果在voice文件夹内
HTS Sinsy音源库训练方法相关推荐
- 阿比路架子鼓音源合集 Native Instruments Abbey Road Drummer Collection
Native Instruments AbbeyRoad Drummer Collection | 43GB 精致录制的鼓声 6个时代的鼓声,仅需 ¥ 1,599.00 (正常价格 ¥4,794.00 ...
- 当强人工智能时代来临,哪些人不会失业?
大数据(ID:hzdashuju)在长假期间 给你推送6篇入门级科普,包括: 数据与隐私 | 自动驾驶 | AI与就业 黄金比例 | 量子计算机 | 数据科学职业 另外还为既聪明又努力的孩子们 准备了 ...
- 基于语音的疲劳度检测算法研究
基于语音的疲劳度检测算法研究 摘 要 疲劳是一种自然现象,是人体的一种自我调节和保护功能.检测疲劳状态对于当今社会从事各行各业都有积极意义.本课题提出了一种基于语音特征参数和概率神经网络的语音疲劳度识 ...
- Qt Lmms 优秀的开源软件学习
其实学习优秀或者加入开源项目对于一个开发者能力成长是有很大帮助. 目的: lmms里面有很多优秀的开源控件是学习Qt的一个错的资源.lmms的控件中自定义绘图等还可以学到一些架构设计方面的知识. lm ...
- 元宇宙的运行之“DAO”:在元宇宙中创作、分享,付出的劳动如何获得回报?...
原标题:<元宇宙的运行之"DAO"> 摘要 道立于一,造化万物.元宇宙主题大热,市场的分歧在于如果元宇宙仅是AR.VR+多维感知的升级,如何实现巨头转型的愿景?我们在元 ...
- 火爆全网的“数字人”,到底是个啥?
嘉尔达数字人是一家专业的数字人 AIGC 技术公司 数字人智造系统,实现了低成本.高质量地生产智能数字人,能做到话术随机组合,不循环播放,有效防止直播平台的风控 大大降低数字人直播封号,实现24小时数 ...
- 春晚的撒贝宁是AI虚拟的?这到底是怎么回事!
[网易智能讯 2月1日消息]人工智能在过去的两年,丝毫不逊于各类网络热词,已经逐渐家喻户晓,人尽皆知,如果老百姓简单理解,可以称之为全新的黑科技,但如果想要看得见摸得着,电视节目起到了巨大的推动作用. ...
- fl studio中文版水果2020下载Keymaker-CORE.rar及使用常见问题教程
FL Studio俗称水果,又名保卫萝卜 这款宿主应该算得上是全中国最多人用的宿主软件了,不知道有多少接触音乐制作的同学最开始就是用的这个,在我看来,FL Studio是对小白同学比较友好的,界面简单 ...
- 强大的数字DJ混音器:Native Instruments Traktor pro for mac
DJ软件 mac版哪里有?traktor pro mac破解版是一款专业的数字DJ音乐制作软件,也是非常实用的数字DJ混音器.Native Instruments Traktor pro for ma ...
最新文章
- 10个免费好用功能强大的网页动画效果库
- 【tf.keras】tf.keras使用tensorflow中定义的optimizer
- 支持多个版本的ASP.NET Core Web API
- ListBox combobox的常用功能
- 交互,真的没有你想象的那么重要
- C# WinForm程序中强制退出程序以及启动程序
- Uart接口的详细解释
- Docker 入门(1)虚拟化和容器
- 基于JavaSwing+mysql的图书管理系统设计和实现
- python没有用_你可能没有在Python3中使用但却应该使用的东西
- linux shell 生产脚本汇总,【汇总】Linux常用脚本shell
- Spring Boot @ SpringBootApplication,SpringApplication类
- [dfs] 洛谷 P2535 收集资源
- 《手把手教你学DSP——基于TMS320F28335》北京航空航天大学出版社-张卿杰等-电子版-PDF
- 计算机专业学校课程改革,中专学校计算机专业课程改革初探
- Microsoft Virtual PC 2007 SP1简体中文语言包
- 如何去管理Java项目
- win10系统计算机物理地址,Win10系统怎么查看和修改网卡mac物理地址?
- php.ini 验证码,PHP-验证码
- 怎样用matlab进行仿真,怎么用matlab仿真啊
热门文章
- 不可能!我的内网服务器怎么会被黑客入侵?
- ubuntu12.04 GX编译环境搭建
- Windows Workflow Foundation(1)- Windows Workflow Foundation 概述
- WeChatExtension:一款mac微信必备插件!
- Spring - bean
- CBinsight重磅报告 | 如何从谷歌亚马逊苹果微软脸书的9年专利之争,看5大巨头在AI行业的未来10年之争
- JavaSwing真的过时了吗?请不要忽略了它的启蒙作用
- 手残把下载文件夹位置移动到了D盘根目录,导致了一系列问题的解决方法
- 【可视化】对比与位置的艺术 - how we position and what we compare
- 【线代】矩阵的秩和线性方程组的解的情况