参考教程。
记录一些要点:

  • 数据集预处理
  1. UVR5-分离伴奏:Method-Demucs、Stem-Vocals、Model-v3|UVR-Model-1、GPU Conversion √、Vocals Only √
  2. UVR5-消除混响和声:Input-vocal、Method-VR、Size-320、Aggression-10、Model-5_HP_Karaoke_UVR、GPU Conversion √、Vocals Only √
  3. Renamer-文件批量改名:建议只包含字母、数字、下划线
  4. AudioSlicer-音频切分:第2步处理好的纯人声拖入Task List里,Minimum Length改成8000,目标文件夹名称建议为需要训练的音声人物名
  5. 上一步的文件夹放入整合so-vits-svc-4.0/dataset_raw/,运行数据预处理,dataset文件夹里为预处理好的数据集,filelists文件夹里为自动划分的训练集、验证集、测试集标注
  • 训练
  1. 改配置文件:so-vits-svc-4.0/configs/config.json,12G显存RTX3080Ti设置(learning_rate: 0.0002, batch_size: 12),两者正比;24G显存RTX3090设置(learning_rate: 0.0004, batch_size: 24)
  2. 评估结果一组随机抽5个数,越小越好;每训练200个Step,保存一次G/D.pth模型文件
  3. 训练.bat
  • 推理
  1. 推理webui.bat
  2. 目标人音声也须分离伴奏、消除混响和声、切片,但切片用AU切即可(保存成wav格式)
  3. 转换完后用AU拼接,用PR合成音频伴奏
  • 聚类模型/自动f0预测

  • 适合我推的歌,且她没唱过

    • 富士山下 - 陈奕迅

      • 用AU变调音频后再合成视频
      • 制作输出格式改成1080P HD
      • 再对齐下音轨,后期有点抢拍
    • 处处吻 - 杨千嬅:单声道音轨不对齐,对拍对应伴奏的强拍
    • 可惜我是水瓶座 - 杨千嬅:转双声道
    • 小幸运 - 田馥甄:转双声道,几处歌词第一个字尖锐爆音,重新转换也不行,标记这些选段使用AU的自动修复选区处理
    • 好きだから。 - ユイカ:转双声道,悄悄话声单独转换

    总结:混音多,消的不干净的歌,转换声线适合只放单声道的;反之,可以放双声道的立体感强。

SO-VITS-SVC 尝试相关推荐

  1. 【机器学习超详细】机器学习案例之SVM人脸识别技术应用 PCA降维 结果可视化 支持向量机

    基础知识介绍: LFW人脸识别数据集(http://vis-www.cs.umass.edu/lfw/) 该实验可以在JupyterNotebook上运行,也可在其他Python程序上运行.(本人习惯 ...

  2. K8S-网络模型、POD/RC/SVC YAML 语法官方文档

    2019独角兽企业重金招聘Python工程师标准>>> K8S-网络模型.POD/RC/SVC YAML 语法官方文档 博客分类: Kubernetes K8S-网络模型.POD/R ...

  3. cortex-M3 的SVC、PendSV异常,与操作系统(ucos实时系统)

    SVC异常是?  PendSV异常是?  ucos 任务切换时机?  ucos 如何满足实时性(实现)?  ucos中,systick的优先级? SVC和PendSV SVC(系统服务调用,亦简称系统 ...

  4. H264/SVC Temporal Scalability

    H264/SVC Temporal Scalability 在多人远程会议或直播系统中,参与的用户可能处于不同的网络环境(有线.wifi.3G.4G)中,网络质量各不一致,为了所有用户可进行远程会议或 ...

  5. 【嵌入式开发】ARM 处理器工作模式 及 修改方法 ( 处理器模式 | 设置处理器模式 | 程序状态字寄存器 CPSR SPSR | 模式设置代码编写 | 设置 svc 模式 )

    一. 处理器工作模式相关介绍 1. 处理器模式简介 (1) 处理器工作模式分类 (2) 处理器不同工作模式区别 (3) Linux 系统运行的模式 (4) 特权模式 说明 (5) 异常模式 (6) 系 ...

  6. Python信贷风控模型:Adaboost,XGBoost,SGD, SVC,随机森林, KNN预测信贷违约支付

    全文链接:http://tecdat.cn/?p=26184 在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化?( ...

  7. 北京短租2021年Airbnb数据分析(探索性数据分析+简单建模尝试)

    复现了一下阿里天池上Tianchi Data Hero Cup -- 短租数据集分析 论坛大佬的代码,做了探索性数据分析+简单建模尝试.原本的数据集没找见, 从Airbnb 网站下载了21年的北京短租 ...

  8. 机器学习笔记:支持向量机(SVM)详细推导以及sklearn.svm.SVC的简单简介

    线性可分支持向量机: 举一个简单的例子: 我们需要将下面的圆圈和叉分开 这里存在无数多条线可以将圆圈和叉分开,因此,我们要规定一个性能指标,对于每一条线,都有对应的一个性能指标. 我们将每一条可以分开 ...

  9. SVC,HVC,SMC指令

    SVC(Supervisor Call) 当用户空间通过系统调用陷入到内核空间的时候,则最终会通过SVC指令进入到内核空间 HVC(Hypervisor Call) 当在ARMv8-A架构下,norm ...

  10. 【Qbot】6.讯飞文字转语音Api使用/VITS派蒙复读机实现

    该项目计划长期进行维护更新,欢迎star:https://github.com/zstar1003/Qbot 前言 看完流浪地球2之后,萌生了一个想法:我想给机器人完整的一生.作为一个完整的机器人,声 ...

最新文章

  1. PHP获取客户端真实IP的自定义函数
  2. 每天一个知识点linux(八)手动创建交换分区
  3. Gradle 使用指南 -- 基础配置
  4. 算法--------------有效的数独
  5. AngularJS学习日记(四)Service和Provider
  6. MapObjects2自带例子的问题
  7. 指针在c语言中的运用,怎么理解C语言中的指针,如何运用?
  8. 渗透测试 已学课时 1 个_我14岁上创业课时学到的东西
  9. 和docket的第一次亲密接触
  10. Java 类型, Hibernate 映射类型及 SQL 类型之间的相应关系
  11. hiveSql获取日期时间
  12. 漫谈如何学习操作系统原理
  13. 163邮箱登陆入口展示,企业邮箱电脑版登陆入口
  14. 小学生必背古诗70首
  15. PMSG孕马血清促性腺激素适用的应用方案
  16. 线性子空间的交、并、和、维数与直和等各种关系总结
  17. 微信页面模板基础知识汇总
  18. 爬取北京链家二手房数据
  19. Laradock 安装配置
  20. 如何使用Synplify综合vivado带IP核的工程

热门文章

  1. 【笔记】基础命令vim快捷键网卡配置文件DNS解析配置文件修改主机名称
  2. jsp标签jsp:setProperty用法
  3. 招商信用卡消费短信温馨提醒
  4. STM32F103ZET6
  5. deepin linux VScode 设置启动命令 code
  6. Nginx:09---HTTP模块之(URI请求与重定向:location模块)
  7. c office 转html,Office转HTML
  8. 多伦多大学计算机人工智能,解读加拿大人工智能专业
  9. 落地好OKR的8大关键步骤及常用辅助工具
  10. arcgis符号方向_ArcGIS制图表达-河流渐变与符号旋转