来源:新智元

一夜之间,「AI孙燕姿」火遍全网。

B站上,AI孙燕姿翻唱的林俊杰「她说」、周董「爱在西元前」、赵雷「成都」等等,让一众网友深陷无法自拔。

「冷门歌手」孙燕姿新晋成为2023年度热门歌手,掀起许多人的追星狂欢。

网友表示,「听了一晚上AI孙燕姿,出不去了......」

这些翻唱歌曲,是由Eternity丨L、罗斯特_x等UP主通过开源项目自制后并上传。

(作者似乎特意在「半岛铁盒」中加入了一秒空白,凑成5分20秒)

UP主:Eternity丨L

除了AI孙燕姿,还有AI周杰伦,AI王心凌、AI林志炫...

可能许多人做梦也没有想到,2023年华语乐坛竟以这种形式复兴了。

「AI孙燕姿」在线营业

前段时间,一位TikTok网友用AI创作了一首「Heart on My Sleeve」很快蹿红网络,引来1000多万人围观。

听完这首歌的网友纷纷表示,太让我惊讶了,简直太疯狂!

这首歌正是用两位美国流行音乐人Drake和The Weeknd的声音创作而成。先通歌手声音训练AI,然后再用AI来创作。

在国内,B站上AI翻唱的华语乐坛歌曲也渐渐成为许多人关注的焦点,孙燕姿、王心凌、周杰伦等明星纷纷「复出」。

而最火的莫过于孙燕姿,凭借「天后音色」的称号,直接成为AI新宠儿。

UP主:罗斯特_x

有人还自制了AI孙燕姿粤语版《爱来的太迟》。

然而,对于AI音乐制作,在整个音乐行业并非是一个新事物了。只不过生成式AI的大火,让AI翻唱的门槛再次被拉低。

比如,年初,谷歌还曾推出了文本到音乐模型MusicLM,通过将音乐的生成过程视为分层的序列到序列建模任务,并以24 kHz的频率生成高保真的音乐。

对于许多歌迷来讲,AI翻唱一定程度上满足了自己的许多遐想。

还有一些歌迷,自己训练了已故经典老歌手的AI,包括阿桑、张国荣、姚贝娜、邓丽君等等。

这或许是一种数字永生,通过这样一种方式让久违的声音再次回到人们心里。

Midjourney出图逼真的超强能力,让人们惊呼画家要失业了。对于AI翻唱,难道歌手也要被去取代吗?

一位UP主@阿张Rayzhang用自己的音色训练出的AI唱Killer Queen后,瞬间感觉太恐怖了。

紧急录制一个视频后,并附上了「AI歌手会让翻唱区集体失业吗?我被AI版的我爆杀!」标题。

有网友称,自己就是AI第一批受害者画手,感觉什么职业也逃不掉。

有些人也表示,翻唱的有些地方一点也不像。

要知道,对于AI翻唱来讲,也需要丰富的特定艺术家音色训练数据,这样AI生成的作品才更加真实。

就目前的技术,虽然歌手的唱腔、技巧和风格等还不能完全模仿,但音色已经基本能完全复刻。

但是真正的大家是不能被取代。

AI翻唱火虽火,但由AI创作音乐的另一面,是迫在眉睫的版权问题。

AI创作的「Heart on My Sleeve」在TikTok上风靡一时后,完整版被上传到了Apple Music、Spotify、YouTube等平台上。

就此,美国歌手Drake对此在Ins表达了不满,「这是(压死骆驼的)最后一根稻草了」。目前,这首歌因为侵权问题已经下架。

《金融时报》称,拥有Taylor Swift、Bob Dylan等巨星版权的环球音乐集团,正敦促Spotify和苹果阻止AI工具从其艺术家的版权歌曲中抓取歌词和旋律。

但是有些艺术家却不吝啬自己的声音,马斯克前女友Grimes在网上表示,

「任何人都可以使用我的声音AI生成歌曲。」不过,还得再付50%的版权。

而这次大火的AI翻唱背后的原始项目「so-vits-svc」的作者,据称也是因为太多人滥用,而删除了项目。

SoVitsSvc:唱歌声音转换

项目地址:https://github.com/svc-develop-team/so-vits-svc

歌声转换模型使用SoftVC内容编码器来提取源音频语音特征,然后将向量直接送入VITS,而不是转换为基于文本的中间格式。因此,音高和音调都可以被保留下来。

此外,项目开发者还通过采用NSF HiFiGAN作为声码器(vocoder),从而解决了声音中断的问题。

· 特征输入改为Content Vec · 采样率统一使用44100Hz

· 由于参数的改变,以及模型结构的精简,推理所需的GPU显存明显减少。

· 增加选项1:vc模式的自动音高预测,这意味着在转换语音时不需要手动输入音高键,男声和女声的音高可以自动转换。但是,这种模式在转换歌曲时,会造成音高偏移。

· 增加选项2:通过k-means聚类方案减少音色泄漏,使音色与目标音色更相似。

· 增加选项3:增加NSF-HIFIGAN增强器,对一些训练集少的模型有一定的音质增强效果,但对训练好的模型有负面影响,所以默认关闭。

预训练模型文件

将checkpoint_best_legacy_500.pt放在hubert目录下。

将G_0.pth和D_0.pth放在logs/44k目录下。

预处理

0. 音频切片

利用audio-slicer-GUI或audio-slicer-CLI工具,将原始音频切片至5秒-15秒。

长一点也没问题,但太长(比如30秒)可能会在训练甚至预处理时导致「torch.cuda.OutOfMemoryError」,俗称爆显存。

切片后,删除过长和过短的音频。

1. 重采样至44100Hz和单声道

python resample.py

2. 自动将数据集分成训练集和验证集,并生成配置文件

python preprocess_flist_config.py

3. 生成hubert和f0

python preprocess_hubert_f0.py

完成上述步骤后,dataset目录将包含预处理的数据,dataset_raw文件夹可以被删除。

现在,你可以修改生成的config.json中的一些参数——

keep_ckpts:在训练中保留最后的keep_ckpts模型。设置为0将保留所有模型,默认是3。

all_in_mem:将所有数据集加载到RAM中。当某些平台的磁盘IO太低,而系统内存比你的数据集大得多时,可以启用。

训练

python train.py -c configs/config.json -m 44k

推理

模型在需要使用「inference_main.py」。

举个例子:

python inference_main.py -m "logs/44k/G_30400.pth" -c "configs/config.json" -s "nen" -n "君の知らない物語-src.wav" -t 0

虽然原始项目组现已停止维护,但有不少网友都进行了fork并且也做了一些更新。

比如下面这个图形化界面:

项目地址:https://github.com/voicepaw/so-vits-svc-fork

AI「复活」

AI翻唱之外,许多网友此前曾做了类似的项目,比如「AI-Talk」让马斯克和乔布斯进行了穿越时空的对话。

视频中,AI不但模拟了他们的声音,还在一定程度上模拟了其对话思路,使得交流过程十分流畅。

AI让我们与逝者的对话成为可能。此前,B站UP主用AI还复活了老奶奶。

对于老奶奶的声音制作,直接把过去已有的音频上传,素材基本来自于过去的电话录音、录像视频或者微信语音。

并用音频编辑软件AU进行调整,调整的方向主要在降噪、人声增强等等。

然后将更加清晰的音频样本切割成若干秒的短句,方便进行标注。最后将处理好的音频打包放入语音合成系统中去。

利用语音合成系统,就可以尝试输入文本转语音了。

网友见证科技狠活

AI孙燕姿的歌,已经唱到许多网友的心坎。

最近沉迷AI「翻唱」,上至AI侃爷唱罚酒,下至苏小玎唱真相是真。但说句正经的,确实还是AI届顶流孙燕姿的翻唱最好听。

这几天沉迷B站的AI孙燕姿,刚刚听了一首《一场游戏一场梦》,太好听了,唱到心坎里

不少网友听过AI翻唱的歌曲后,感受到AI歌手的可怕之处:

科技的力量真是让人细思极恐。

深深感受到了什么叫做科技的力量......

这就是AI生命,数字飞升!

还有网友对逝去歌手的怀念。

参考资料:

https://github.com/svc-develop-team/so-vits-svc

https://www.bilibili.com/video/BV1io4y1w73k/?vd_source=eecf800392d116d832e90ad1c9ae70f6

推荐阅读

  • 西电IEEE Fellow团队出品!最新《Transformer视觉表征学习全面综述》

  • 润了!大龄码农从北京到荷兰的躺平生活(文末有福利哟!)

  • 如何做好科研?这份《科研阅读、写作与报告》PPT,手把手教你做科研

  • 奖金675万!3位科学家,斩获“中国诺贝尔奖”!

  • 又一名视觉大牛从大厂离开!阿里达摩院 XR 实验室负责人谭平离职

  • 最新 2022「深度学习视觉注意力 」研究概述,包括50种注意力机制和方法!

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

一夜之间,「AI孙燕姿」火遍全网!相关推荐

  1. 「AI孙燕姿」全网沸腾!AI翻唱大爆发

    一夜之间,「AI孙燕姿」火遍全网. B站上,AI孙燕姿翻唱的林俊杰「她说」.周董「爱在西元前」.赵雷「成都」等等,让一众网友深陷无法自拔.「冷门歌手」孙燕姿新晋成为2023年度热门歌手,掀起许多人的追 ...

  2. 「AI 孙燕姿」翻唱华语乐坛歌曲爆红全网,AI 翻唱将带来哪些影响?是否会有版权等问题?

    在某视频平台上,"AI孙燕姿"成了新网红,它翻唱过周杰伦的<发如雪>.翻唱过郭顶的<水星记>.翻唱过赵雷的<我记得>,受到了网友的追捧,甚至有网 ...

  3. 把狗画成擦边猛男,「AI绘画」能有多离谱?

    文|哈哈哈波特 源|知乎 一个AI绘画小程序日增用户65.7万人,一周内突破100万,这个增长速度也算是一夜爆红了,AI画作一时间在朋友圈传得沸沸扬扬,不仅如此,还迅速引起一波短视频热潮,相关平台更是 ...

  4. 字节跳动技术团队提出「AI渲染」方案,手机端也能实现影视级渲染效果

    随着3D技术的高速发展,影视渲染效果的复杂度.精细度都在逐步提升,但高质量的渲染效果和时间成本往往难以兼顾.针对这一行业痛点,字节跳动智能创作团队基于AI技术的优势提出了「AI渲染」方案.这一方案现已 ...

  5. 腾讯AI Lab x 王者荣耀:开放让「AI+游戏」想象力落地

    感谢阅读腾讯AI Lab微信号第81篇文章.本文将介绍腾讯 AI Lab 与王者荣耀共同推进的 AI+游戏开放平台计划. 8月18日,王者荣耀「无限开放计划交流会」在深圳举办,这是一次「造梦之旅」的开 ...

  6. 奔驰首秀L4自动驾驶:100万最贵电动车展示最豪华「AI代客泊车」

    奔驰首秀L4自动驾驶:100万最贵电动车展示最豪华「AI代客泊车」 奔驰车主自己抡方向盘?不从容也不尊贵,这不解决方案来了>>> 最豪华的AI"代客泊车"长什么样 ...

  7. 2021「AI中国」评选

    文章目录 2021「AI中国」评选 最强技术实力公司TOP 10 最具潜力创业公司TOP 10 最佳人工智能公司 TOP 30 最强技术生态 TOP 10 年度开源事件TOP 10 最具商业价值解决方 ...

  8. 企企通入选「AI中国」机器之心“最具商业价值解决方案 TOP 30” 榜单

    近日,由专业的人工智能信息服务平台机器之心,发起并评选的「AI 中国」机器之心2022 年度评选榜单正式公布,企企通凭借过去一年在采购供应链领域取得的成就,以及在技术.产品.服务能力方面具备的独特优势 ...

  9. 问就是「AI 过」, 你认识的这 7 个 App 都支持 AI 了

    目录 1. 问就是「AI 过」, 你认识的这 7 个 App 都支持 AI 了 1.1. Notion AI 1.2. Carrot Weather 1.3. Warp AI 1.4. Readwis ...

最新文章

  1. POJ-1860-Currency Exchange
  2. 备战618,京东如何保障系统稳定性?
  3. JAVA GUI重要知识点学习心得
  4. 剑指 Offer 11. 旋转数组的最小数字 LCOF
  5. springboot 启动退出终端不停止
  6. Asp.Net Forums研究文章集合(收藏)
  7. postgresql:解决in的效率问题
  8. JavaWeb学习总结(一)JavaWeb入门与Tomcat
  9. 树莓派---MAC下安装AndroidThings
  10. Acrobat XI的破解补丁amtlib.dll可能的一些问题
  11. 基于OpenVINO的端到端DL网络-初步接触OpenVINO提供的例子(win+vs)
  12. ubuntu stardict词典安装
  13. 经常使用Code 39条形码,你了解它吗? 今天就来看看什么是Code 39
  14. Android ViewPager 自定义翻页动画
  15. 游戏策划入门(1)——什么样的创意是能够实现的?
  16. 天黑请闭眼服务器维护中,天黑请闭眼!
  17. 苹果商标计算机辅助设计,苹果 Apple MacBook Pro 15英寸 2019 详细评测报告
  18. Javascript中删除数组中重复出现的元素
  19. java.lang.UnsupportedClassVersionError: com/mysql/jdbc/Driver : Unsupported major.minor version 52.0
  20. 小白一周时间黑水果折腾的过程

热门文章

  1. 如何用xshell上次超过4GB的文件到虚拟机
  2. Part I 空气曲棍球 Chapter4 (4.3 Adding a New Color Attribute)
  3. 七十条超经典英文爱情箴言
  4. es share mac 局域网 文件分享工具/软件
  5. SPI全双工与半双工
  6. RETHINKING THE VALUE OF NETWORK PRUNING 笔记:
  7. 传奇手游腾讯服务器和微信哪个好,传奇手游:对于传奇老玩家来说,玩的是氪金PK还是坚持情怀?...
  8. linux看目录容量,linux查看目录的大小(占用量)
  9. Ant Design入门
  10. Unity 鼠标点击地面移动