晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

喜欢自己用手机K歌?但K歌App里人声往往清除得不够干净,录制起来效果一般。

现在有个AI神器可以干净地剥离歌曲里的乐器声啦。

来自法国的音乐流媒体公司Deezer开源了一个音轨分离软件spleeter,只需输入一段命令就可以将音乐的人声和各种乐器声分离,支持mp3wavogg等常见音频格式。

这款软件基于TensorFlow开发,效果拔群,有网友说自己曾经试过无数类似软件,spleeter是最好用的一个。

量子位尝试了周杰伦的新歌《说好不哭》,人声轨道在开头部分几乎实现了静音,听不到任何乐器声,直到26秒才开始出现周杰伦的歌声:

而伴奏部分在整个过程中仅有极少量微弱的换气声:

spleeter还支持GPU加速。如果在GPU上运行,会比实时分解速度快100倍,也就是说分解一首5分钟的歌曲只需要3秒

spleeter在GitHub上线仅仅一周,就收获了2.4K星,在Hacker News上也有1000+的热度。

最多分离5个音轨

用户可以根据自己的需求来训练模型,Deezer还给出了在musdb数据集上的预训练模型,因此能直接拿来使用。

在官方提供的预训练模型里,spleeter可将人声和乐器声分为2个音轨,已经能满足基本的要求。

此外它还能把乐器声进一步分离为鼓、贝斯、钢琴及其他乐曲,加上人声,spleeter最多可以分离出5个音轨。

其中,2个音轨和4个音轨的模型在musdb据集上均具有最先进的性能。

使用方法

spleeter可以从conda或者pip安装。

如果用conda安装,可以选择CPU或者GPU环境,以CPU环境为例:

git clone https://github.com/deezer/spleeter
conda env create -f spleeter/conda/spleeter-cpu.yaml
conda activate spleeter-cpu

如果想换成GPU环境,只需将上述代码中的spleeter-cpu换成spleeter-gpu。

在分离音轨的命令中,加入选项-p spleeter:4stems来指定音轨数量,如果不加,系统默认分离为2个音轨。

spleeter separate -i audio_example.mp3 -o audio_output -p spleeter:4stems

最终乐器和人声将以wav文件的格式保存在audio_output文件夹中。

分离过程可以在GPU或CPU上执行。在GPU上运行,速度非常快,可以实现100倍的加速。

经过实测,在单个英伟达 GTX 1080上,spleeter只用了90秒就分解完了3小时27分钟长度的musDB测试数据。

pip安装更简单,但是不支持GPU加速,一般分解一两首歌已足够使用:

pip install spleeter

传送门

项目地址:

大咖齐聚!量子位MEET大会报名开启

量子位 MEET 2020 智能未来大会启幕,将携手优秀AI企业、杰出科研人员呈现一场高质量行业峰会!VIP票即将售罄,快扫码报名吧~

榜单征集!三大奖项,锁定AI Top玩家

2019中国人工智能年度评选启幕,将评选领航企业、商业突破人物、最具创新力产品3大奖项,并于MEET 2020大会揭榜,欢迎优秀的AI公司扫码报名!

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

最好用的音轨分离软件spleeter:处理一首歌仅几秒,上线一周收获2.4k星 | 附实测...相关推荐

  1. 声学测试软件手机版_免费5G SA测试软件“网络优化资源服务助手”2.0版全新上线,新增多种功能!(附下载方式)...

    "网络优化资源服务助手APP"2.0版全新上线 在本主编上次推出1.3版后,该APP经过1.4,1.5,1.6,1.7,1.8,1.9版本迭代,现在2.0版正式上线,软件优化了很多 ...

  2. pulse 去马赛克软件_打马赛克就安全了吗?AI消除马赛克,上线三天收获近7000星...

    机器之心报道 作者:魔王.小舟 还在用马赛克的方式隐藏密码?小心被「看穿」. 像素化(又称马赛克)是一种常见的打码方式,通过降低图像中部分区域的分辨率来隐藏某些关键信息,比如: 再比如: 看图找马赛克 ...

  3. 伴奏人声分离软件看这篇介绍就够了

    不知道各位小伙伴是否跟我一样有个习惯,就是在睡前刷一刷短视频,给大脑充分放松"按按摩",从而让自己能睡个好觉.我自己可以说是短视频的深度"患者"了,因为我喜欢看 ...

  4. html5音轨的提取,(图文)mkv音轨提取软件 如何提取mkv中的音轨

    很多人都知道,MKV是个"组合"和"封装"的格式,换句话说就是一种容器格式.最大的特点就是能容纳多种不同类型编码的视频.音频及字幕流.现在流行的高清电影一般都是 ...

  5. 有什么软件可以测试win10电脑性能,微软能否翻盘 Win10系统4K高分优化实测

    1Win10系统4K高分优化实测 Win10发布在即,对于新系统不同的用户有不同的期待,随着高分显示器越来越多,Win10对于高分辨率的优化会有什么新的进步?相信不少用户对于Win10抱有很大的期望, ...

  6. as5300g2 nas软件功能_硬件与软件齐飞,首款支持2.5G网络的品牌NAS-华芸AS-5202T测评体验...

    硬件与软件齐飞,首款支持2.5G网络的品牌NAS-华芸AS-5202T测评体验 2019-06-19 17:14:23 47点赞 274收藏 86评论 你是AMD Yes党?还是intel和NVIDI ...

  7. 数学题 识别 批改 python_这款软件能帮小学老师家长批作业 1秒扫描口算题圈错 准确率95%...

    原标题:这款软件能帮小学老师家长批作业 1秒扫描口算题圈错 准确率95% ◆ 创始人陈明权一直在致力于发现生活中的需求,并通过技术去帮助人们提高效率. 文| 铅笔道 记者 刘璐明 "爱作业& ...

  8. 制作midi和编辑音轨的软件

    音频处理 和 midi 制作是2个概念 1.音频处理用 cooledit 算是最简单上手的,效果是灰色是因为你在 单轨界面的时候没有选定要处理的 波形[用鼠标点住向右拉,选定要处理的区域,再看效果就亮 ...

  9. SpleeterGUI 歌曲人声伴奏分离软件

    SpleeterGUI: https://makenweb.com/SpleeterGUI Spleeter: https://github.com/deezer/spleeter SpleeterG ...

  10. mysql 读写分离软件_MySQL Atlas 读写分离软件介绍

    MySQL Atlas介绍 一.MySQL Atlas介绍 1.1.1 MySQL Atlas介绍 MySQL Atlas介绍 Atlas是由 Qihoo 360, Web平台部基础架构团队开发维护的 ...

最新文章

  1. 团队开发中的 Git 实践
  2. 词法,语法,句法,语义
  3. c语言程序设计案例教程(第2版)笔记(三)—变量、结构体
  4. sublimeclang里面使用相对路径
  5. Deep Alignment Network(人脸对齐)
  6. 电信级的RSA加密后的密码的破解方法
  7. javascript案例大全_JavaScript 中文资源大全,你值得拥有
  8. 你对java的看法 论文,一篇文章让你真正了解Java
  9. RFC2544性能测试
  10. 创客使用Fusion 360 - 制作模型
  11. PHP 不同地图坐标系经纬度转换 GCj02 WGS84 BD-09
  12. 【python】透小菜参加了华为和阿里的笔试。
  13. Python爬取京东任意商品数据实战总结
  14. 京东股权众筹平台的玩法和价值
  15. 新的一年软件测试行业的趋势能够更好?
  16. 蒙特卡洛方法的使用:计算pi值与积分计算
  17. 【洛谷P4233】— 射命丸文的笔记(竞赛图+多项式求逆)
  18. 小程序碰上浏览器搜索入口!
  19. 动态规划之扔鸡蛋(或手机)问题
  20. 05-06德甲揭幕战,拜仁首战告捷!

热门文章

  1. (转)用 Asterisk 搭建自己的免费 VoIP 服务器
  2. 怎样用java抽签小程序,可以作弊的抽签小程序,急求java抽签小程序
  3. i3wmvim终极配置
  4. VS2015彻底卸载干净
  5. 谷歌Adblock Plus 广告拦截插件-屏蔽百度热搜和推荐(附网盘下载地址)
  6. Labview调用python
  7. AE一键去黑底的插件UnMult
  8. 马尔可夫链、隐马尔科夫模型、贝叶斯网络、因子图
  9. Blender全新毛发工具演示露出,预计9月份正式更新
  10. Python爬虫书籍推荐