最好用的音轨分离软件spleeter:处理一首歌仅几秒,上线一周收获2.4k星 | 附实测...
晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI
喜欢自己用手机K歌?但K歌App里人声往往清除得不够干净,录制起来效果一般。
现在有个AI神器可以干净地剥离歌曲里的乐器声啦。
来自法国的音乐流媒体公司Deezer开源了一个音轨分离软件spleeter,只需输入一段命令就可以将音乐的人声和各种乐器声分离,支持mp3、wav、ogg等常见音频格式。
这款软件基于TensorFlow开发,效果拔群,有网友说自己曾经试过无数类似软件,spleeter是最好用的一个。
量子位尝试了周杰伦的新歌《说好不哭》,人声轨道在开头部分几乎实现了静音,听不到任何乐器声,直到26秒才开始出现周杰伦的歌声:
而伴奏部分在整个过程中仅有极少量微弱的换气声:
spleeter还支持GPU加速。如果在GPU上运行,会比实时分解速度快100倍,也就是说分解一首5分钟的歌曲只需要3秒。
spleeter在GitHub上线仅仅一周,就收获了2.4K星,在Hacker News上也有1000+的热度。
最多分离5个音轨
用户可以根据自己的需求来训练模型,Deezer还给出了在musdb数据集上的预训练模型,因此能直接拿来使用。
在官方提供的预训练模型里,spleeter可将人声和乐器声分为2个音轨,已经能满足基本的要求。
此外它还能把乐器声进一步分离为鼓、贝斯、钢琴及其他乐曲,加上人声,spleeter最多可以分离出5个音轨。
其中,2个音轨和4个音轨的模型在musdb据集上均具有最先进的性能。
使用方法
spleeter可以从conda或者pip安装。
如果用conda安装,可以选择CPU或者GPU环境,以CPU环境为例:
git clone https://github.com/deezer/spleeter
conda env create -f spleeter/conda/spleeter-cpu.yaml
conda activate spleeter-cpu
如果想换成GPU环境,只需将上述代码中的spleeter-cpu换成spleeter-gpu。
在分离音轨的命令中,加入选项-p spleeter:4stems来指定音轨数量,如果不加,系统默认分离为2个音轨。
spleeter separate -i audio_example.mp3 -o audio_output -p spleeter:4stems
最终乐器和人声将以wav文件的格式保存在audio_output文件夹中。
分离过程可以在GPU或CPU上执行。在GPU上运行,速度非常快,可以实现100倍的加速。
经过实测,在单个英伟达 GTX 1080上,spleeter只用了90秒就分解完了3小时27分钟长度的musDB测试数据。
pip安装更简单,但是不支持GPU加速,一般分解一两首歌已足够使用:
pip install spleeter
传送门
项目地址:
— 完 —
大咖齐聚!量子位MEET大会报名开启
量子位 MEET 2020 智能未来大会启幕,将携手优秀AI企业、杰出科研人员呈现一场高质量行业峰会!VIP票即将售罄,快扫码报名吧~
榜单征集!三大奖项,锁定AI Top玩家
2019中国人工智能年度评选启幕,将评选领航企业、商业突破人物、最具创新力产品3大奖项,并于MEET 2020大会揭榜,欢迎优秀的AI公司扫码报名!
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !
最好用的音轨分离软件spleeter:处理一首歌仅几秒,上线一周收获2.4k星 | 附实测...相关推荐
- 声学测试软件手机版_免费5G SA测试软件“网络优化资源服务助手”2.0版全新上线,新增多种功能!(附下载方式)...
"网络优化资源服务助手APP"2.0版全新上线 在本主编上次推出1.3版后,该APP经过1.4,1.5,1.6,1.7,1.8,1.9版本迭代,现在2.0版正式上线,软件优化了很多 ...
- pulse 去马赛克软件_打马赛克就安全了吗?AI消除马赛克,上线三天收获近7000星...
机器之心报道 作者:魔王.小舟 还在用马赛克的方式隐藏密码?小心被「看穿」. 像素化(又称马赛克)是一种常见的打码方式,通过降低图像中部分区域的分辨率来隐藏某些关键信息,比如: 再比如: 看图找马赛克 ...
- 伴奏人声分离软件看这篇介绍就够了
不知道各位小伙伴是否跟我一样有个习惯,就是在睡前刷一刷短视频,给大脑充分放松"按按摩",从而让自己能睡个好觉.我自己可以说是短视频的深度"患者"了,因为我喜欢看 ...
- html5音轨的提取,(图文)mkv音轨提取软件 如何提取mkv中的音轨
很多人都知道,MKV是个"组合"和"封装"的格式,换句话说就是一种容器格式.最大的特点就是能容纳多种不同类型编码的视频.音频及字幕流.现在流行的高清电影一般都是 ...
- 有什么软件可以测试win10电脑性能,微软能否翻盘 Win10系统4K高分优化实测
1Win10系统4K高分优化实测 Win10发布在即,对于新系统不同的用户有不同的期待,随着高分显示器越来越多,Win10对于高分辨率的优化会有什么新的进步?相信不少用户对于Win10抱有很大的期望, ...
- as5300g2 nas软件功能_硬件与软件齐飞,首款支持2.5G网络的品牌NAS-华芸AS-5202T测评体验...
硬件与软件齐飞,首款支持2.5G网络的品牌NAS-华芸AS-5202T测评体验 2019-06-19 17:14:23 47点赞 274收藏 86评论 你是AMD Yes党?还是intel和NVIDI ...
- 数学题 识别 批改 python_这款软件能帮小学老师家长批作业 1秒扫描口算题圈错 准确率95%...
原标题:这款软件能帮小学老师家长批作业 1秒扫描口算题圈错 准确率95% ◆ 创始人陈明权一直在致力于发现生活中的需求,并通过技术去帮助人们提高效率. 文| 铅笔道 记者 刘璐明 "爱作业& ...
- 制作midi和编辑音轨的软件
音频处理 和 midi 制作是2个概念 1.音频处理用 cooledit 算是最简单上手的,效果是灰色是因为你在 单轨界面的时候没有选定要处理的 波形[用鼠标点住向右拉,选定要处理的区域,再看效果就亮 ...
- SpleeterGUI 歌曲人声伴奏分离软件
SpleeterGUI: https://makenweb.com/SpleeterGUI Spleeter: https://github.com/deezer/spleeter SpleeterG ...
- mysql 读写分离软件_MySQL Atlas 读写分离软件介绍
MySQL Atlas介绍 一.MySQL Atlas介绍 1.1.1 MySQL Atlas介绍 MySQL Atlas介绍 Atlas是由 Qihoo 360, Web平台部基础架构团队开发维护的 ...
最新文章
- 团队开发中的 Git 实践
- 词法,语法,句法,语义
- c语言程序设计案例教程(第2版)笔记(三)—变量、结构体
- sublimeclang里面使用相对路径
- Deep Alignment Network(人脸对齐)
- 电信级的RSA加密后的密码的破解方法
- javascript案例大全_JavaScript 中文资源大全,你值得拥有
- 你对java的看法 论文,一篇文章让你真正了解Java
- RFC2544性能测试
- 创客使用Fusion 360 - 制作模型
- PHP 不同地图坐标系经纬度转换 GCj02 WGS84 BD-09
- 【python】透小菜参加了华为和阿里的笔试。
- Python爬取京东任意商品数据实战总结
- 京东股权众筹平台的玩法和价值
- 新的一年软件测试行业的趋势能够更好?
- 蒙特卡洛方法的使用:计算pi值与积分计算
- 【洛谷P4233】— 射命丸文的笔记(竞赛图+多项式求逆)
- 小程序碰上浏览器搜索入口!
- 动态规划之扔鸡蛋(或手机)问题
- 05-06德甲揭幕战,拜仁首战告捷!