自动标注、平滑过渡、音乐鉴权、AI创作,当AI技术应用于音乐行业为人类的精神文化与娱乐生活带来便利和更多选择时,也是一件让人激动不已的事情。

随着深度学习算法的出现、大数据和5G技术的成熟,AI人工智能已逐渐融入我们的生产生活中,在教育、医疗、政务办公、城市管理等多个方面发挥作用。

随着AI技术在音乐行业研究及应用的深入,音乐人工智能已经不新鲜,很多新的应用和产品已经惊艳亮相。

基于对于音乐技术及产品的了解,简单梳理一下目前AI技术在音乐类产品的各类应用场景。

一、自动标注

当平台曲库量达到⼀定量级时,如果再依赖传统的⼈为打标签模式就会花费⼤量成本且受到主观影响较⼤。⾳频⾃动标注相关技术就受到⼴泛关注,⾃动标注的作⽤不仅仅只是能替代⼈⼯标注以达到节省成本,同时可以客观评价⾳乐内容,因此还可以拓展到流媒体播放的⾳乐推荐⽅⾯。

例如:Spodify、KKBOX都有利⽤深度学习做推荐,其中KKBOX采⽤⾳频⽂件、歌词以及⽤户相关标注和评论等数据作为输⼊从曲⻛、场景及情绪等多个维度来判断⾳乐是否满⾜推荐的条件。⼀般的⾃动标注功能也和KKBOX的推荐维度类似,从曲⻛、应⽤场景、器乐和情绪等维度来进⾏标注。


(示例:笔者所在公司旗下平台曲多多,关于音乐标注的标签)

对于⾃动标注,笔者也在⽹上听到过一些不太专业的吐槽,比如之前有看到说音频自动标注可能会出现将一首歌曲的情绪同时标注为“欢乐”和“悲伤”两种情绪。

在解释这⼀原因之前,可以简单普及⼀下机器学习中分类器、单标签多分类任务和多标签多分类任务。

简单来说,分类器就是利⽤已知的输⼊和输出数据来训练,然后该分类器就会对未知的输⼊数据进⾏分类或输出⼀个值。对于⼀个分类器模型,它预测的结果是2个或⼤于2个以上的(结果只有1个代表结果确定就不需要分类模型了)。如果可能的结果数为2称之为⼆分类任务⼤于2就是多分类任务;对于情绪可能有:⾼亢、欢快、安静、悲伤等多个结果,因此情绪分类是⼀个多分类任务。

如果认为情绪模型是⼀个单标签多分类任务,那么绝对是不可能出现”欢乐“和”悲伤”同时出现的情况。如果同时出现“欢乐”和“悲伤”,则只能存在于多标签多分类任务。

⽽“欢乐”和“悲伤”同时出现就⼀定是错误的吗?也不⼀定!

基于深度学习的⾳乐处理⽅式⼀般是分段处理,也就是将⼀⾸⾳乐划分为多个⽚段然后对每⼀个⽚段进⾏预测判断它可能的标签。如果⼀⾸歌曲情绪存在波动,比如一首歌曲的情绪从开始的“欢乐”转向了“悲伤”,那么这种情况也是完全可能出现,现实⽣活中很多歌曲的确是存在多个情绪甚⾄互斥的标签存在的情况。

二、平滑过渡

平滑过渡功能是近⼏年新出现的“炫酷”功能。

简单理解,就是当⼀⾸歌曲快要播放完毕时下⼀⾸歌曲可能⽆缝接⼊,这种歌曲间的平滑过渡,不会让听众觉得非常突兀。

这种功能的实现,也有依赖于基于深度学习的技术。

⼤致原理是将歌曲的末尾⽚段和可能平滑过渡的其他歌曲的头部⽚段作为训练样本。训练出来的模型可以预测当前输⼊⽚段可以过渡的下⼀个⽚段,然后当播放器播放⾄歌曲尾部⽚段的时候利⽤该模型得到可平滑过渡的下⼀⾸歌曲。

三、音乐鉴权

互联网上的音乐侵权一直存在,但音乐版权方要在互联网上维护自己的权益,往往比较困难。

因为互联网具有海量的内容,而且内容形式具有复合性,比如音乐内容仅仅作为视频的背景音乐,靠人工去发现和识别,难度太大。

在这方面,AI技术的运用,已经能够实现实时监控视频、直播或⼴播节⽬中是否有存 在歌曲的侵权情况。

其中的原理是,将版权⽅的曲库中歌曲提取出关键特征保存在集群数据库,然后提取待检测的⾳频特征,并通过⼤数据技术进⾏快速检索数据库中是否存在相似数据。

目前,拥有类似技术的公司,除了笔者所在公司外,ACRCloud也较具有代表性。

四、AI创作

当AI进入到音乐创作层面,在互联网行业也已有不少AI音乐创作工具,Amper Music、AIVA、Jukedeck、Ecrett Music、Melodrive、等ORB Composer等。

公司层面,索尼、谷歌、百度以及人工智能非营利组织OpenAI等均在AI作曲领域有所尝试。

2016年,索尼公司使用一种名为“流机器”(Flow Machines)的软件,创作了一首披头士(Beatles)风格的旋律,然后作曲家伯努瓦卡雷(Benoit Carre)将其制作成一首完整的流行歌曲《Daddy ‘s Car》(爸爸的车)。

2018年,微软宣布第四代小冰加入到虚拟歌手市场竞争当中,并“演唱”了一首《隐形的翅膀》。

AIVA科技开发的AI作曲家“Aiva”创作摇滚乐曲《On the Edge》并与歌手Taryn Southern合作创作流行乐曲《Love Sick》;

在国内,笔者所在公司的相关产品在AI智能创作上,能够实现识曲(识别音乐作品中的音乐元素)、作词、作曲等功能,并已实现了商业化授权和应用。


在具体的AI智能音乐创作层面,AI作曲工具可辅助创意生成。

如英国音乐制作人Alexa Da Kid利用IBM沃森认知计算平台中的机器学习音乐生成算法创作出单曲《Not Easy》、歌手Taryn Southern与AI作曲公司Amper Music开发的工具共同创作出《Break Free》与Aiva合作创作流行乐曲《Love Sick》。这些作品都曾一度成为热播曲目。

随着越来越多AI音乐创作工具的诞生,充当音乐人的辅助,协助创作出更多优质的作品,AI作曲家的音乐创作能力也在逐渐得到认可。

五、结语

当AI遇上音乐,音乐被注入了越加鲜活的生命力,智能化大潮来袭,AI+音乐,未来值得期待!

AI技术在音乐类产品中的应用场景!相关推荐

  1. 音乐类产品——“网易云音乐”app交互原型模板(免费使用)

    网易云音乐虽是一款音乐app,但有人说它也是社交界的一股清流以及一匹黑马.音乐带给人的感染,激发着很多人在这里表达着他们的情绪和心声.网易云音乐上的真实用户点评,不仅被印在地铁的广告牌上,还在朋友圈频 ...

  2. 快手技术副总裁王仲远:AI技术让音乐创作进入普惠阶段

    近日,快手技术副总裁王仲远做客由新浪新闻.封面新闻联合推出的<未来媒体访谈>节目智能媒体专题,分享"AI音乐+短视频"的可能性,探讨AI歌手的优势与短板,展望AI音乐的 ...

  3. AI技术在图像水印处理中的应用

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 简介 水印作为一种保护版权的有效方式被广泛地应用于海量的互联网图像 ...

  4. 精准评论是如何在娱乐类产品中大放异彩?

    作者把能够精准评论特定内容的评论方式统一称为精准评论.具体来讲,精准评论包括小说类产品的单句评论.漫画类产品的定点评论.视频类产品的弹幕以及直播类产品的即时评论这四种形式.这四者虽然表现形式不同,但它 ...

  5. AI技术在智能海报设计中的应用

    背景 在视觉设计领域中,设计师们往往会因为一些简单需求付出相当多的时间,比如修改文案内容,设计简单的海报版式,针对不同机型.展位的多尺寸拓展等.这些工作需要耗费大量的时间.人力成本(5~6张/人日), ...

  6. 区块链技术在电子档案管理中的应用场景分析

    在上一篇文章<区块链基本特性及其与电子档案管理的契合点>中已经提到,基于区块链技术"去中心化.不可篡改.公开透明.可追溯"等基本特性,有望解决电子档案管理中可信管理.资 ...

  7. 如何利用AI技术在零售业做产品创新——京东无人超市的成长之路

    摘要:11月30日至12月3日,第七届全球软件案例研究峰会(简称TOP100summit)在北京举行,来自京东的无人超市产品负责人高颖带来了精彩分享. 2017年,无人零售突然爆火成为了新的风口,无数 ...

  8. 谷歌开源语音识别AI技术,可以从人群中区分每个人的发言

    虽然机器语音识别的准确率已经很高,但是从一群人嘈杂的沟通交流中区分每个人说了什么,对于机器来说还是一个艰巨的挑战.Speaker Diarization(发言者语音片段切分归类)是一个将群组发言中不同 ...

  9. 干货 | 语音识别类产品细分及其应用场景

    让机器能听会说.能理解会思考还远吗?首先要实现的,就是"听"的功能. 芝麻开门! 你的童年是否也曾这样对着大门发出命令? 当然,大门用静止表示对你的"忽视".乐 ...

最新文章

  1. 我想说:mysql 的 join 真的很弱
  2. 【集合论】二元关系 ( 定义域 | 值域 | 域 | 逆运算 | 逆序合成运算 | 限制 | 像 | 单根 | 单值 | 合成运算的性质 )
  3. PHP操作mongoDB:conn crud
  4. .net5或.net6(Preview) 之 顶级语句
  5. 查询分析器在哪里_你应该知道的3种Node.js分析器类型
  6. vue-cli@2的原理解析
  7. Android 视频通信,低延时解决方案
  8. 2020年国内电影总票房突破100亿元
  9. 20 年“码龄”的老程序员如何看编程发展?
  10. MySQL常用命令收录
  11. 爱默生电梯维修服务器,爱默生电梯故障代码及导致原因和解决方法
  12. 低配置电脑最适合系统—win10企业版2016长期服务版本密钥和激活方法
  13. 深入理解Attention及变种(三)
  14. python判断火车票座位_利用Python实现命令行版的火车票查看器
  15. 操作系统Unix、Windows、Mac OS、Linux的故事
  16. HDU5438--Ponds (拓排+BFS)
  17. sql server中datename函数的使用
  18. 致那些徘徊在测试界的屌丝
  19. phpstudy_pro启动mysql后循环停止又重启
  20. 普利姆算法解决最短修路问题

热门文章

  1. 【DIY电动滑板车】
  2. 改进YOLO系列 | 添加轻量化Decouple_Head 和 ASFF_Head
  3. win10下易语言程序运行出现“failed to load kernel library”情况
  4. android 8.0.0-r1 源码编译遇到的问题build/core/main.mk:21: recipe for target 'run_soong_ui' failed 解决
  5. char[]转化成lpctstr
  6. 基于c语言的数字pid控制算法及实现,基于C语言的数字PID控制算法及实现.pdf
  7. 【达内课程】面向对象之抽象类
  8. 时序数据库TDengine基本概念和建模思路
  9. 【模拟IC】版图的基础操作和基础知识总结(1)
  10. 郑州存量房还够卖半年 放松限购的可能性不大