6月6日,2021全球人工智能技术大会“发展与挑战”专题论坛在杭州举行。快手技术副总裁、MMU&Y-tech负责人王仲远出席论坛并发表《音乐与技术的碰撞交融——艺术如何随时代变迁》主题演讲,分享快手在AI音乐方面的动态与进展,充分展现快手领先的人工智能技术,以及AI音乐为短视频带来的强大助力。

AI技术+音乐深度融合,快手持续提升短视频观看体验

作为国民短视频APP,快手拥有海量内容、超大流量和高用户粘性。数据显示,平均每月快手用户上传的短视频数量超11亿,整体日活达3.7亿+,用户平均每日在快手平台观看短视频和直播内容的时长近100分钟

在丰富的快手社区生态中,音乐成为激励用户创作的因素之一。在快手,76%的快手作品有配乐,90%的快手用户期望大部分短视频有配乐。

为何用户在创作短视频时,对于音乐有如此强的依赖性?王仲远表示:“对于短视频的制作体验而言,音乐的正向影响至关重要。比如唯美风短视频如果去掉背景音乐只剩原始声音,就会削弱其氛围感,给用户留下与之前截然不同的印象。”

对此,王仲远进一步分析了音乐的独特魅力。在他看来,音乐可以与人的思想情绪联系在一起,能够让人感到欢喜,感到悲伤,感到期待等。当中国人听到春节序曲时,往往会产生一种春回大地、万物复苏的感受,央视春晚主持人的开场词也不自觉在脑海中浮现。

作为一种具有魔力的艺术表现形式,音乐也随着技术的发展而产生新的形式。在工业化时代,制造工艺的改进使得乐器可以发出的声音更加丰富、层次化。在电子化时代,电子技术的发展创造出自然界机械无法发出的声音,音乐的表现力更加多元化。

如今,步入人工智能时代,AI技术则帮助音乐实现全面的个性化和智能化,为音乐和短视频带来了新的发展空间。据王仲远介绍,前段时间火爆全网的《蚂蚁呀嘿》正是将音乐和视觉AI技术进行了创意融合,用户只需要一张照片就可以自动生成诙谐好玩的动态唱歌视频,再加上魔性的BGM,很快成为短视频用户争相创作的模板。

AI技术推动音乐大众化,快手自建模型还原专业级演唱

在技术的加持下,音乐制作进入大众化时代。如何帮助更多用户创作出个性化的音乐?快手自主研究了AI音乐创作模型AI歌手

从音乐制作流程上来看,大多偏向于流水线化、工程化和模块化,首先是把握创作动机,然后进行作词、作曲,之后进行编曲,最后录音和混音。而通过快手搭建的AI模型,其中的每一步都可以借助AI完成。

王仲远表示:“在AI时代,动机变得十分简单。把随机关键词输入快手AI音乐模型中,模型就能把词转换成动机的一种表示,乃至于各种初始化的音乐。”

确定好动机之后就可以利用快手AI模块生成歌词。在AI歌词方面,快手针对数百万已有歌曲对模型进行重新训练,以确保AI可以很好地理解词义,让用户只需输入一个主题、一个情感、一个风格,就能在数秒内生成数十首歌词。

在AI旋律的创作上,快手也采用类似方法,搭建了数十万首曲谱和百万首歌曲音频训练模型再通过迷你数据库让模型自监督学习歌曲的内在关联,从而训练AI旋律生成的能力。

据了解,快手邀请了平台内的音乐人使用AI模型来创作新歌曲,已创作的流行音乐有《甜甜的味道》《夜》《勇往直前》等。

录制一首高质量的成品歌曲,对歌手的演唱水平要求极高。为了解决部分用户面临的唱歌跑调、音色不好听等问题,快手则推出了AI歌手辅助创作功能,并不断提升其模型的精准度。

据介绍,2020年5月,AI歌手的演唱还是KTV水平;到2020年12月,普通人已经很难发现AI歌手演唱中的瑕疵;如今,模型会根据曲谱自动调整音高、节拍和歌词,AI歌手可以逼真地还原出专业级歌手的演唱水平。

演讲最后,王仲远表示:“未来,快手还将探索更多新技术,丰富生成侧的玩法。借助语音识别技术,快手希望AI歌手将来可以模仿个人音色,AI音乐则能够把说的话直接转成歌曲,满足用户更个性化的音乐创作需求,持续助力短视频领域创作。”

重磅!DLer-CVPR2021论文分享交流群已成立!

大家好,这是CVPR2021论文分享群里,群里会第一时间发布CVPR2021的论文解读和交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

???? 长按识别,邀请您进群!

快手:魔性BGM你把握不住的,让AI来相关推荐

  1. 算法炒房三月亏20多亿!房地产巨头大翻车:房价水太深,AI根本把握不住

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 明敏 丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 就 ...

  2. 算法炒房三月亏20多亿。房地产巨头大翻车:房价水太深,AI根本把握不住

    就离谱! 一年前靠着一套算法营收30亿美元,一年后还是同样的算法,却造成资金大缺口,不得不裁员.变现手上资产. 没想到,炒房平台用上AI算法,会这么刺激. 是的,你没看错,这年头连AI都会炒房了,而且 ...

  3. 《面试技巧》孩子,听叔一句劝,面试水太深,你把握不住。

    人世仙家本自殊,何须相见向中途.惊鸿瞥过游龙去,漫恼陈王一事无. 嗨,大家好,我是洛神,性别男.一个来自快乐星球的程序员. 欢迎大家专注我的公众号[程序员洛神],绝对让你有意外收获哟 前言 首先要先向 ...

  4. 算法炒房三月亏20多亿!房地产巨头大翻车:房价水太深,AI也把握不住?

    明敏 丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 就离谱! 一年前靠着一套算法营收30亿美元,一年后还是同样的算法,却造成资金大缺口,不得不裁员.变现手上资产. 没想到,炒房平台用上A ...

  5. 听皮皮一句劝zIndex 的水太深,你把握不住!

    前言 本文基于 Cocos Creator 2.4.5 撰写. ???? 普天同庆 来了来了,<源码解读>系列文章终于又来了! ???? 温馨提醒 本文包含大段引擎源码,使用大屏设备阅读体 ...

  6. 阿里测试面试官:年轻人你把握不住......

    哈喽,我是小野,这里赠送一份软件测试资料. 1.软件测试学习路线 2.软件测试视频资料 3.软件测试相关文档 4.软件测试相关工具.安装包 5.高级测试工程师简历模板 6.面试题.模拟面试.PDF文档 ...

  7. iPhone必崩溃bug曝光!这个WiFi水太深谁也把握不住

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI iPhone又出现漏洞了,这个漏洞能让你手机一连WiFi就崩溃. 如果有人把WiFi名称(SSID)设置成一串特殊字符,那么你要小心了,因 ...

  8. 网上的假货太多,你把握不住的,让AI来

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 还在发愁网购的东西可能是假货? 现在,阿里自己搞了个AI打假师,让算法来协助打假了! 只要让它看一眼想辨认的商品照片,它就能在几十毫秒的时间 ...

  9. 【听哥一句劝,C++水很深,你把握不住啊!】C++提高班之 符与*符

    C++提高班之 &符与*符 像&和*这样的符号,既可以作为表达式中的运算符,也能作为声明的一部分出现,符号的上下文决定了符号的意义: int i = 27;int &r = i ...

最新文章

  1. tomcat访问webapp下面工程的文件含有软连接
  2. 华硕服务器性能,华硕45nm四核服务器主板突破性能瓶颈
  3. 视频编解码(四):编辑器驱动移植步骤(VE)
  4. ArcGIS三种方式打断相交线------拓扑法
  5. 产品读书《产品经理的第二本书》
  6. Qt 之字体设置(QFont)详解
  7. 周末不知道学什么?这份 Android 优秀技术文章清单请收下
  8. 疫情下的校园生活是咋样的?
  9. 阿里云建站套餐怎么样?具体建站流程
  10. 亿沃钛计算机科技有限公司怎么样,2017年8月联通沃指数发布:高德地图活跃用户2.17亿,排名行业第一...
  11. 基于西门子S7-1200PLC的步进电机控制
  12. 29.递归三元表达式生成式匿名函数
  13. python符号积分
  14. 带着老娘和女儿看《孔子》
  15. js点击网页背景特效和js打字状态特效代码
  16. isDebugEnabled作用
  17. 解决webSocket中使用@Autowired注入为空的办法
  18. 用计算机搞音乐,用电脑键盘做音乐
  19. 一文搞懂Spring,堪称Spring源码终结者
  20. 基于稳态视觉诱发电位(SSVEP)的中文拼写器脑机接口(BCI)对于应用于ALS患者

热门文章

  1. angular例子笔记
  2. 4、Eternal框架-持有者
  3. 网络工程师必须具备的素质
  4. 系统架构设计_系统工程师--系统架构设计
  5. android button背景图片自适应,Android开发之给你的Button加个背景
  6. Linux学习(十三)---搭建JavaEE环境
  7. np.random.permutation
  8. 详解可视化利器 t-SNE 算法:数无形时少直觉
  9. RuntimeError: output with shape [1, 28, 28] doesnt match the broadcast shape [3, 28, 28]
  10. 接受者操作特征曲线ROC