每当夜深人静时,你打开网易云音乐,或听歌刷乐评,或看直播闲聊,享受着以心交心的放松愉悦。在这背后,有一群技术人员苦思冥想地探索着,只为让“云村”越来越懂你。

“不同于一般的聊天文本或图片,音乐本身是跨域数据,具备若干特征,数据维度非常多。而1.8亿月活海量用户的音乐相关数据,带来的计算量、推荐量、参数规模都巨大无比。”网易云音乐机器学习平台技术团队意识到,在这样复杂问题面前,传统机器学习方法渐渐无力招架。

此外,云音乐的直播业务兴起,商业化表现良好,团队的担子更重了,“直播行为与音乐行为差异甚大,这意味着计算量与难度进一步增加。”压力之下,该团队将目光瞄向“图神经网络”,并最终选择应用百度飞桨PGL图神经网络技术来迭代升级云音乐的推荐系统。

推荐系统为何需要图神经网络?

作为全球知名音乐社区,网易云音乐在繁荣发展的同时,其推荐系统面临三大难题:囊括音乐、歌单、Mlog、直播、云圈、动态等的多域数据;海量用户产出的超大规模数据;超30万音乐人发布歌曲,超28亿用户产生歌单,27%用户交流/生产内容构成的动态数据标签。

传统的机器学习方法需要严格制定一套规范来提取样本,逐项指定样本的各个特征。但云音乐用户产生的多域数据,可能会有若干个特征,加上近2亿的用户规模以及高频率的动态更新,必须进行巨量的计算,机器学习方法的训练效率因此大受限制,变得十分低效。

而图神经网络技术的约束性较小,把每个用户当做点,用户的标签作为边,不同用户之间基于点和边的关联形成网,在此基础上建模分析,因此能更高效地表征、筛选某一类用户。比如,当两位素不相识的宝妈,同样爱听某些亲子歌曲时,她们在“图”中就有可触达的连接,模型会根据这些连接关系学习出合适的表征,并把这些亲子歌曲推荐给相似的用户群体。

事实上,图神经网络已经成为目前互联网企业高效表征用户与内容结构的关键技术。既能基于用户在歌曲、歌单、动态、Mlog等各方面的跨域行为联合建模;又能支持多种行为子图,如深挖用户在歌曲方面的播放、点赞行为;并支持载入用户节点的画像特征与内容节点的类型特征;还支持灵活扩展,如适用音乐业务场景的图神经网络应用能很方便地迁移改造用来支持直播业务场景。

飞桨PGL图神经网络的三大领先能力

市面上提供图神经网络技术的厂商不少,说起选择百度飞桨PGL的原因,网易云音乐机器学习平台技术团队总结了三点:飞桨PGL支持超大规模数据的全图存储、子图检索、高效图学习三大领先能力。

团队曾经尝试过多家国内外顶级厂商的图神经网络技术,其中两家国际大厂的产品没有现成的分布式编程范式,无法高效地处理超大规模图模型训练当中遇到的图存储、分布式训练等问题,在单机层面顶多支持到千万级别或亿级别,而到了百亿甚至千亿级别,只有飞桨PGL挺住了。
据介绍,云音乐的数据规模非常庞大,数据关系即使经过裁剪也高达千亿级别以上。而飞桨PGL技术,原生支持分布式图存储和分布式采样,可将图的特征存储在不同的Server上,也支持将不同子图的采样分布式处理,并基于PaddlePaddle Fleet API来完成分布式训练,实现在分布式的“瘦计算节点”上加速计算,因而能够为云音乐处理高达百亿级别的大规模数据。

不仅如此,飞桨PGL实现了极低成本的大规模图存储,这让网易云音乐技术团队非常认可。“飞桨PGL的分布式图存储方案比较灵活,适合云音乐,能快速搭起若干个分布式网络,无需专业数据库存储底层能力,存储成本降低70%+。”在4亿节点与400亿边数据这样的场景下,飞桨PGL的分布式图引擎资源,以60弹性节点(4CPU,16GB)的配置,可提供比中心化数据库更简单、更灵活的存储服务。

再者,他们团队还体验到飞桨PGL的另一个优点,即灵活的子图检索模式。飞桨PGL不仅预置常用模式,同时联动分布式图存储引擎,支持自定义子图检索模式,更符合业务实际需求,使用起来更顺手更高效。

飞桨PGL给网易云音乐技术团队印象最深的一次是,用不到30多台闲置老旧CPU机器在1天内训练完100个epoch数百亿边的LightGCN模型。这在业内人士听来可能会有些不可思议。“要是换成过去那种单机方案很难实现,因为内存早已爆掉了,无法存储这么巨大的图。”团队成员介绍道,也许还有其他方案能实现,但飞桨PGL的方案,性价比极高,适合大规模应用。云音乐的推荐系统采用飞桨PGL技术后,在冷门歌曲分发、云村广场、陌生人一起听等多个细分业务场景的效率都有不同程度的显著提升,最高甚至提升了近一倍。

可以说,飞桨PGL所提供的支持超大规模数据的极低成本全图存储、灵活子图检索、高效图学习等能力,在云音乐的工业实践中真正用下来,发现都是能够满足实际需要的。这正是飞桨平台源于产业实践,更适合产业应用的最好证明。

飞桨PGL图神经网络打开应用新空间

基于超大规模复杂数据的用户与内容理解是许多互联网内容企业所面临的共同课题。而飞桨PGL图神经网络技术在网易云音乐的成功落地,佐证了自身作为企业可用的高性价比超大规模图神经网络方案的强大实力,将助力这些企业高效、低成本地表征用户与内容,创建完善精准推荐机制,做用户的“知心人”,进而催生新形态新模式,从中获取商业收益。

接下来网易云音乐机器学习技术团队还将立足云音乐的实践,探索图神经网络技术与AI的深度融合创新,如构建音乐社区的用户和内容理解中台,以及基于知识图谱的图神经网络落地应用;并计划与飞桨一起反哺开源社区,助推图神经网络技术在产业界广泛落地。

图神经网络PGL助力国民级音乐App,创新迭代千亿级推荐系统(人工智能应用案例)相关推荐

  1. 千亿级的数据难题,优酷工程师怎么解决?

    阿里妹导读:优酷一天的日志量会达到千亿级别,面对如此大的数据样本,2017年5月,优酷完成了从Hadoop迁移到阿里云MaxCompute,实现计算消耗和储存的消耗呈下降趋势,得到了非常大的收益.今天 ...

  2. 千亿级的数据难题,优酷工程师怎么解决

    优酷一天的日志量会达到千亿级别,面对如此大的数据样本,2017年5月,优酷完成了从Hadoop迁移到阿里云MaxCompute,实现计算消耗和储存的消耗呈下降趋势,得到了非常大的收益.今天,阿里数据技 ...

  3. 案例精选 | 面对千亿级的数据难题,优酷工程师怎么解决?

    导读:优酷一天的日志量会达到千亿级别,面对如此大的数据样本,2017年5月,优酷完成了从Hadoop迁移到阿里云MaxCompute,实现计算消耗和储存的消耗呈下降趋势,得到了非常大的收益.今天,阿里 ...

  4. 网络基础系统红枫产线落地金华,助力打造千亿级产业集群!

    "把握网络根基技术升级的历史契机,把金华网络根基研究中心作为红枫系统产业化研发的创新中心,落地红枫系统产业化装配和测试生产基地,为金义新区.金华市.浙江省的科技创新和战略性新兴产业发展服务, ...

  5. 飞桨分布式训练又推新品,4D混合并行可训千亿级AI模型

    点击左上方蓝字关注我们 最近,飞桨提出了4D混合并行策略,以训练千亿级稠密参数模型. 近几年,深度学习领域的开发者们对模型效果的追求愈演愈烈,各大榜单纪录不断刷新,而这个现象的背后都有着 " ...

  6. hive建立内部表映射hbase_快手 HBase 在千亿级用户特征数据分析中的应用与实践...

    分享嘉宾:陈杨 快手 编辑整理:Hoh Xil 内容来源:BigData NoSQL 12th Meetup 出品社区:DataFun 注:欢迎转载,转载请注明出处. 快手建设 HBase 差不多有2 ...

  7. 千亿级数量下日志分析系统的技术架构选型

     
 随着数据已经逐步成为一个公司宝贵的财富,大数据团队在公司往往会承担更加重要的角色.大数据团队往往要承担数据平台维护.数据产品开发.从数据产品中挖掘业务价值等重要的职责.所以对于很多大数据工程师 ...

  8. 大数据千亿级离线数仓项目第一天 环境部署和etl

    千亿级数仓项目第01天讲义 课程目标 了解大数据离线数仓架构 了解项目部署环境(数据规模和集群规模) 掌握ETL工具 Kettle常用组件的使用 能够掌握kettle作业与转换区别以及linux部署 ...

  9. 《数据安全法》今起正式实施,隐私计算迎来千亿级风口|潜在风向标

     关注ITValue,看企业级最新鲜.最价值报道! 图片来源@Unsplash | 9月1日起,中国第一部有关数据安全的专门法律<数据安全法>正式施行. 这部法律分别从监管体系.数据安全与 ...

最新文章

  1. errorEruda解决移动端真机调试,bug收集问题
  2. Koa2框架从0开始构建预告片网站
  3. 中非谋定农业合作 -农业大健康·万祥军:提供农业解决方案
  4. linux 易语言窗口程序_浅谈Linux入门的基本知识
  5. date -d的灵活应用
  6. 打造钉钉事件分发平台之钉钉审批等事件处理
  7. mysql 强制读主库_laravel(lumen)配置读写分离后,强制读主(写)库数据库,解决主从延迟问题...
  8. RuntimeError: Can‘t call numpy() on Variable that requires grad. Use var.detach().numpy()
  9. (19)FPGA面试题设计前端流程
  10. Spring源码总结与分析
  11. NLP样本不均衡之常用损失函数对比(附代码)
  12. C# 获得当前应用程序路径
  13. BS结构浏览器网页读写IC卡技术汇总
  14. LM358恒流恒压原理
  15. ACM Plan UVa - 10102 The path in the colored field
  16. 国外11个高质量免费的3D素材网站-建筑设计/室内设计/效果图渲染
  17. RuntimeError: a view of a leaf Variable that requires grad is being used in an in-place operation.
  18. linux静默安装oracle11g数据库教程
  19. Android Studio:线性布局
  20. 香蕉的功效与作用 空腹吃香蕉

热门文章

  1. IBM AIX:Java进程大小监视
  2. 带有GSON和抽象类的JSON
  3. 更换mysql_安利给你,关于MySQL字符集乱码与解决方案
  4. 代码流程图生成器_【进阶Python】第五讲:迭代器与生成器
  5. Java中获取系统日期时间/系统时间
  6. 华为的型号命名规则_华为Mate 40 Pro+ 外观曝光 正面双挖孔 背部奥利奥
  7. 【WebRTC---源码篇】(四)WebRTC线程模型
  8. excel随机抽取_简单随机抽样及其进阶分层随机抽样方法展示
  9. C++基础教程示例详解:C++中的I/O重定向
  10. C++中的函数汇总(新手必知)!