点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

处于在信息爆炸时代的我们,在生活中越来越依赖智能的个性化推荐来获取各种各样的信息,比如人们依赖推荐系统来获取新闻咨询,选择视频娱乐,寻找餐馆,甚至于遇见新的朋友,和寻找工作。因此,推荐系统的研究也逐渐成为数据挖掘和机器学习领域举足轻重的一个方向。越来越多学界和工业界的专家学者们致力于提升推荐系统的性能以及解决其中并发的各种问题的研究。

8月21号,PHD Debate 第六期“深度推荐系统的探索与实践”,AI TIME特别邀请了阿里巴巴达摩院算法专家孙飞,网易伏羲研究部用户画像组负责人吴润泽,华为诺亚方舟实验室高级工程师刘卫文,德州农工大学竺子崴,中国科学技术大学吴剑灿作为嘉宾,以及来自德州农工大学的贺赟作为主持人。

01

推荐系统的研究热点有哪些?

孙飞认为现在推荐系统的研究主流还是聚焦在如何提升推荐系统的准确率这个问题上。但是他表示因果推荐在推荐系统的应用也变得越来越流行。其中一个问题就是如果利用因果推断做到反事实推理,从而去预测哪些产品是系统不推荐用户就无法知晓的,而哪些产品是即使不推荐,用户也会点击/购买的。除此之外,孙飞还表示对话推荐系统和推荐系统的隐私问题都是目前研究的热点问题。

吴润泽从他的工作经验出发,介绍了组合推荐这种推荐场景,即将多个商品打包,并向用户推荐这些商品组合。吴润泽接着介绍了两种组合推荐的问题,第一种是如何高效的推荐已知商品组合,另一种是如何高效的构建新的商品组合。从这个问题出发,他延展到了另一类很有现实意义的推荐问题,即如何在推荐时考虑商品关联性而不是单纯的考虑商品相似性。

刘卫文关注于序列推荐问题。她提到了序列推荐的两个具体问题。第一个是如何对序列中商品之间互相的影响进行建模。第二个是如何搭建一个端对端的模型去提升序列推荐的多样性问题。除此之外,刘卫文认为如何利用反事实学习去学习用户在未观测样本上的行为也是一个很有研究价值的问题。

竺子崴着重强调了推荐系统中的公平性与偏差问题。其中包括了用户层面和商品层面的多种公平与偏差问题。他表示对于这一大类问题,学者们可以从很多角度切入,比如去发现并定义新的问题,分析与研究已知问题的成因与影响,或者创造高效的算法去解决这些问题。

吴剑灿主要介绍了图神经网络在推荐系统里的应用这一话题。其中,他着重提及了三个具体问题。第一个是如何利用对比学习来更高效的学习图的节点表征。第二是如何运用知识图谱加图神经网络来提升推荐准确率。第三是如何对动态图进行建模。此外,吴剑灿还提到了一个新兴的问题,即如何针对推荐系统构建大规模预训练模型。

02

基于图神经网络的推荐系统会成为未来的主流么?

吴剑灿认为图神经网络具有其独特的优势也有自身的不足,所以目前而言,图神经网络还不能成为唯一的主流。首先,吴剑灿表示相比于对特征间交互建模,图神经网络更擅长于学习用户或商品的表征。其次,他认为图神经网络的工业落地难度还比较大,一个难点就是对于图中一个商品节点,它链接的用户数量会非常大,使得图神经网络的计算量也无比巨大。吴剑灿还表示,图神经网络的另一个还未解决的研究难点是如何高效的对动态图进行建模。

刘卫文补充道推荐系统主要就是构建各种类型的关系,包括用户和商品间的关系,用户与用户之间的关系,还有商品与商品之间的关系。图结构与图神经网络可以很有效的表达并学习这些关系。但是图神经网络在工业产品的应用中对计算资源和算力有很高的要求。

竺子崴也认为图神经网络对于表征学习有很强的优势,同时它仍旧还有很多的问题需要解决。包括如何解决对计算资源的高消耗问题,如何解决序列推荐的问题,如何解决冷启动问题。

孙飞认为利用知识图谱和图神经网络来搭建推荐系统从研究的角度而言是一个很有价值的问题。但是从工业界的实用角度出发,由于工业级的系统里会有大量的关于用户和商品的额外信息,所以知识图谱的运用并不广泛。

吴润泽同样表示对于图神经网络而言,动态图问题是一个很有挑战也很难解决的问题。比如图中的节点(用户,商品)会经常更新,如何让模型动态的适配新的图结构是一个亟需解决的问题。

03

推荐系统应该向通用大模型,还是小而精的模型方向发展?

刘卫文表示将模型变大会一定程度提升推荐效果,但是大模型不是推荐系统的终极目标。因为不同于自然语言,用户和商品不能用一个潜在的统一规则来描述。刘卫文认为将来推荐系统的发展趋势是“一人一模”,每个用户拥有自己的个性化模型。

孙飞补充道通用大模型常常与预训练精密联系。但是对于推荐系统,不同场景下用户与商品的潜在关联差别十分明显。因此,使用预训练搭配大模型可能难以复现预训练模型模型在自然语言处理中的成功。此外,推荐系统是一个动态的不断更新的应用场景,这要求模型经常更新改动,所以从这一角度出发,给预训练搭配大模型在推荐系统中的应用提出新的挑战。

竺子崴讲述了他研究过程中做实验的经验。他说他经常发现同一个模型,在不同的数据集上进行实验,结果常常很不一样。所以,他认为可能对于推荐系统而言,不存在,或者很难建造一个通用的,适用于所有使用场景的模型。

04

推荐系统中有哪些公平性/偏差问题?

竺子崴从数据,模型,已经推荐结果三个角度介绍了推荐系统中的一些公平性/偏差问题。其中,数据中的偏差问题可以理解为我们用来训练模型的训练数据所表达的用户与商品间的关系并不是准确的用户商品关系,当我们利用这个有偏差的数据训练模型,即使模型很准确,所得到的预测结果也会是有偏差的。不如说曝光偏差,用户选择偏差等等。其次,基于机器学习的推荐模型往往会引入新的偏差。换而言之,即使我们的数据是完美的,能够精准的表达用户和商品间的关系,由于模型会引入偏差,导致我们的推荐结果依旧是有偏差的。比如常见的流行性偏差,用户主流偏差。最后,数据与模型里的偏差会共同作用于推荐结果,导致我们观察到各种各样的问题,比如商品公平性问题,信息茧房问题等等。

孙飞补充道,在工业应用中,不会解决所有的偏差问题。如果是对推荐效果有影响的问题,比如是位置偏差或者是曝光偏差,工业界往往会努力去解决。但是其他一些公平性/偏差问题,我们往往会观测到系统性能与公平性的一个平衡取舍,所以实际应用中常常没有动力为了提升公平性而去降低系统性能。另一方面,对于系统性能与公平性的平衡取舍这一问题,需要有更多的对于来自于公平性的长期收益的研究。

05

推荐系统如何做到可解释性

吴润泽表示从他的工作经历看来,推荐系统中对可解释性有很大的需求。首先,对模型的解释可以帮助开发人员进行算法调试与优化。其二,提供模型的解释可以使得系统对合作伙伴更透明,增强合作关系。最后,为用户提供推荐的解释能进一步帮助用户了解商品,从而提升系统收益。吴润泽还介绍了模型可解释性的两种基本思路:模型内解释与模型外解释。最后吴润泽表示目前推荐系统的可解释性面临的最大难题之一就是如何评估模型解释的好坏。

刘卫文补充道推荐系统的可解释性也是需要分场景的。一些场景下,对推荐的额外解释可能反而会带来新的偏差问题。

孙飞认为有时推荐系统的解释常常会变成推广文案生成,并不是真的对算法的推理进行解释。

06

推荐系统的发展会面临哪些挑战与机遇

吴剑灿表示对于推荐系统的研究,可以分为表征学习和特征交互模型两个方向。针对这两个方向,可以结合其他领域的算法,比如计算机视觉和自然语言处理,来提升效果。

竺子崴分享了他认为很重要也很有挑战的两个研究方向。第一个是如何缩减推荐系统线下与线上实验的差距。基于此,一个子问题是如何构建一个仿真环境来模拟线上实验。第二个问题是在一个长期并且动态的维度下,研究并解决公平性/偏差问题。

刘卫文介绍了三个目前前沿的研究方向。第一个是之前已经详细讨论过的如果给推荐系统提供解释。第二是如何实现反事实学习来学习用户在未观测样本上的行为。最后是如何实现“一人一模”。其中对于最后一个问题,刘卫文表示联邦学习是一个很有潜力的技术。

吴润泽表示如何提升推荐系统的社会责任感是一个很重要的话题。包括如何解决推荐系统带来的信息茧房,人群两级分化等问题。

孙飞补充道最近推荐系统对于效果提升的研究已经进入平台期,因此越来越多的人开始关注于推荐系统的社会责任感。包括公平性,可解释性,模型透明,隐私保护等等。一个具体的问题就是如何让模型能够基于用户的要求“遗忘”学习到的数据。

今日视频推荐●

PS

10月23日,将进行因果学习的Debate哦~

让我们不见不散!

AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!

请将简历等信息发至yun.he@aminer.cn!

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

更多资讯请扫码关注

我知道你  在看  哦

点击 阅读原文 观看精彩回放!

干货!深度推荐系统的探索与实践相关推荐

  1. 今晚 8:00 |深度推荐系统的探索与实践

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2021年8月21日20:00-21:30, AI TIME 邀请了来阿里巴巴达摩院.网易.华为诺亚方舟实验室.德州农工大学.中国科学技 ...

  2. PhD Debate-6 预告|深度推荐系统的探索与实践

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2021年8月21日20:00-21:30, AI TIME 邀请了来阿里巴巴达摩院.网易.华为诺亚方舟实验室.德州农工大学.中国科学技 ...

  3. 深度学习在高德的探索与实践

    1.导读 驾车导航是数字地图的核心用户场景,用户在进行导航规划时,高德地图会提供给用户3条路线选择,由用户根据自身情况来决定按照哪条路线行驶. 同时各路线的ETA(estimated time of ...

  4. 【深度学习】深度学习安防的探索与实践

    [深度学习]深度学习安防的探索与实践 文章目录 1 概述 2 安防领域的深度学习应用 3 当深度学习遇到系统和网络安全3.1 前馈神经网络概述3.2 基于深度学习的日志数据异常检测3.3 MAD-GA ...

  5. 眼界大开 声临其境丨胡宜峰:视频深度伪造检测技术在内容安全领域的探索与实践

    导读:「眼界大开 声临其境」技术系列课第三期.网易易盾资深计算机视觉算法工程师胡宜峰带来了主题为<视频深度伪造检测技术在内容安全领域的探索与实践>技术分享. 讲师简介:胡宜峰,网易易盾资深 ...

  6. 深度学习在美团配送ETA预估中的探索与实践-笔记

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 本文为美团文章学习的笔记整理. 1. 背景 ETA(Estimated Time of Arrival," ...

  7. 【干货51页PPT】深度学习理论理解探索

    来源:专知 普林斯顿大学计算机科学系教授Sanjeev Arora做了深度学习理论理解探索的报告,包括三个部分: Why overparametrization and or overprovisio ...

  8. 异构广告混排在美团到店业务的探索与实践

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 [免费下载]2022年2月份热门报告盘点 机器学习在B站推荐系统中的应用实践 小红书推荐系统中台应用实践 微信视 ...

  9. 美团搜索中查询改写技术的探索与实践

    猜你喜欢 0.[免费下载]2022年1月热门报告盘点1.腾讯QQ信息流推荐业务实践2.小红书推荐中台实践3.微信视频号的实时推荐技术架构分享4.预训练模型在华为信息流推荐系统中的探索和应用5.腾讯PC ...

最新文章

  1. java ui调试_如何使用 IBM i System Debugger 调试 Java 程序
  2. chromedriver链接
  3. coursera访问不了
  4. 基于JAVA+SpringMVC+Mybatis+MYSQL的建筑项目管理系统
  5. 安装sql server 2008 management studio时,提示升级VS2008 到 SP1
  6. c语言数组和字符串编程题,C语言中的字符数组和字符串详解
  7. 【数据结构和算法笔记】用并查集求解等价关系
  8. Qt: 监听文件夹QFileSystemWatcher;
  9. 如何用CMD查看本机的IP地址
  10. javaShop JAVA版多用户B2B2C商城源码(PC+H5+小程序+APP)
  11. VBA连接Excel数据库
  12. 收藏 | 22个短视频学习Adobe Illustrator论文图形编辑和排版
  13. 诛仙手游android转苹果,诛仙手游安卓和iOS互通吗 安卓和iOS能不能一起玩
  14. cocos2dx 3.17海外sdk接入填坑全纪录 Appodeal(广告) SDK 接入(5)
  15. 本科生如何学习计算机科学与技术
  16. 网络教育计算机和英语难度怎样,网络教育统考大学英语b难吗?
  17. 判断JS数据类型的四种方法
  18. 可汗学院金融学笔记系列
  19. 趣图:程序员的真实写照!这也太形象了吧!
  20. 汤姆计算机科技有限公司英语,关于计算机专业汤姆猫概述简介介绍的毕业设计论文英文英语外文文献翻译成品资料:Tomcat介绍(中英文双语对照).docx...

热门文章

  1. Win7系统重装账户被禁用的解决方法
  2. latex参考文献引用【bibtex】
  3. 初学js---动态生成表格
  4. Android系统定位获取经纬度
  5. Nodejs异步回调的优雅处理方法
  6. 微信小程序中如何打开公众号文章(node版)
  7. 统计代码放在网站php,网站添加简单访客统计代码
  8. 如何将OGV格式的视频转换成MP4格式
  9. GDScript:关于派生类调用基类方法的一个注意事项
  10. 单反相机的传奇—佳能单反50年辉煌之路(连载十)