版权归作者所有,任何形式转载请联系作者。
作者:咚咚咚diduan(来自豆瓣)
来源:https://www.douban.com/note/583716751/

会议信息
1. RecSys 2016是推荐系统第十届会议(Happy 10th. birthday to RecSys),也是RecSys有史以来规模最宏大,参与人数最多的会议,有超过300名学术界和工业界的同仁参会。
2. 本次会议共有4个tutorial,3个keynots,9个workshop,30个demo和posters,以及RecSys Challenge竞赛关节,共有20多个组织赞助。录取论文包括51篇学术论文,15篇工业界论文,9篇past present and future论文;其中long paper录取率为18%,short paper录取率为20%。研究方向覆盖了人因(human factors),上下文感知,冷启动,多样性与新颖性,推荐算法(如矩阵分解,深度学习等)等方面。

趋势
1. 深度学习在推荐系统中应用
相比以往的RecSys会议,深度学习方面的论文比重增加,今年有专门的深度学习workshop和论文session;工业界的Google YouTube,Google Play,Spotify都声称用到深度学习技术,应用领域包括构建特征,生成推荐候选集合,以及预测推荐分值。
我与几位机器学习的研究者(Romaric Gaudel教授,曹雪智博士等)交流,他们也认为深度学习是今年的一个趋势,但没有预期中那么多的研究成果。Claudia Perlich(第一个Keynote演讲者)在keynote上回答关于深度学习在推荐系统应用前景的问题时,认为深度学习适合解决结构化的问题,如NLP,声音,图像等,能否成为推荐系统的主流模型还有待观察。
2. 完整的系统级的推荐系统研究
Joseph Konstan教授(第一届RecSys的主席)认为,今年有更多研究是end to end完整的、系统级的研究,不再只偏重于具体一个方面(如算法),这个趋势与Recommendation System会议的主旨更加相符。
3. 对Metrics有了更多的思考
    在今年的会议中,大家明显对于推荐的评价指标有了更为深入的思考和理解,不再只简单关注短期准确率的目标,对长期目标有了较多思考,如推荐系统对于用户的长期维系:
(1) Joseph Konstan:“CTR只是点击行为,而为什么点击?产生点击的决策机制是什么?后面的2个问题也是推荐系统需要研究的”
(2) Claudia Perlich:web的点击中有40%来自Bot,移动设备的点击中有36%属于用户unintentionally的点击;如果不加甄别地用这样的数据来学习,学到的是大量掺杂了非用户真实需求的模型。
(3) Xavier Amatriain: 系统要以“用户的长期维系”为目标,需要综合考虑用户的显示反馈行为和多元的隐式反馈行为。
(4) Michael Ekstrand: 预估CTR,往往不能理解用户真实的意图(desire);下载行为也不能代表用户是满意的,当我们深入了解用户意图和行为后,推荐系统能发挥更大巨大作用。

工业界的广泛参与
今年RecSys来自工业界的sponsor有18家公司。参会者来自工业界的超过一半,其中阿里派出了超过10人的团队参会;连很少在学术会议上出现的Apple也有人参会;其它参会公司包括Mendeley, Meetup, Bloomberg, Foursquare, Spotify, Net¬flix, Pandora, Stitch Fix, Expedia, Nara Logics, GraphSQL, Retail Rocket, Quora, Google, Pinterest。各大公司均积极招聘,了解推荐系统的最新动向,与学术界交流紧密。
主会有3个session介绍工业界推荐系统的工作,其中包括1个session专门分享工业界在推荐系统方面的经验(具体经验后文有介绍)。大约1/3论文的作者有工业界背景;不少公司的推荐系统领导者都有很强的学术背景,如Quora的Xavier和Lei Yang,Google Now的 Shashi Thakur,Dstillery的Claudia Perlich等。
工业界的经验分享:
1. Keynote:
Claudia Perlich   是Distillery(广告解决方案公司)的首席科学家,其所在的Distillery公司每天处理500亿的数据样本,其采用的技术方案包括LR,SGD,Hashing,Streaming,L1 & L2 regularization。在keynote中,她阐述了2个观点:
观点1:“Predictability bias: models tend to go where the signal is”
模型为何预测的准确,因为有的signal令模型更准确,但有些signal是noise的,并非用户的自身的喜好,比如:
(1)Bot traffic占了互联网36%的流量,很多转化率时间是bot做到的,结论是bot的行为容易预测,而用户的行为仍然难以预测;
(2)移动设备上40%的点击行为时accidental的无用点击,结论是accidental容易预测,认得行为不容易预测。
所以要深刻理解用户的行为。
观点2:“bad metrics with good machine learning is almost always a disaster”
可以思考这样的问题:CTR是最好的优化目标吗?百度的搜索结果为什么比不过Google,前者只用CTR标注,后者始终保持大量的人工标注(一个在Google实习的人透露的),精巧的人工标注可以让搜索结果质量更高。
2. Lessons learned from build real-life Recsys:Xavier介绍了其在Quora和Netflix构建推荐系统时的经验:
(1) Implicit feedback is more important:需要注意的是implicit feedback有时并非与用户长期维系目标相符,所以有时需要将显示反馈与隐式反馈结合起来
(2) 认真考虑训练数据:定义合理的正负例
(3) 推荐的解释有时比预测准确率重要
(4) MF是最好的single approach,MF的变形包括FM,SVD++,ALS等;Quora开源了他们的MF模型QMF
(5) Ensemble is the master algorithm
(6) Feature Engineering: 需要理解领域信息,了解推荐目的和用户需求,将以上信息转化为特征;好的特征具有如下特点:reusable, transformable, interpretable, reliable; 深度学习也是构建特征的一种方法
(7) 合理的评价策略
i. Offline vs. online: a critical issue is how offline metrics correlate with A/B test results
ii. Long-term metric (member retention) vs. short-term metric 
(8) Model debuggability: to determine particular model to use; features to rely on; implementation of tools.
3. Bloomberg的新闻推荐考虑用户兴趣迁移的问题,并通过对推荐结果reshuffling的机制防止用户兴趣过于集中;
4. Foursquare构建个人助理MarsBot,进行hotel,restaurant等内容的推荐,Marsbot以短信通知、push、personality and onboarding为主要特征,实施存文字的交互对话引导,当用户感兴趣后,在后续会话文字中加入产品链接,避免直接推荐链接引起用户的不满;
5. Spotify的音乐个性化推荐采用推荐策略包括:专家标注,元数据,音乐声学信号,CF,以及混合策略,模型使用了latent factor model,深度学习模型;排序部分会考虑:相似度,相关度,多样性,流行度,新鲜度,使用了MAB的方法。
6. Google Play的经验分享
(1) Always Run live experiments
(2) 尽可能简单
(3) 选择合理优化目标
7. Pinterests的经验分享
(1) 候选集生成策略:图片候选集生成策略较为简单,主要使用图片相似性,相似性计算方位共现次数
(2) 应用linearRankSVM模型和GBDT涌现,特征包括图片特征、query特征,用户上下文特征用于个性化。
(3) collecting unbiased training data

推荐模型和技术
在推荐系统中被工业界广泛使用的有效的模型主要有:logistic regression,matrix factorization,Gradient boosting decision tree,其中LR被广泛用于CTR的预估;matrix factorization模型包括SVD++,factorization machine,ALS等方法,是工业很推崇的方法;今年RecSys challenge的前三名均使用GBDT的方法。其他被工业界使用的技术还包括:SGD,采样,哈希,L1&L2正则,实时流数据分析等;Spotify还声称他们用了MAB的方法。
YouTube Recommendation使用了深度学习技术,用于候选集的生成和排序。
林智仁老师团队应用field-aware factorization machine模型进行广告的CTR预估,取得了2个竞赛的关键,相关研究成果也发表在今年的RecSys上。

值得关注的论文
1. A Scalable Approach for Periodical Personalized Recommendations
2. Adaptive, Personalized Diversity for Visual Discovery 
3. Field-aware Factorization Machines for CTR Prediction 
4. Local Item-Item Models for Top-N Recommendation  (Best paper)
5. Mechanism Design for Personalized Recommender Systems 
6. Deep Neural Networks for YouTube Recommendations 
7. Past, Present, and Future of Recommender Systems: An Industry Perspective (author:Xavier Amatriain)
8. Algorithms Aside: Recommendation as the Lens Of Life  (演讲的胶片非常艺术流)
9. Meta-Prod2Vec - Product Embeddings Using Side-Information for Recommendation
10. Are You Influenced by Others When Rating? Improve Rating Prediction by Conformity Modeling (余勇老师组做的工作)
工业界的几篇论文:
1. When Recommendation Systems Go Bad  (meetup)
2. News Recommendations at scale at Bloomberg Media: Challenges and Approaches (Bloomber)
3. Marsbot: Building a Personal Assistant (Foursqure)
4. Music Personalization at Spotify (Spotify)
5. Recommending for the World (Netflix)
6. The Exploit-Explore Dilemma in Music Recommendation  (Pandora)
7. Tutorial: Lessons Learned from Building Real-life Recommender Systems  (Xavier’ tutorial)

很高兴在今年的RecSys见到以前的朋友、老师和同窗,结交新朋友。RecSys是一个朝气蓬勃的社区,面向解决实际问题的推荐和搜索人才密度高。2019年的RecSys将回到亚洲,很有可能在中国举办。

RecSys 2016总结相关推荐

  1. (十四)【RecSys 2016】Personalized Recommendations using Knowledge Graphs: A Probabilistic【看不懂】

    题目: Personalized Recommendations using Knowledge Graphs: A Probabilistic Logic Programming Approach( ...

  2. RecSys Challenge 历年推荐赛题汇总

    RecSys是ACM主办的推荐系统旗舰会议,其征文范畴包含推荐系统的各个领域,包括算法设计.系统实现.理论推导和评估测试等 每年RecSys都会举办推荐系统相关的比赛,本文将对历史RecSys比赛进行 ...

  3. 三年、四大顶会,深度推荐系统18篇论文只有7个可以复现

    作者 | 深度传送门 来源 | 深度传送门(ID:gh_5faae7b50fc5) 导读:本文是"深度推荐系统"专栏的第十篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工 ...

  4. 强化学习大规模应用还远吗?Youtube推荐已强势上线

    来源 | 转载自深度传送门 导读:本文将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化.本文主要根据几大顶会2019的最新论文,总结一下深度强化学习给推荐系统以及CTR预估工业界带来 ...

  5. ICLR2020全析解读:华人学者占据60%,谷歌再次领跑!(附最新高引华人榜单)...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 来源:学术头条 ICLR 全称为 "International Conf ...

  6. 【学术相关】RSPapers | 工业界推荐系统论文合集

    嘿,记得给"机器学习与推荐算法"添加星标 随着大数据时代的飞速发展,信息逐渐呈现出过载状态.推荐系统,作为近年来实现信息生产者与消费者之间利益均衡化的有效手段之一,越来越发挥着举足 ...

  7. 深度学习下的点击率预测:交互与建模

    ©作者 | 林子涵 学校 | 中国人民大学信息学院硕士 来源 | RUC AI Box 引言 点击率(Click-Through Rate,简称 CTR)预测任务在各类互联网应用中大量存在,相关算法的 ...

  8. 腾讯 QQ 看点图文多目标推荐实践经验

    作者:zhongzhao,腾讯 PCG 应用研究员 在推荐系统中,最常用的排序模型是以用户点击为目标的 CTR 预估模型,它没有考虑用户点击后的消费深度,也没有考虑用户的多种互动行为带来的生态方面的收 ...

  9. 实践篇 | 推荐系统之矩阵分解模型

    导语:本系列文章一共有三篇,分别是 <科普篇 | 推荐系统之矩阵分解模型> <原理篇 | 推荐系统之矩阵分解模型> <实践篇 | 推荐系统之矩阵分解模型> 第一篇用 ...

最新文章

  1. C++ 中multiset 的使用
  2. 上下两个x轴_点胶机:3轴,4轴,5轴,你懂了吗?
  3. 数组是逻辑结构还是存储结构_数据结构之存储方式
  4. hadoop三个配置文件的参数含义说明
  5. 35.页面置换算法有哪些?
  6. 13-Qt6 QMap
  7. MsSQL学习第五章---排序和分页
  8. 完全二叉树的结点个数
  9. Java 8:正在运行的CompletableFuture
  10. BZOJ2330 SCOI2011糖果
  11. java中的NIO和IO到底是什么区别?20个问题告诉你答案
  12. MySQL两阶段加锁
  13. java jdbc 批处理_JDBC的批处理操作
  14. uniapp中页面白屏问题
  15. 渗透测试职业规划-三省吾身
  16. 微软任命 CEO 萨提亚·纳德拉为董事会主席
  17. ra3录像重播工具_设置DO-RA小工具的网络销售渠道
  18. 高考落榜怎么办,奉劝学弟学妹们一些事情,请一定要擦亮眼睛
  19. 怎样下载百度爱采购的图片
  20. 【JavaScript】自定义函数

热门文章

  1. 针对SSL/TLS的拒绝服务攻击以及使用ettercap进行DNS欺骗
  2. MICROSOFT IGNITE 2018 大会成功举办,Docker 现场揭秘全新版本内容!
  3. C# 如何调用EventLog
  4. Springmvc的handler method参数绑定常用的注解
  5. 何时使用[self release]
  6. Activity详细解释(生命周期、以各种方式启动Activity、状态保存,等完全退出)...
  7. C# WInForm中 窗体的this.width和this.height的属性值不能大于显示器的最大分辨率
  8. 技术的本质 2月23日摘抄
  9. C# 容器重用避免GC 的论证
  10. 飞机大作战游戏 1----(运用H5和Js制作)