目录

  • 文章出处
  • 大概介绍
  • 模型介绍
    • Context-Aware Matrix Factorization
      • Student Feature
      • Question Feature
      • Implicit Feedback
    • Max Cost Flow Constraint Filtering
  • 实验
  • Review
    • Abstract
    • Conclusion

文章出处

这篇文章的作者是三位CMU的大佬,当时看到Carnegie Mellon我就果断入坑了。论文2014年发表在ACM的一个会议上,题目是《Question Recommendation with Constraints for MOOC》。

大概介绍

读paper日常发问:作者在文章中提出了什么?解决了什么问题?怎么解决的?
(1)文章里提出了一个矩阵分解的模型来预测学生对问题的喜好,文章区别与传统推荐算法的地方在于:需要同时满足一些约束条件,这就有点像那种带约束的凸优化问题,然后文章中用一个最大流模型来解。
(2)本文的背景是在慕课论坛上,给参与者推荐题目,以达到锻炼参与者,并且让题目都能得到回答的目的。最终本文的模型 performance 都超过了baseline(果然灌水要靠baseline)。

模型介绍

Context-Aware Matrix Factorization

模型首先需要预测学生与题目的关联程度(relevance),通过对三个feature的观察与结合来预测相关度。分别是:student feature,question feature,implicit feedback。

Student Feature

先给公式
r ^ u , q = b i a s + ( P u + ϕ u Φ + θ u Θ + Γ γ ) T Q q \hat{r}_{u,q}=bias+(P_u+\phi_u\Phi + \theta_u\Theta + \Gamma_\gamma)^TQ_q r^u,q​=bias+(Pu​+ϕu​Φ+θu​Θ+Γγ​)TQq​
下面一个个来说明变量含义。

  1. 等式左边就是对相关度的预测值, u u u表示用户, q q q代表问题
  2. ϕ u \phi_u ϕu​ 是学生之前所有回答过的问题的总数,可以一定程度上表示学生在论坛中的参与度
  3. θ u \theta_u θu​ 是学生上周参与的问题数,表示学生近期活跃度(local level)
  4. γ \gamma γ 是学生注册的时间,可以被看做motivation proxy
  5. 至于 Φ , Θ \Phi,\Theta Φ,Θ 是对应的特征变量(参数),然后 P u , Q u P_u,Q_u Pu​,Qu​ 则是对应学生/问题的特征向量, Γ γ \Gamma_\gamma Γγ​ 是表示注册时间的向量
Question Feature

r ^ u , q = b i a s + P u T ( Q q + δ q Δ + l q L ) \hat{r}_{u,q}=bias+P_u^T(Q_q + \delta_q\Delta + l_qL) r^u,q​=bias+PuT​(Qq​+δq​Δ+lq​L)

  1. δ q \delta_q δq​ 是该问题目前有多少回复或评论
  2. l q l_q lq​ 是问题的长度(字数),用来表示问题的难度(这个assumption比较naive
  3. 其余特征向量的定义与上面类似
Implicit Feedback

这个变量代表的是学对问题的preference,即参与这个问题的可能性。我们用 U ( q ) U(q) U(q) 表示参与问题 q 的所有学生,以及 φ u \varphi_u φu​ 表示预测的喜好。
r ^ u , q = b i a s + P u T ( Q q + 1 ∣ U ( q ) ∣ ∑ v ∈ U ( q ) φ v ) \hat{r}_{u,q}=bias+P_u^T(Q_q + \frac{1}{\sqrt{|U(q)|}}\sum_{v\in U(q)}\varphi_v ) r^u,q​=bias+PuT​(Qq​+∣U(q)∣ ​1​v∈U(q)∑​φv​)

把上面提到的三个等式结合在一起,我们得到
r ^ u , q = b i a s + ( P u + ϕ u Φ + θ u Θ + Γ γ ) T ( Q q + δ q Δ + l q L + 1 ∣ U ( q ) ∣ ∑ v ∈ U ( q ) φ v ) \hat{r}_{u,q}=bias+(P_u+\phi_u\Phi + \theta_u\Theta + \Gamma_\gamma)^T(Q_q + \delta_q\Delta + l_qL + \frac{1}{\sqrt{|U(q)|}}\sum_{v\in U(q)}\varphi_v ) r^u,q​=bias+(Pu​+ϕu​Φ+θu​Θ+Γγ​)T(Qq​+δq​Δ+lq​L+∣U(q)∣ ​1​v∈U(q)∑​φv​)
由于相关度应该是个0到1的值,所以用sigmoid函数映射一下
f ( r ^ u , q ) = e r ^ u , q e r ^ u , q + 1 f( \hat{r}_{u,q}) = \frac{e^{ \hat{r}_{u,q}}}{e^{ \hat{r}_{u,q}}+1} f(r^u,q​)=er^u,q​+1er^u,q​​
最后使用logistic loss,再结合L2范数作为正则项

Max Cost Flow Constraint Filtering

这里引入了本文最重要的观点:load balancing 和 expertise matching。正是这两个限制的引入让本文区别与传统的推荐文章。定义: f u , q ∈ { 0 , 1 } f_{u,q}\in\{0,1\} fu,q​∈{0,1} 表示 q 是否被推荐给 u。

  • Load Balancing 关键是对用户的合理利用,既不能让用户做太多的题,也不能浪费一点人力资源。所以就有 ∀ u , L u ≤ ∑ q f u , q ≤ R u \forall u, L_u\leq \sum_{q}f_{u,q}\leq R_u ∀u,Lu​≤∑q​fu,q​≤Ru​ 和 ∀ q , 0 ≤ ∑ u f u , q ≤ M q . \forall q, 0\leq \sum_{u}f_{u,q}\leq M_q. ∀q,0≤∑u​fu,q​≤Mq​. 其中每一个bound都是事先确定的。
  • Expertise Matching 是要匹配每个用户的能力。 ∀ q , ∃ u : B u ⋅ f u , q ≥ H q \forall q, \exist u: B_u\cdot f_{u,q} \geq H_q ∀q,∃u:Bu​⋅fu,q​≥Hq​ 必须被满足,也就是说至少有一个被推到的用户,是有能力解题的。另外,为了避免浪费人力资源,我们需要最小化 ∑ u ∑ q I ( B u ⋅ f u , q ≥ H q ) ( B u − H q ) \sum_{u}\sum_{q}\mathbb{I}(B_u\cdot f_{u,q} \geq H_q)(B_u - H_q) ∑u​∑q​I(Bu​⋅fu,q​≥Hq​)(Bu​−Hq​).

把上面的constraint都考虑,就会有

这个公式看上去就是一个线性规划问题。同时下面的图也和这个公式等价。

实验

文章用Mean Average Precision 当评估矩阵;题目的 hardness H q H_q Hq​ 定义成题目的长度; R u R_u Ru​ 是学生参与过题目的总数然后 L u = 1 L_u=1 Lu​=1。学生的能力设置为 B u = max ⁡ { H q ∣ q ∈ T ( u ) } . T ( u ) B_u=\max\{H_q|q\in T(u)\}. T(u) Bu​=max{Hq​∣q∈T(u)}.T(u) 是目前参与过的题目集合。

最终发现模型中只保留relevance最高的20%的边即可,因为有80%的边,relevance score 都接近0。

Review

为提高英语写作能力,必须每周完成对paper的abstract,conclusion的重写!

Abstract

Today MOOC has experienced a recent boom in interest. However the effeciency of forum becomes a problem, which is how to let posted questions get solved and recommand students questions according to their preference. The traditional recommander system doesn’t quite apply because of some contraint: (1) Load-Balancing: students should not be over-burdened with too many quesitons. (2) Expertise Matching: students should not be requested to solve the problems they are not capable of solving. So that’s why we propose our constrained question recommendation system. First, we design a context-aware matrix factorization model to predict the relevance score between student and question, then build a max cost flow model to do optimization. Experimental result also showed our model’s superiority over baselines.

Conclusion

In this paper, we formulated the contrained question recommender system that simultaneously consider load balancing and expertise matching. Our framework employs two models: (1) a context-aware matrix factorization model to predict the students’ preference over questions and (2) a max cost flow model to optimize overall benefit under constraints. The experiment result proved our model is significantly better than proposed baselines. However, how to approximate student’s ability, question difficulty and student capacity remains a challenge. And in the future, it’s important to consider how to generalize our model to online settings.

论文分享——推荐算法相关推荐

  1. Youtube视频推荐算法:从10页论文到4页论文的变迁

    Youtube视频推荐算法:从10页论文到4页论文的变迁 所以说豆瓣广播是个好东西,长久以来已经怠于主动关注paper的我,每次都能通过我那些专业敬业的友邻们发现有意思的文章或话题,知识因分享而伟大! ...

  2. 【大会信息分享】新一代推荐算法核心技术与实践

    导读:12月20日,09:00-12:40,受DataFunTalk组委会邀请,阿里妈妈资深算法专家朱小强老师将担任DataFunTalk年终大会推荐算法论坛出品人,并邀请来自阿里.快手.58同城.陌 ...

  3. 知乎推荐算法工程师面经分享

    前言 曾三次迈进知乎的大门,面试算法工程师岗位.特整理了一些相关问题供大家研究,并附上了一些大佬的建议供大家参考. 面试流程 1.自我介绍 balabala...... 2.介绍下协同过滤 我大致介绍 ...

  4. 论文|基于三部图网络结构的知识推荐算法

    转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thi ...

  5. 【直播预告】CIKM 2022 论文分享:多场景个性化推荐的场景自适应自监督模型

    直播预约 12月29日,19:00-20:00,大淘宝技术与DataFun联合策划了本次活动,邀请了大淘宝技术的算法工程师就淘宝个性化推荐模型相关主题进行深度分享与交流,欢迎大家按时收看直播~ 张远亮 ...

  6. 论文解读 | 微信看一看实时Look-alike推荐算法

    作者丨gongyouliu 编辑丨lily 来源 | 授权转载自大数据与人工智能(ID:ai-big-data) 微信看一看的精选文章推荐(见下面图1)大家应该都用过,微信团队在今年发表了一篇文章来专 ...

  7. [论文解读]微信看一看实时Look-alike推荐算法

    论文链接:https://arxiv.org/abs/1906.05022 微信看一看的精选文章推荐(见下面图1)大家应该都用过,微信团队在今年发表了一篇文章来专门介绍精选推荐的算法实现细节(Real ...

  8. 短视频推荐算法过程分享,论如何针对推荐算法来优化短视频内容

    短视频推荐算法过程分享,论如何针对推荐算法来优化短视频内容 相信做短视频的小伙伴一定知道"短视频推荐算法",简单理解就是短视频平台都自有一套推荐机制,决定我们发布的短视频是否可以获 ...

  9. 【推荐算法论文阅读】LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation

    这篇文章是基于NGCF提出的改进,NGCF相关的工作参考[推荐算法论文阅读]Neural Graph Collaborative Filtering 一.背景 通过严格的对照实验(在相同的数据集和评估 ...

最新文章

  1. 网络营销专员浅析在网络营销中网站关键词对网站流量获取有何影响?
  2. hdu-1796 How many integers can you find---容斥定理
  3. python代码打开可执行文件_将自己的Python代码打包成exe文件(更换设备可运行的)...
  4. 使用css将超出盒子的文字显示为省略号
  5. Form的is_valid校验规则及验证顺序
  6. 【ArcGIS Pro微课1000例】0010:ArcGIS Pro导入ArcMap样式符号库——以国土三调样式为例
  7. Linux Select
  8. Chrome查看cookie
  9. 答题获得思科T-shirt
  10. 盒子模型之内边距(HTML、CSS)
  11. Scala实现Mapreduce程序4-----数据去重
  12. Android 录音获取分贝值的办法
  13. Java的括号使用规则_java编码规范
  14. npy文件转为csv文件
  15. SCI收录期刊——声学学科 (转载)
  16. 闹闹天宫一直显示服务器错误,闹闹天宫为什么进不去_闹闹天宫进不去解决办法_玩游戏网...
  17. flask html 得到文本框 input的内容_你需要知道的HTML知识
  18. Windows 2003 从Oracle 9201 update to 9208
  19. 【源码】从Ansys导入mesh到MATLAB的小程序
  20. c语言自动贩卖机设计报告,自动贩卖机课程设计.doc

热门文章

  1. UE4 动态修改材质 控制颜色和贴图
  2. 内网安全:内网渗透.(拿到内网主机最高权限 vulntarget 靶场 A)
  3. 大规模MIMO技术概述
  4. 【物联网】道德经里的六个字,把北京电信的NB-IoT战略全讲明白了!
  5. Java写的滑雪爱好者组织活动,预约活动,参与竞赛系统源码
  6. 陈力:传智播客古代 珍宝币 泡泡龙游戏开发第38讲:PHP数据库编程mysql
  7. 毕业设计 Spring Boot的网上购物商城系统(含源码+论文)
  8. 基于嵌入式Linux进行Python应用开发
  9. Win7 ODBC 数据源ACCESS2003的链接
  10. 阿里聚安全Webview安全攻防