吴恩达机器学习-11-推荐系统

公众号：尤而小屋
作者：Peter
编辑：Peter

吴恩达机器学习-11-推荐系统Recommender Systems

本周中主要讲解了推荐系统的相关知识。推荐系统应该是目前机器学习领域或者说人工智能领域最热门的方向之一，还有NLP、CV等，主要内容包含：

推荐系统简介
基于内容的推荐系统
协同过滤

协同过滤的优化目标：

给定x(1),...,x(nm)x^{(1)},...,x^{(n_m)}x(1),...,x(nm)，估计θ(1),...,θ(nu)\theta^{(1)},...,\theta^{(n_u)}θ(1),...,θ(nu)：

min⁡θ(1),...,θ(nu)12∑j=1nu∑i:r(i,j)=1((θ(j))Tx(i)−y(i,j))2+λ2∑j=1nu∑k=1n(θk(j))2\min_{\theta^{(1)},...,\theta^{(n_u)}}\frac{1}{2}\sum_{j=1}^{n_u}\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2+\frac{\lambda}{2}\sum_{j=1}^{n_u}\sum_{k=1}^{n}(\theta_k^{(j)})^2 θ(1),...,θ(nu)min21j=1∑nui:r(i,j)=1∑((θ(j))Tx(i)−y(i,j))2+2λj=1∑nuk=1∑n(θk(j))2

给定θ(1),...,θ(nu)\theta^{(1)},...,\theta^{(n_u)}θ(1),...,θ(nu)，估计x(1),...,x(nm)x^{(1)},...,x^{(n_m)}x(1),...,x(nm)：

同时最小化x(1),...,x(nm)x^{(1)},...,x^{(n_m)}x(1),...,x(nm)和θ(1),...,θ(nu)\theta^{(1)},...,\theta^{(n_u)}θ(1),...,θ(nu)：

J(x(1),...,x(nm),θ(1),...,θ(nu))=12∑(i,j):r(i,j)=1((θ(j))Tx(i)−y(i,j))2+λ2∑i=1nm∑k=1n(xk(i))2+λ2∑j=1nu∑k=1n(θk(j))2J(x^{(1)},...,x^{(n_m)},\theta^{(1)},...,\theta^{(n_u)})=\frac{1}{2}\sum_{(i,j):r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2+\frac{\lambda}{2}\sum_{i=1}^{n_m}\sum_{k=1}^{n}(x_k^{(i)})^2+\frac{\lambda}{2}\sum_{j=1}^{n_u}\sum_{k=1}^{n}(\theta_k^{(j)})^2 J(x(1),...,x(nm),θ(1),...,θ(nu))=21(i,j):r(i,j)=1∑((θ(j))Tx(i)−y(i,j))2+2λi=1∑nmk=1∑n(xk(i))2+2λj=1∑nuk=1∑n(θk(j))2

min⁡x(1),...,x(nm)θ(1),...,θ(nu)J(x(1),...,x(nm),θ(1),...,θ(nu))\min_{x^{(1)},...,x^{(n_m)} \\ \theta^{(1)},...,\theta^{(n_u)}}J(x^{(1)},...,x^{(n_m)},\theta^{(1)},...,\theta^{(n_u)}) x(1),...,x(nm)θ(1),...,θ(nu)minJ(x(1),...,x(nm),θ(1),...,θ(nu))

向量化：低秩矩阵分解Vectorization_ Low Rank Matrix Factorization

协同过滤算法可以做的事情：

给出一件商品，找到与之类似的商品
当一个用户浏览了一件产品，找出类似的商品推荐给他

假设5部电影，4位用户，存放在矩阵中：

Movie	Alice (1)	Bob (2)	Carol (3)	Dave (4)
Love at last	5	5	0	0
Romance forever	5	?	?	0
Cute puppies of love	?	4	0	?
Nonstop car chases	0	0	5	4
Swords vs. karate	0	0	5	?

推出相应的评分

找出类似的影片

均值归一化Mean Normalization

上图中，假设新来个用户Eva，他没有对任何的电影进行评分，那我们以什么依据来给他推荐电影呢？

对上面的Y矩阵进行均值归一化，将每个用户对某一部电影的评分减去所有用户对该电影评分的平均值，得到如下的矩阵：

利用新的矩阵Y来训练算法。如果我们要用新训练出的算法来预测评分，则需要将平均值重新加回去，预测：(θ(j))Tx(i)+μi(\theta^{(j)})^T x^{(i)}+\mu_i(θ(j))Tx(i)+μi，模型会人为其给每部电影的评分都是该电影的平均分。