你是否有过这样的经历?当你在亚马逊商城浏览一些书籍,或者购买过一些书籍后,你的偏好就会被系统学到,系统会基于一些假设为你推荐相关书目。为什么系统会知道,在这背后又藏着哪些秘密呢?

          
 
  荐系统可以从百万甚至上亿的内容或商品中把有用的东西高效地显示给用户,这样可以为用户节省很多自行查询的时间,也可以提示用户可能忽略的内容或商品,使用户更有黏性,更愿意花时间待在网站上,从而使商家赚取更多的利润,即使流量本身也会使商家从广告中受益。
  
  那么推荐系统背后的魔术是什么呢?其实任何推荐系统本质上都是在做排序。

  你可能注意到了,排序的前提是对喜好的预测。那么喜好的数据从哪里来呢?这里有几个渠道,比如你和产品有过互动,看过亚马逊商城的一些书,或者买过一些书,那么你的偏好就会被系统学到,系统会基于一些假设给你建立画像和构建模型。你和产品的互动越多,数据点就越多,画像就越全面。除此之外,如果你有跨平台的行为,那么各个平台的数据汇总,也可以综合学到你的偏好。比如谷歌搜索、地图和应用商城等都有你和谷歌产品的互动信息,这些平台的数据可以通用,应用的场景有很大的想象力。平台还可以利用第三方数据,比如订阅一些手机运营商的数据,用来多维度刻画用户

那推荐系统又是如何建立模型、知道用户爱好的?作者提供了两种重要的算法:矩阵分解模型和深度模型,快来一起探个究竟吧!

1.矩阵分解模型

  矩阵分解可以认为是一种信息压缩。这里有两种理解。第一种理解,用户和内容不是孤立的,用户喜好有相似性,内容也有相似性。压缩是把用户和内容数量化,压缩成 k 维的向量。把用户向量维度进行压缩,使得向量维度变小,本身就是信息压缩的一种形式;向量之间还可以进行各种计算,比如余弦(Cosine)相似性,就可以数量化向量之间的距离、相似度等。第二种理解,从深度学习的角度,用户表示输入层(User Representation)通常用 One Hot编码,这没问题,但是通过第一层全连接神经网络就可以到达隐藏层,就是所谓的嵌入层(Embedding Layer),也就是我们之前提到的向量压缩过程。紧接着这个隐藏层,再通过一层全连接网络就是最终输入层,通常用来和实际标注数据进行比较,寻找差距,用来更新网络权重。从这个意义上讲,完全可以把整个数据放进神经系统的框架中,通过浅层学习把权重求出来,就是我们要的向量集合了。经过这么分析,矩阵分解在推荐系统中是如何应用的就显而易见了。
  
  这两种情形都可以用矩阵分解来解决。假设数据库里m 个用户和 n 部电影,那么用户电影矩阵的大小就是 m×n。每个单元 (i,j) 用R ij 表示用户是否看了该电影,即0 或 1。我们把用户和电影用类似 Word2Vec 的方法分别进行向量表示,把每个用户 i 表示成 d 维向量 X i ,把每部电影 j 表示成 d 维向量 Y j 。我们要寻找 X i 和 Y j ,使得 X i ×Y j和用户电影矩阵 R ij 尽可能接近,如图所示。这样对于没出现过的用户电影对,通过 X i ×Y j 的表达式可以预测任意用户对电影的评分值。
  
            
           

  用数学表达式可以这么写:
           
  注意:这里d 是一个远小于m; n 的数。从机器学习的角度来说,模型是为了抓住数据的主要特征,去掉噪声。越复杂、越灵活的模型带来的噪声越多,降低维度则可以有效地避免过度拟合现象的出现。

2.深度神经网络模型

  下面展示进阶版的深度模型。我们将建立多层深度学习模型,并且加入 Dropout技术。
  
  这个模型非常灵活。因为如果有除用户、电影之外的数据,比如用户年龄、地区、电影属性、演员等外在变量,则统统可以加入模型中,用嵌入的思想把它们串在一起,作为输入层,然后在上面搭建各种神经网络模型,最后一层可以用评分等作为输出层,这样的模型可以适用于很多场景。深度模型的的架构如下图所示。
  
             
           
  首先,做用户和电影的嵌入层。

1 k = 128
2 model1 = Sequential()
3 model1.add(Embedding(n_users + 1, k, input_length = 1))
4 model1.add(Reshape((k,)))
5 model2 = Sequential()
6 model2.add(Embedding(n_movies + 1, k, input_length = 1))
7 model2.add(Reshape((k,)))

  第三个小神经网络,在第一、二个网络的基础上把用户和电影向量结合在一起。

1 model = Sequential()
2 model.add(Merge([model1, model2], mode = 'concat'))

  然后加入Dropout 和relu 这个非线性变换项,构造多层深度模型。

1 model.add(Dropout(0.2))
2 model.add(Dense(k, activation = 'relu'))
3 model.add(Dropout(0.5))
4 model.add(Dense(int(k/4), activation = 'relu'))
5 model.add(Dropout(0.5))
6 model.add(Dense(int(k/16), activation = 'relu'))
7 model.add(Dropout(0.5))

  因为是预测连续变量评分,最后一层直接上线性变化。当然,读者可以尝试分类问
题,用Softmax 去模拟每个评分类别的概率。

model.add(Dense(1, activation = 'linear'))

  将输出层和最后的评分数进行对比,后向传播去更新网络参数。

model.compile(loss = 'mse', optimizer = "adam")

  接下来要给模型输入训练数据。

  首先,收集用户索引数据和电影索引数据。

1 users = ratings['user_id'].values
2 movies = ratings['movie_id'].values

5 推荐系统

  收集评分数据。

label = ratings['rating'].values

  构造训练数据。

1 X_train=[users, movies]
2 y_train = label

  然后,用小批量更新权重。

model.fit(X_train, y_train, batch_size=100, epochs = 50)

  模型训练完以后,预测未给的评分。

1 i,j = 10,99
2 pred = model.predict([np.array([users[i]]), np.array([movies[j]])])

  最后,对训练集进行误差评估。

1 sum = 0
2 for i in range(ratings.shape[0]):
3 sum += (ratings['rating'][i] - model.predict([np.array([ratings['user_id'
][i]]), np.array([ratings['movie_id'][i]])])) ** 2
4 mse = math.sqrt(sum/ratings.shape[0])
5 print(mse)

  训练数据的误差在0.8226 左右,大概一个评分等级不到的误差。

  你可能会问,为什么这个误差和之前矩阵分解的浅层模型误差的差距比较大?作者的理解是,这里的Dropout 正则项起了很大的作用。虽然我们建了深层网络,但是由于有了Dropout 这个正则项,必然会造成训练数据的信息丢失(这种丢失会让我们在测试数据时受益)。就好比加了L1, L2 之类的正则项以后,估计的参数就不是无偏的了。因此,Dropout 是训练误差增加的原因,这是设计模型的必然结果。但是,需要记住的是,我们始终要对测试集上的预测做评估,训练集的误差只是看优化方向和算法是否大致有效。
  
  本文选自《Keras快速上手:基于Python的深度学习实战》,点此链接可在博文视点官网查看此书。
  
                    
  想及时获得更多精彩文章,可在微信中搜索“博文视点”或者扫描下方二维码并关注。
                        

揭秘Keras推荐系统如何建立模型、获取用户爱好相关推荐

  1. 怎么建立微信生态用户增长模型?

    微信最新数据及中国网民最新数据概述 截止到2018年,移动网民用户增长放缓,接近人口大盘.微信作为全国移动网民的一款超级应用,在移动网民的***率超过90%. 微信最近一年的新增用户主要来自中老年用户 ...

  2. 如何使用Keras和TensorFlow建立深度学习模型以预测员工留任率

    The author selected Girls Who Code to receive a donation as part of the Write for DOnations program. ...

  3. DL之Keras:基于Keras框架建立模型实现【预测】功能的简介、设计思路、案例分析、代码实现之详细攻略(经典,建议收藏)

    DL之Keras:基于Keras框架建立模型实现[预测]功能的简介.设计思路.案例分析.代码实现之详细攻略(经典,建议收藏) 目录 Keras框架使用分析 Keras框架设计思路 案例分析 代码实现 ...

  4. Keras : 利用卷积神经网络CNN对图像进行分类,以mnist数据集为例建立模型并预测

    我是本期目录酱! 引入 计算机视觉 图像特征 如何区分图像的类别 卷积神经网络 卷积Convolution 卷积层 池化Pooling 卷积神经网络 以mnist数据集为例建立模型并预测 简单分析 p ...

  5. AI上推荐 之 SDM模型(建模用户长短期兴趣的Match模型)

    1. 写在前面 今天整理的是SDM模型(Sequential Deep Matching Model),依然是阿里团队在2019年CIKM上的一篇paper.和MIND模型一样,是一种序列召回模型,研 ...

  6. 推荐系统:冷启动问题【用户冷启动、物品冷启动、系统冷启动】

    冷启动是推荐系统的重要挑战之一,也是推荐系统中非常重要的一个问题,有很多读者可能对冷启动不是特别了解或者不知道怎么设计一个好的冷启动方案,所以本文试图给大家讲清楚这些问题. 一.冷启动概述 1.什么是 ...

  7. 机器学习 建立模型_建立生产的机器学习系统

    机器学习 建立模型 When businesses plan to start incorporating machine learning to enhance their solutions, t ...

  8. 当知识图谱遇上推荐系统之PippleNet模型(论文笔记二)

    RippleNet | Propagating User Preferences on the Knowledge 类别:联合学习 将知识图谱特征学习和推荐算法的目标函数结合,使用端到端(end-to ...

  9. sql表格模型获取记录内容_SQL Server和BI –如何使用Excel记录表格模型

    sql表格模型获取记录内容 介绍 (Introduction) A few weeks back I had been working on an interesting proof of conce ...

  10. 计算机视觉(十一):Keras Pipline与自定义模型

    计算机视觉笔记总目录 使用了 Keras 的 Subclassing API 建立模型,即对 tf.keras.Model类进行扩展以定义自己的新模型,同时手工编写了训练和评估模型的流程.这种方式灵活 ...

最新文章

  1. python使用循环嵌套显示数字金字塔_如何使用Python生成数字金字塔?
  2. 怎样把 Boot Camp 里 Windows 的色温调节得和 Mac OS X 一致
  3. 深度神经网络(DNN)的正则化
  4. Linux DHCP Server 配置给FIT AP 使用的option
  5. w7计算机的收藏夹里弄出桌面,Win7电脑桌面的便签怎么弄出来?
  6. pandas php,pandas分组聚合代码详解
  7. linux软raid 系统坏了,LINUX下软RAID的制造及如何查看坏盘?
  8. 鸿蒙系统桌面天气如何设置,怎么设置桌面时间和天气预报?
  9. 计算机英语词汇的特点,计算机专业英语词汇特点.ppt
  10. protobuf和json的对比
  11. DeepMind AlphaStar星际争霸2首秀:Demo很强大,但现场比赛输了
  12. 微信小程序之15分钟倒计时(附带天数和时钟的实现方法在文章中)
  13. ExcelVBA之MsgBox函数的运行值结果
  14. 格式化字符串你都懂了吗
  15. 帐篷混沌映射在优化算法中的应用
  16. 宝塔安装的数据库外网无法访问
  17. 洛谷:玩具谜题,C语言
  18. Katago围棋学习记录(三)
  19. Android直播开发之旅(4):MP3编码格式分析与lame库编译封装
  20. Linux 远程访问及控制 OpenSSH 服务

热门文章

  1. luogu2668 luogu2540 斗地主(以及增强版)
  2. 关于JavaScript中this的指向,你知晓几分?请速来围观!
  3. 冲刺阶段—个人工作总结07
  4. Codeforces 781B. Innokenty and a Football League
  5. server 2012 IIS 启用.NET 4.5
  6. 【排序】内部排序算法实现
  7. php 之 json格式
  8. SVN记录转excel文件的小程序
  9. Source Insight 4.0常见问题和常用配置
  10. Dynamics CRM - 不同类型字段在 Plugin 里的赋值方式