学习总结

第一步是导入 Spark 分割好的训练集和测试集。
第二步是在 TensorFlow 中设置评估指标,再在测试集上调用 model.evaluate 函数计算这些评估指标。这里使用了最常用的 Loss、Accuracy、ROC AUC、PR AUC 四个指标。
第三步是根据四个深度推荐模型的评估结果,进行模型效果的对比。

文章目录

  • 学习总结
  • 一、训练集和测试集的生成
  • 二、TensorFlow 评估指标的设置
  • 三、模型的效果对比
    • 3.1 选择模型
    • 3.2 DeepFM在这里为啥效果差
  • 四、作业
  • 五、课后答疑
  • Reference

一、训练集和测试集的生成

第一步是生成训练集和测试集,这里使用最简单的Holdout检验来划分训练集和测试集,调用spark的randomSplit函数。在tensorflow内部直接调用get_dataset方法分别载入训练集和测试集。
代码参考:FeatureEngForRecModel 对象中的 splitAndSaveTrainingTestSamples 函数。

【王喆-推荐系统】评估篇-(task3)TensorFlow的模型离线评估实践相关推荐

  1. 机器学习第十篇:如何评价模型效果评估

    前言 前面的推文中介绍了几种常用的机器学习算法,每个算法都有各自的优劣势,我们应该选择根据每个算法的优劣势去合理的选择适合我们需求的算法,以此达到效果最优,那么什么样的效果才是最优的,用什么来衡量这个 ...

  2. 【王喆-推荐系统】评估篇-(task2)推荐模型评估指标

    学习总结 学习了模型离线评估中使用的评估指标.低阶评估指标主要包括准确率,精确率,召回率和均方根误差.均方根误差的定义是预测值跟真实值之间差值的均方根. 高阶指标包括 P-R 曲线,ROC 曲线和平均 ...

  3. 机器学习模型评估的方法总结(回归、分类模型的评估)

    建模的评估一般可以分为回归.分类和聚类的评估,本文主要介绍回归和分类的模型评估: 一.回归模型的评估 主要有以下方法: 指标 描述 metrics方法 Mean Absolute Error(MAE) ...

  4. 【王喆-推荐系统】评估篇-(task5)Replay和Interleaving评估

    学习总结 (1)推荐系统的评估体系由传统离线评估.离线 Replay(在离线状态下对线上更新过程进行仿真,让整个评估过程"动"起来.).线上 Interleaving,以及线上 A ...

  5. 【王喆-推荐系统】线上服务篇-(task5)部署离线模型

    学习总结 (1)业界主流的模型服务方法有 4 种,分别是预存推荐结果或 Embeding 结果.预训练 Embeding+ 轻量级线上模型.利用 PMML 转换和部署模型以及 TensorFlow S ...

  6. 【王喆-推荐系统】评估篇-(task1)离线评估方法

    学习总结 (1)五种主流的推荐模型离线评估方法:Holdout 检验.交叉检验.自助法.时间切割和离线 Replay.Holdout 检验最简单常用,它通过随机划分的方式把样本集划分成训练集和测试集. ...

  7. TensorFlow实现模型评估

    我们需要评估模型预测值来评估训练的好坏. 模型评估是非常重要的,随后的每个模型都有模型评估方式.使用TensorFlow时,需要把模型评估加入到计算图中,然后在模型训练完后调用模型评估. 在训练模型过 ...

  8. 【王喆-推荐系统】复习篇-Sparrow的个性化推荐功能

    学习总结 首先,利用 Spark 对 MovieLens 原始数据进行了处理,生成了训练样本和特征,样本供 TensorFlow 进行模型训练,特征存入 Redis 供线上推断使用. 在 Tensor ...

  9. 【王喆-推荐系统】RS整体架构和流程

    这个系列是学习王喆的[深度学习推荐系统实战]时做的笔记和自己的学习总结. 文章目录 零.一个栗子的引入 一.学习目标和要求 1.学习目标 2.前置要求 二.推荐体系 1.基础架构篇 2.特征工程篇 3 ...

最新文章

  1. php对象的底层机制
  2. 涨工资一般涨百分之多少_上证50etf期权涨一个点能赚多少钱?
  3. centos6.8 如何编译php,centos 6.8 安装编译php7.1.2
  4. PHP做二次开发:本机安装ThinkCMF系统
  5. 开源软件 许可证密钥_自由和开源软件-1中的重要许可证
  6. python 网络维护_python学习之网络基础
  7. 一个按照行来截取显示文章摘要的函数
  8. Qt 人类可读大小 quint64字节转可读字符串 “1.1 GB“
  9. 系统集成项目管理工程师2022年上半年广东卷下午案例分析题及答案
  10. SQL Server 双机热备份-实现主从复制
  11. ubuntu 串口调试助手
  12. 用js计时器写倒计时
  13. dd dt标签 显示与隐藏
  14. 【HDU4960】Another OCD Patient
  15. 水果店圈子:水果店开张怎样做促销活动,水果店开业一般有些什么活动
  16. 可视对讲系统服务器连接失败,可视对讲系统呼叫分机、门口机不通是什么问题?...
  17. Jackknife,Bootstrap, bagging, boosting, AdaBoost, Rand forest 和 gradient boosting的区别
  18. 基于jsp mysql的二手物品交易系统_jsp+mysql高校二手物品交易系统设计
  19. 已解决for example: not eligible for auto-proxying
  20. 小米应用市场关键词覆盖技巧,小米关键词优化

热门文章

  1. Google 关键词趋势数据下载 同步版本 与异步版本
  2. Excel函数使用之 VLOOKUP,MID,FIND,SUBSTITUTE,SUMPRODUCT,COUNTIFS
  3. 零基础进入java行业,我是怎么做到的
  4. Spring框架的第二天学习总结(1)
  5. html物理像素,css中px是像素的意思么?
  6. UE4控制台命令有哪些,什么意思?
  7. 短信诈骗 smishing
  8. Python:画一只小狗
  9. Phonegap之ios对iPhone6和Plus的闪屏适配 -- xmTan
  10. C语言sizeof的计算方式