推荐系统常用评价指标
目录
1.命中率HR(Hits Ratio)
2.归一化折损累计增益(Normalized Discounted Cumulative Gain,NDCG)
3.平均倒数排名(Mean Reciprocal Rank,MRR)
4.ILS
5.AUC&GAUC
6.Recall
7.覆盖率
9.半衰期(half-life-utility )
10.排序偏差准确率(rank-biased precision,RBP)
11.Mean Average Precision (MAP)
12.多样性
13.新颖性
14.稳定性指标:Mean Absolute Shift(平均绝对位移,MAS)
1.命中率HR(Hits Ratio)
意义:关心用户想要的,我有没有推荐到,强调预测的“准确性”
参数说明:
N:用户的总数量
hits(i):第i个用户访问的值是否在推荐列表中,是则为1,否则为0
2.归一化折损累计增益(Normalized Discounted Cumulative Gain,NDCG)
意义:关心找到的这些项目,是否放在用户更显眼的位置里,即强调“顺序性“
参数说明:
N:用户的总数量
p i : 第 i 个 用 户 的 真 实 访 问 值 在 推 荐 列 表 的 位 置 , 若 推 荐 列 表 不 存 在 该 值 , 则 p i → ∞ p_{i}:第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则p i→∞
3.平均倒数排名(Mean Reciprocal Rank,MRR)
意义:关心找到的这些项目,是否放在用户更显眼的位置里,即强调“顺序性“
参数说明:
N:用户的总数量
pi : 第 i 个 用 户 的 真 实 访 问 值 在 推 荐 列 表 的 位 置 , 若 推 荐 列 表 不 存 在 该 值 , 则 pi → ∞ p_{i}:第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则pi→∞
4.ILS
意义:衡量推荐列表多样性的指标,计算公式:
如果,S(bi,bj)计算的是 i ii和j jj两个物品的相似性,如果推荐列表中的物品越不相似,ILS越小,那么推荐结果的多样性越好。
5.AUC&GAUC
定义:对于二分类问题:
准确度: ,精确率:
,
召回率: , TPR(True Positive Rate):
FPR(越低越好): , F1-Score:
ROC :Receiver Operating Characteristic.
有些分类器(如朴素贝叶斯) , 输出的是 <预测类别, 概率>
的形式, 取不同的阈值, 就可以在当前数据集上得到不同的指标. 以FPR
为横轴,TPR
为纵轴,画出来的就是ROC曲线。
GAUC:Group AUC, AUC的一个变种, 常用于{推荐,计算广告} 等个性化场景, 通常以user作为group的维度, 即 user weighted AUC.
AUC 是全局样本排序能力的一个体现, GAUC 侧重于单个user下样本间的排序能力, 以此作离线指标, 对线上AB效果的参考性更强.
, 其中,AUCu表示该user下样本所组成数据集的AUC。
AUC实现代码:
import numpy as np
from sklearn.metrics import roc_auc_scorey_true = np.array([0, 0, 1, 1])
y_scores = np.array([0.1, 0.4, 0.35, 0.8])
print("AUC is ", roc_auc_score(y_true, y_scores)) # 0.75
6.Recall
定义:预测的topN,与用户实际点击的交集大小,除以实际点击的大小之和。
公式:
7.平均绝对误差(Mean Absolute Error, MAE)和标准平均绝对误差(NMAE)
定义: ,
其中,rmax和rmin分别为用户u评分区间的最大值和最小值。
8.均方根误差(Root Mean Squared Error, RMSE)和均方误差(MSE)
定义:
去掉根号即是MSE;
7.覆盖率
定义:推荐系统能够推荐出来的物品占总物品的比例。覆盖率越高表明模型能够针对更多的item产生推荐,从而促进长尾效应的挖掘。
定义:
此外,信息熵和基尼系数也可用来度量覆盖率。
8.Average Racipocal High ARHR
定义:加权版的HR, 衡量一个item被tui-h1m i
9.半衰期(half-life-utility )
定义:度量的是推荐系统对一个用户的实用性也即是用户真实评分和系统默认评分值的差别;
10.排序偏差准确率(rank-biased precision,RBP)
定义:与 DCG 指标不同,排序偏差准确率(rank-biased precision,RBP)假设用户往往先浏览排在推荐列表首位的商品然后依次以固定的概率p浏览下一个,以1−p的概率不再看此推荐列表。
11.Mean Average Precision (MAP)
, 其中,
12.多样性
13.新颖性
14.稳定性指标:Mean Absolute Shift(平均绝对位移,MAS)
参考:
【1】https://blog.csdn.net/shiaiao/article/details/109004341
【2】推荐系统有哪些常用的评价标准-SofaSofa
【3】推荐系统研究中常用的评价指标 - 知乎
推荐系统常用评价指标相关推荐
- 推荐系统常用评价指标和代码实现
评价指标 Recall 名称: 召回率(真阳性率) 意义:在推荐系统中,我们只关心正确推荐的有多少,也就是用户真实喜欢的,并不会关心推荐错的,所以我们用召回率,而不是准确率: 理解这个前提:混淆矩阵 ...
- 推荐系统常用评价指标:NDCG、Recall、Precision、Hit Rate
评价指标 NDCG Normalized Discounted Cumulative Gain(归一化折损累计增益) NDCG用作排序结果的评价指标,评价排序的准确性. 推荐系统通常为某用户返回一个i ...
- 推荐系统:常用评价指标总结【准确率、精确率、召回率、命中率、(归一化折损累计增益)NDCG、平均倒数排名(MRR)、ROC曲线、AUC(ROC曲线下的面积)、P-R曲线、A/B测试】
1.Recall(召回率)与Precision(精确率) 网站在提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐叫做TopN推荐,TopN推荐的预测准确率一般通过召回率和精确率来度量. 在介 ...
- 推荐系统常用的评价指标:HR、NDCG、MRR
推荐系统常用的评价指标 应用背景介绍 评价指标的知识来源 命中率HR(Hits Ratio) 归一化折损累计增益(Normalized Discounted Cumulative Gain,NDCG) ...
- 推荐系统常用的推荐算法
转载自 推荐系统常用的推荐算法 一.推荐系统概述和常用评价指标 1.1 推荐系统的特点 在知乎搜了一下推荐系统,果真结果比较少,显得小众一些,然后大家对推荐系统普遍的观点是: (1)重要性UI> ...
- 预测评价系统_「机器学习」一文读懂分类算法常用评价指标
前言 评价指标是针对将相同的数据,输入不同的算法模型,或者输入不同参数的同一种算法模型,而给出这个算法或者参数好坏的定量指标. 在模型评估过程中,往往需要使用多种不同的指标进行评估,在诸多的评价指标中 ...
- 推荐系统的评价指标总结
评价一个推荐系统的好坏的重要性不用多少.本文的总结非常的全面,相信读者通过阅读本文以及本文参考的文献可以对推荐系统的评价指标有比较全面的掌握. 对推荐系统的研究一个重要的环节是如何评价一个推荐算法的好 ...
- 推荐系统常用的推荐算法总结
一.推荐系统的概述 个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品.随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品.这种浏 ...
- 错误类型、混淆矩阵及目标检测常用评价指标
目标检测常用评价指标 本文主要参考陈恺大佬在B站商汤账号的介绍mmdetection的视频. 检测结果的正确/错误类型 真阳性(Ture Positive):算法检测到了某类物体(Positive), ...
最新文章
- java心电图心率计算_java如何画心电图?
- PHP获取 当前页面名称、主机名、URL完整地址、URL参数、获取IP
- linux动态库文件.so为什么有多个版本号?(多个名字)(小版本升级)
- C++ 关键字 extern
- es创建索引数量多了好还是少了好_Elasticsearch性能优化总结
- “北斗女神”徐颖:科研时间一定大于996
- JAVA 取得当前目录的路径/Servlet/class/文件路径/web路径/url地址
- 关于解决error A2004: symbol type conflict错误
- springboot testcontext @sql_SpringBoot图文教程11—从此不写mapper文件「集成MybatisPlus」...
- 2017 Multi-University Training Contest - Team 5 1.Rikka with Candies(压位)
- C语言随机读写数据文件(二)
- 了解腾讯云云支付CPay特性及应用场景
- 大数据下的供应商评分系统
- 带你深入理解矩阵乘法
- 利用java的for循环画一棵圣诞树
- 实现京东首页的轮播广告效果,包含三个以上产品广告
- “荣光医院”急救中心 73 问答
- Flutter从0到1自定义日历
- python--DataFrame随机抽样
- 洛谷:P3092 [USACO13NOV]No Change G(状压+二分,独特的状态定义,不写会后悔一辈子的题)