1. 准确率,召回率,F1值

首先介绍三种最常用的无序的评价指标,它们适用于一种相对简单的情况:在搜索结果中仅考虑返回的文档是否与查询相关,而不考虑这些返回文档在结果列表中的相对位置和顺序。

准确率(Precision)是返回的结果中相关文档所占的比例

召回率(Recall)是返回的相关文档占所有相关文档的比例

具体可以根据混淆矩阵来理解


  相关 不相关
返回 真正例(tp) 伪正例(fp)
未返回 伪反例(fn) 真反例(tn)

已知上述矩阵,那么准确率和召回率可以按如下方法计算:

举个例子,假设针对某个查询词,某搜索引擎返回10个结果,其中有5个是相关的,那么准确率就等于5/10 = 50%, 如果索引中与该查询词相关的文档共有8个(也就是说还有3个没有返回),那么召回率就等于5/8 = 67.5%.

通常而言,一个好的搜索引擎需要兼顾准确率(P)和召回率(R),因此有了结合两者的指标—— F值,它是准确率和召回率的调和平均值,定义如下:

其中, 表示强调正确率,而表示强调召回率。当时,表示准确率和召回率的权重相等,通常记为,此时F值的计算公式可以简化为

这里为什么使用调和平均而不是算术平均来计算F值呢?考虑极端的情况,如果搜索结果返回所有的文档,那么此时召回率就是100%,这时的F值至少为50%,这显然是不合理的。而调和平均值小于等于算术平均值和几何平均值,如果两个求平均的数之间差距比较大,那么调和平均值更接近其中较小的值。

2. MAP

准确率,召回率和F值都是利用无序的文当集合进行计算,而搜索引擎返回的结果通常是有序的,因此有必要对这些指标进行扩展以考虑位置信息。

MAP(Mean Average Precision)是近年来比较流行的评价指标, MAP在准确率的基础上考虑了位置的因素。

首先对于单个查询,其平均准确率的具体计算方法如下:

其中r是相关文档的总数,Q是查询总数。

查询集合的平均准确率由所有单个查询的MAP值的平均。

总的来说,系统检索出来的相关文档在列表中越靠前,MAP的值就越高。如果系统没有返回相关文档,则MAP=0.

3.NDCG

NDCG(normalized discounted cumulative gain,归一化折损累计增益)是一种近年来逐渐被采用的指标,尤其是在基于机器学习的排序方法中。NDCG是针对连续值的指标,它基于前k个检索结果进行计算。设R(j,d)是评价人员给出的文档d对查询j的相关性得分(通常是一个概率),那么有:

其中,用于保证对于查询j最完美系统的NDCG在k的位置得分是1,m是返回文档的位置。

如果某查询返回的文档数,,那么上述公式只需要计算到k‘为止。

信息检索系统常用的评价指标(准确率,召回率,F1,MAP,NDCG)相关推荐

  1. 【数据挖掘】K-NN 分类 ( 简介 | 分类概念 | K-NN 分类实例 | K-NN 分类准确度评估 | K-NN 分类结果评价指标 | 准确率 | 召回率 )

    文章目录 I . K-NN 简介 II . K-NN 分类 III . K-NN 分类实例 IV . K-NN 分类 准确性评估方法 V . 保持法 VI . kkk-交叉确认法 VII . K-NN ...

  2. 准确率,召回率,mAP,ROC,AUC,特异性,敏感性,假阴性,假阳性

    P/R和ROC是两个不同的评价指标和计算方式,一般情况下,检索用准确率.召回率.F1.AP和mAP,分类.识别等用ROC和AUC(特异性和敏感性是ROC当中的一个部分). 准确率.召回率.F1.AP和 ...

  3. 准确率-召回率 - Precision-Recall

    Precision-Recall 准确率-召回率 本文翻译自 Precision-Recall 更多翻译可以看 Scikit-learn 某部分的中文翻译 用于评估分类器输出质量的 准确率-召回率 指 ...

  4. 准确率,召回率,F值,ROC,AUC

    准确率,召回率,F值,ROC,AUC 责任编辑:词汇网 发表时间:2016-4-23 20:08:08 度量表 1.准确率 (presion)p=TPTP+FP 理解为你预测对的正例数占你预测正例总量 ...

  5. 图像分类 图像分割的评价指标(混淆矩阵 正确率 精准率 召回率 F1分数 IOU dice系数)

    在图像分类或者图像分割中,为评价模型的预测效果,在训练过程中通常需要比较预测值与真实标签值的差距,即误差. 目录 图像分类过程的评价指标 混淆矩阵 正确率/准确率 精准率 召回率 F1分数 图像分割过 ...

  6. 准确率/召回率/精准率/F值_模型评价

    准确率/召回率/精准率/F值 模型选择:对特定任务最优建模方法的选择或者对特定模型最佳参数的选择. 在训练数据集上运行模型(算法)并在测试数据集中测试效果, 迭代进行数据模型的修改, 这种方式被称为交 ...

  7. 目标检测 YOLOv5 - 如何提高模型的指标,提高精确率,召回率,mAP等

    目标检测 YOLOv5 - 如何提高模型的指标,提高精确率,召回率,mAP等 flyfish 文中包括了YOLOv5作者分享的提高模型指标小技巧和吴恩达(Andrew Ng)在做缺陷检测项目( ste ...

  8. 精确度/召回率/F1值/Micro-F1和Macro-F1的理解

    如下图所示,假设有若干张图片,其中12张是狗的图片其余是猫的图片.现在利用程序去识别狗的图片,结果在识别出的8张图片中有5张是狗的图片,3张是猫的图片(属于误报). 图中,实心小圆代表狗的图片,虚心小 ...

  9. 准确率 召回率_机器学习tips(四):精确率(precision)和召回率(recall)

    精确率(precision)和召回率(recall) 混淆矩阵 True Positive(真正, TP):将正类预测为正类数. True Negative(真负 , TN):将负类预测为负类数. F ...

最新文章

  1. sqlservice对于时间的操作
  2. 百胜软件2016年双十一项目正式启动
  3. sklearn svm
  4. 全国计算机等级考试题库二级C操作题100套(第74套)
  5. pandas 数据处理进阶
  6. Uncaught TypeError: Cannot read property ‘clientWidth‘ of null报错
  7. Java:JDK、JRE和JVM的关系(图示详解,一眼就能看明白!)
  8. 代码可读性、可调式、可维护性
  9. 关于如何卸载联想电脑管家及Lenovo.Imcontroller相关问题
  10. 彻底删除的视频怎么恢复?找回丢失的视频有3种方式
  11. Godaddy、Lunarpages、IXwebhosting国外三大主机点评
  12. 免费的JPEG 恢复软件 - 照片删除了怎么恢复?
  13. LTE物理传输资源(3)-时频资源
  14. 那你讲一下LeakCanary的原理
  15. 并联电容器总结与理解
  16. ajaxsubmit提交两次
  17. 聊聊关于创业公司招聘技术负责人
  18. Tomcat相关原理及性能优化
  19. 遇见逆水寒最新服务器是哪个,遇见逆水寒合服公告 遇见逆水寒旧服账号还在吗...
  20. 高防服务器如何防止网站攻击,高防服务器怎么防御攻击的?

热门文章

  1. 【ICO/WMF】PNG/JPEG转ICO/WMF工具
  2. 小象学院 零基础Python入门 案例三 BMR计算器v_3.0+v_4.0
  3. 随笔:幽灵一样的基类
  4. linux 查询文件大小大于1g_Linux文件的常用操作命令
  5. 零基础转行成功的前辈写给测试新手的话
  6. css3属性transform之translate
  7. 2021天梯赛 L2-040 哲哲打游戏 题解
  8. 正态分布的参数含义μ,σ
  9. 齐鲁理工学院计算机与科学,齐鲁理工学院学生在山东省大学生科技节斩获16项大奖...
  10. 【读书笔记】《幸福的方法》——人生的终极财富与意义