信息检索评价标准计算

文章目录

相关的评价标准
Precision
average precision
mean average precision
MAP注意
图像检索的AP和MAP
MRR
DCG
参考

Precision

此时是根据阈值K来确定检索的精度。
如下图的例子，对于一次检索，我们可以获得已经排序好的返回的文档，假设一共有R个，此时不同的K有不同的检索精度，如果只看前3个返回的文本。那么此时对应3个样本的精度为Prec@3 = 2/3。

average precision

此时的average precision仍然是对应于一次检索，每次设定一个阈值K，此K位置上的样本是相关的样本即正确的样本，那么我们就能计算出一次精度，对于一次检索，假设一共有R个样本，那么，阈值的选取【K1,K2.......KRK_1,K_2.......K_RK1,K2.......KR】其中下标即为阈值。

mean average precision

mean average precision 对于不同样本的多次检索，计算平均检索精度。

MAP注意

如果相关的样本没有被检索到，那么定义此处的检索精度为0
MAP是比average precision更上一层的平均。
MAP更感兴趣的是在检索中返回的样本相关性更高。

图像检索的AP和MAP

MRR

DCG

参考

原版PDF此处下载：http://web.stanford.edu/class/cs276/handouts/EvaluationNew-handout-1-per.pdf
图像检索：信息检索评价指标

信息检索评价标准计算相关推荐

二分类最优阈值确定_分类模型评价标准，AUC还是Macro F1？
在人工智能领域,分类任务占据了很大的比例,例如物体识别(计算机视觉).信用卡欺诈(数值型预测).情感分析(自然语言处理)等等.针对众多的分类需求,模型的评价标准只是简单的准确率(Accuracy)吗? ...
视频压缩知识介绍（一）——评价标准及算法原理
1.1 视频压缩评价标准评价视频压缩算法的压缩效果,信噪比是一个非常有效的指标,它非常客观.一般来说,同等码率下,解码后图像与原始图像的信噪比高的那个码流,图像效果更 ...
多目标跟踪评价标准(MOT)
简介: MOTChallenge是多目标跟踪领域最为常用的benchmark,其中2D MOT15,3D MOT15,MOT16,MOT17,MOT20都是多目标跟踪领域常用的数据集. 下面我们按照M ...
机器翻译的评价标准BLEU(Evaluation criteria for machine translation)
1.概念 BLEU(bilingual evaluation understudy)在这篇论文中被提出BLEU: a Method for Automatic Evaluation of Machin ...
人脸对齐算法常用评价标准总结
转载请注明作者和出处: http://blog.csdn.net/john_bh/ 文章目录 1. I O N 和 I P N ION和IPN ION和IPN 2. M N E MNE MNE (th ...
特征工程之特征分箱（决策树分箱、卡方分箱、bestks以及评价标准WOE和IV)
特征工程之特征分箱:决策树分箱.卡方分箱.bestks以及评价标准 1.WOE和IV 2.无监督分箱 2.1等频分箱 2.2等距分箱 3.有监督分箱 3.1决策树分箱 3.2best-ks分箱 3.3 ...
人脸检测通用评价标准
评价标准二分类的精准率和召回率人脸检测是目标检测的一个特例,因为目标类别只有一类,剩下的都是背景,所以人脸检测评价标准中会用到些二分类问题的评价,在这里先提一下. 二分类问题最常用的就是精准率和召 ...
创新型中小企业评价标准有哪些？
优质中小企业是指在产品.技术.管理.模式等方面创新能力强.专注细分市场.成长性好的中小企业,由创新型中小企业.专精特新中小企业和专精特新"小巨人"企业三个层次组成. 创新型中小企业 ...
算法模型好坏、评价标准、算法系统设计
算法模型好坏的评价通用标准: 1.解的精确性与最优性.基于正确性基础上. 2.计算复杂度,时间成本. 3.适应性.适应变化的输入和各种数据类型. 4.可移植性. 5.鲁棒性.健壮性. 鲁棒性(robu ...
人脸对齐算法常用评价标准
人脸对齐常用评价标准 1 the inter-ocular distance normalized error 其中xixix_i表示预测坐标点,x∗ixi∗x^*_i表示ground- ...