文章目录

  • 相关的评价标准
  • Precision
  • average precision
  • mean average precision
  • MAP注意
  • 图像检索的AP和MAP
  • MRR
  • DCG
  • 参考

相关的评价标准


NDGG也是用来衡量排序质量的指标

Precision

此时是根据阈值K来确定检索的精度。
如下图的例子,对于一次检索,我们可以获得已经排序好的返回的文档,假设一共有R个,此时不同的K有不同的检索精度,如果只看前3个返回的文本。那么此时对应3个样本的精度为Prec@3 = 2/3。

average precision

此时的average precision仍然是对应于一次检索,每次设定一个阈值K,此K位置上的样本是相关的样本即正确的样本,那么我们就能计算出一次精度,对于一次检索,假设一共有R个样本,那么,阈值的选取【K1,K2.......KRK_1,K_2.......K_RK1​,K2​.......KR​】其中下标即为阈值。


mean average precision

mean average precision 对于不同样本的多次检索,计算平均检索精度。

MAP注意

  1. 如果相关的样本没有被检索到,那么定义此处的检索精度为0
  2. MAP是比average precision更上一层的平均。
  3. MAP更感兴趣的是在检索中返回的样本相关性更高。

图像检索的AP和MAP

MRR



DCG






参考

  1. 原版PDF此处下载:http://web.stanford.edu/class/cs276/handouts/EvaluationNew-handout-1-per.pdf
  2. 图像检索:信息检索评价指标

信息检索评价标准计算相关推荐

  1. 二分类最优阈值确定_分类模型评价标准,AUC还是Macro F1?

    在人工智能领域,分类任务占据了很大的比例,例如物体识别(计算机视觉).信用卡欺诈(数值型预测).情感分析(自然语言处理)等等.针对众多的分类需求,模型的评价标准只是简单的准确率(Accuracy)吗? ...

  2. 视频压缩知识介绍(一)——评价标准及算法原理

    1.1   视频压缩评价标准               评价视频压缩算法的压缩效果,信噪比是一个非常有效的指标,它非常客观.一般来说,同等码率下,解码后图像与原始图像的信噪比高的那个码流,图像效果更 ...

  3. 多目标跟踪评价标准(MOT)

    简介: MOTChallenge是多目标跟踪领域最为常用的benchmark,其中2D MOT15,3D MOT15,MOT16,MOT17,MOT20都是多目标跟踪领域常用的数据集. 下面我们按照M ...

  4. 机器翻译的评价标准BLEU(Evaluation criteria for machine translation)

    1.概念 BLEU(bilingual evaluation understudy)在这篇论文中被提出BLEU: a Method for Automatic Evaluation of Machin ...

  5. 人脸对齐算法常用评价标准总结

    转载请注明作者和出处: http://blog.csdn.net/john_bh/ 文章目录 1. I O N 和 I P N ION和IPN ION和IPN 2. M N E MNE MNE (th ...

  6. 特征工程之特征分箱(决策树分箱、卡方分箱、bestks以及评价标准WOE和IV)

    特征工程之特征分箱:决策树分箱.卡方分箱.bestks以及评价标准 1.WOE和IV 2.无监督分箱 2.1等频分箱 2.2等距分箱 3.有监督分箱 3.1决策树分箱 3.2best-ks分箱 3.3 ...

  7. 人脸检测通用评价标准

    评价标准 二分类的精准率和召回率 人脸检测是目标检测的一个特例,因为目标类别只有一类,剩下的都是背景,所以人脸检测评价标准中会用到些二分类问题的评价,在这里先提一下. 二分类问题最常用的就是精准率和召 ...

  8. 创新型中小企业评价标准有哪些?

    优质中小企业是指在产品.技术.管理.模式等方面创新能力强.专注细分市场.成长性好的中小企业,由创新型中小企业.专精特新中小企业和专精特新"小巨人"企业三个层次组成. 创新型中小企业 ...

  9. 算法模型好坏、评价标准、算法系统设计

    算法模型好坏的评价通用标准: 1.解的精确性与最优性.基于正确性基础上. 2.计算复杂度,时间成本. 3.适应性.适应变化的输入和各种数据类型. 4.可移植性. 5.鲁棒性.健壮性. 鲁棒性(robu ...

  10. 人脸对齐算法常用评价标准

    人脸对齐常用评价标准 1 the inter-ocular distance normalized error        其中xixix_i表示预测坐标点,x∗ixi∗x^*_i表示ground- ...

最新文章

  1. PyTorch 重磅更新,不只是支持 Windows
  2. 条形压电陶瓷执行器件和高压驱动器
  3. java -c_java% c
  4. 勇探计算机城堡教学反思,神秘的城堡教学反思
  5. python获取程序运行路径
  6. jxls遍历list时使用模板的批注语法
  7. 三种技术类型的3D摄像头大体总结 3D人脸识别
  8. 英雄联盟服务器状态在线怎么解决,解决英雄联盟无法连接到服务器的方法 看完就明白了...
  9. 视频会议系统gk服务器,TENKING- 远程视频会议系统
  10. 用word快速将数字字体换成新罗马详细简单方法
  11. 双系统后适合装matlab吗,安装双系统对电脑有什么影响|电脑装双系统有什么好处和坏处...
  12. 让 ChatGPT 如虎添翼 2.0
  13. 程序员学历不好是硬伤?苹果公司 50% 员工没大学学历
  14. Android应用开发获取手机电池电量的简单方法
  15. 【SQL】遍历字符串之Substr
  16. 笔记本计算机名称PC2019,2019值得推荐的13寸笔记本电脑汇总
  17. python的上下文管理用哪个关键字_正确理解python中的关键字“with”与上下文管理器...
  18. 发票识别+发票查验API-企业发票管理自动化
  19. ios开发中常用的几种辅助方法
  20. D触发器竞赛4人抢答电路

热门文章

  1. 二分图的匹配(未完)
  2. SuSE 10操作系统中设置系统时间的方法
  3. 31.前端之html
  4. nc(NetCat)命令
  5. Entity Framework 学习高级篇2—改善EF代码的方法(下)(转)
  6. 批量重命名同一文件夹下的文件
  7. tensorflow 的 Session Exception
  8. Python杂记-set()
  9. 预训练模型的下一步?突破Impossible Triangle
  10. 二次元始,跌宕几年,至学术略有成就并步入业界的我与NLP的这七年时光!