文本检索中常用的评价指标有:MAP、nDCG、ERR、F-score/F-measure以及附加的Precision、Recall、AveP、CG、DCG、IDCG、MRR、IOU、置信度阈值(confidence thresholds)、cascade models等

https://blog.csdn.net/u010138758/article/details/69936041
https://blog.csdn.net/zdh2010xyz/article/details/54293298
https://blog.csdn.net/luo123n/article/details/48573397
https://blog.csdn.net/yangzzguang/article/details/80540375

为了将 mAP 迁移到图像的多标签分类和 TopN 推荐任务中来。
对于图像多标签分类问题:
假设有 N 张图片,为了简单期间,暂且假设这 N 张图片仅包含 3 个标签:car、 people、stone,其中有 car 的图片有 M1 张,有people和有stone的分别有 M2 和 M3 张,那么对于单个分类标签 car,根据分类器设定的阈值,将预测列表从 top-1扩展到 top-N ,可以计算 N 个 max precision(r’ >= r) 的值,然后对 N 个 max precision(r’ >= r) 求平均值,即可得到 AP_car,同理,可以得到 AP_people 和 AP_stone,最后对这 3 个标签的 AP 值取平均,就可以计算模型在 3 个标签上的整体分类能力了。

总之,AP衡量的是学出来的模型在单个类别上的好坏 (比如AP_car),对于同一张照片(一批照片,N 张),在一个标签上分类效果好不代表在另一个标签上分类效果好,因此还需要在其他标签上计算 AP 值,最后取这些标签 AP 值的平均数,得到mAP。mAP衡量的是学出的模型在所有类别上(比如car、people、stone)的好坏,得到每个标签的 AP 后, mAP 的计算就变得很简单了,就是取所有AP的平均值,如:
mAP = (AP_car + AP_people + AP_stone)

http://m.itboth.com/d/mYZrE3/prc-auc-roc

信息检索 IR 中的评价指标相关推荐

  1. 信息检索(IR)的评价指标介绍

    信息检索(IR)的评价指标介绍 一.准确率.召回率和F1 IR领域两个最基本的指标召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率. 1.召 ...

  2. 论文 | 信息检索结果Ranking的评价指标《RankDCG: Rank-Ordering Evaluation Measure》

    未经允许,不得转载,谢谢~~ 一 文章简介 为什么要提出这个新的评价算法? 我们都知道ranking过程对于信息检索的结果是非常重要的,那么我们就需要有一些算法能评价ranking的结果到底如何. 现 ...

  3. 信息检索(IR)——索引与检索

    信息检索(IR)--索引与检索 1. 索引 在介绍这部分内容之前,我们先来回顾一下信息检索系统的基本架构: 1.1 索引的作用 首先,当用户提交一个query的时候,我们考虑一下,应该如何生成结果?如 ...

  4. 信息检索(IR)—链接分析

    信息检索(IR)-链接分析 1 超链接介绍 1.1 网页中的超链接 链接反应的是网页之间形成的"参考"."引用"和推荐的关系.可以合理的假设,若一篇网页被较多的 ...

  5. 信息检索(IR)—排序学习技术

    信息检索(IR)-排序学习技术 1 引入 回顾搜索引擎的发展历史,其发展的过程如下图所示: 在之前的文章中,我们介绍了基于链接分析的搜索引擎,下面我们来介绍基于排序学习的搜索引擎中的排序学习技术. 1 ...

  6. 信息检索(IR)—信息检索模型(一)

    信息检索(IR)-信息检索模型(一) 1. 信息检索模型的概念和分类 1.1 信息检索模型的概念 信息检索模型是一个四元组 [ D , Q , F , R ( q i , d j ) ] [D,Q,F ...

  7. 机器学习中的评价指标--1[F,P,R]

    机器学习中的评价指标--1[F,P,R] 机器学习中的评价指标 1.关于 P.R 值 2.F值的计算 3.其它 4.参考 5.附录 机器学习中的评价指标 关于这一部分,我将在遇到的时候,进行简要的说明 ...

  8. 综合评价模型的缺点_【必备】目标检测中的评价指标有哪些?

    在人工智能领域,机器学习的效果需要用各种指标来评价.当一个目标检测模型建立好了之后,即模型训练已经完成,我们就可以利用这个模型进行分类识别.那么该如何去评价这个模型的性能呢? 上期我们一起学习了全卷积 ...

  9. 利用计算机运算符编写检索式,计算机信息检索过程中常用的检索表达式

    信息检索过程中常用的检索表达式 检索表达式是检索策略的具体体现之一,简称检索式.检索式一般由检索词和各种逻辑运算符组成.具体来说,它是用检索系统规定的各种算符将检索词之间的逻辑关系.位置关系等连接起来 ...

  10. 机器学习中的评价指标(分类指标评Accuracy、Precision、Recall、F1-score、ROC、AUC )(回归指标评价MSE、RMSE、MAE、MAPE、R Squared)

    文章目录 1.机器学习中的评价指标 基础 (一)分类指标评价 1.Accuracy 2.Precision.查准率 3.Recall.查全率 4.F1-score 举个例子: 5.ROC 6.AUC ...

最新文章

  1. MobileNet Unet
  2. Consul 服务注册中心
  3. 无约束优化算法——牛顿法与拟牛顿法(DFP,BFGS,LBFGS)
  4. android 获取sim卡,Android 获取手机SIM卡运营商
  5. centos mysql 允许远程访问
  6. LogBack 打印 ES的DSL日志信息
  7. laravel本地项目上传服务器,laravel 上传本地文件到服务器
  8. Creating DataFrames spark当中重要的部分DataFrames
  9. Windows下的OpenCv安装
  10. 实用开源镜像站(将持续补全......)
  11. 用 Python 分析韦德职业生涯数据
  12. openCV实践项目:银行卡卡号识别
  13. AM系列备自投保护装置在广州中山大学附属 第一(南沙)医院配电工程中的应用
  14. 【分布式 论文】之 1. MapReduce——Simplified Data Processing on Large Clusters
  15. mysql索引 b树_B树与MySQL数据库索引.ppt
  16. win7和win10 5次shift漏洞破解开机密码
  17. 力争上游 ——我眼中的“计算机产业链”
  18. No operations allowed after statement closed
  19. Java进阶4-Elasticsearch
  20. 汽车以太网- IEEE 802.3标准

热门文章

  1. redis的批量操作命令pipeline(PHP实现)
  2. java:通过Calendar类正确计算两日期之间的间隔
  3. 网站禁止复制类型的属性
  4. WinForm中ComBoBox绑定显示值和实际值
  5. java day17 【线程、同步】
  6. 09程序员的修炼之道阅读笔记之三
  7. redis、kafka、rabittMQ对比 (转)
  8. server 2012 IIS 启用.NET 4.5
  9. Android 新建项目 页面
  10. Codeforces 1009G Allowed Letters 最大流转最小割 sosdp