F-Measure又称为F-Score,是IP(信息检索)领域常用的一个评价标准,计算公式为:

其中β是参数,P是准确率(Precision),R是召回率(Recall).

F1-Measure:当参数β=1时,就是最常见的F1-Measure了:F1 = 2P*R / (P+R)

准确率和召回率:找回率和准确率是搜索引擎的设计中很重要的两个概念和指标。

召回率:Recall,又称“查全率”;

准确率:Precision,又称“精度”、“正确率”。

在一个大规模数据集合中检索文档时,对每个查询(Query)我们可以统计出四个值::
   
相关
不相关  
   
1
0
合计
检索到
1
True Positive(TP)真正
False Positive(FP)假正 Predicted Positive(TP+FP)
未检索到
0
False Negative(FN)假负
True Negative(TN)真负
Predicted Negative(FN+TN)
合计
 
Actual Positive(TP+FN)
Actual Negative(FP+TN)
TP+FP+FN+TN
TP:检索到的,相关的 (搜到的也想要的)
FP:检索到的,但是不相关的 (搜到的但没用的)
FN:未检索到的,但却是相关的 (没搜到,然而实际上想要的)
TN:未检索到的,也不相关的 (没搜到也没用的)
那么,P = TP/(TP+FP),R =TP/(TP+FN)
召回率:检索到的相关文档 /库中所有的相关文档
准确率:检索到的相关文档/所有被检索到的文档
通常我们希望:数据库中相关的文档,被检索到的越多越好,这是追求“查全率”越大越好。同时我们还希望:检索到的文档中,相关的越多越好,不相关的越少越好,这是追求“准确率”越大越好。
“召回率”与“准确率”的关系
    “召回率”与“准确率”虽然没有必然的关系,然而在大规模数据集合中,这两个指标却是互相制约的。
    由于“检索策略”并不完美,希望更多相关的文档被检索到时,放宽“检索策略”时,往往也会伴随出现一些不相关的结果,从而使准确率受到影响。
    而希望去除检索结果中的不相关文档时,务必要将“检索策略”定的更加严格,这样也会使有一些相关的文档不再能被检索到,从而使召回率受到影响。
    凡是涉及到大规模数据集合的检索和选取,都涉及到“召回率”和“准确率”这两个指标。而由于两个指标相互制约,我们通常也会根据需要为“检索策略”选择一个合适的度,不能太严格也不能太松,寻求在召回率和准确率中间的一个平衡点。这个平衡点由具体需求决定。

转载于:https://www.cnblogs.com/rong86/p/3657956.html

f-measure[转]相关推荐

  1. F值(F-measure),准确率,召回率计算方法

    F值是预测结果的评价尺度之一 我们假设一个2分类器,也就是只能区分TRUE和FALSE -- 真实真 真实假 预测真 TP FP 预测假 FN TN TP = True Positive FN = F ...

  2. 分类模型性能评价指标:混淆矩阵、F Score、ROC曲线与AUC面积、PR曲线

    以二分类模型为例:二分类模型最终需要判断样本的结果是1还是0,或者说是positive还是negative. 评价分类模型性能的场景: 采集一个称之为测试集的数据集: 测试集的每一个样本由特征数据及其 ...

  3. 深蓝学院的深度学习理论与实践课程:第四章

    1.模型与风险 在模型评价时会有理想情况和现实情况(现实情况分为两种) 在学习过程中最重要的是损失函数: 还有其他损失函数. 损失函数是用来量化模型预测和真实标签之间的差异.比如说我们模型预测出来是, ...

  4. Gif(1)-加载视图-交替圆效果

    依然是个收藏已久的Gif,今天来实现一下. 记忆里好像是有人已经实现过了.刚才去找了下,又没找到.如果哪个朋友看到过过,给我发下,我来对比下,我想总会又收获的.Gif如下图. 效果图如下: 原理 原理 ...

  5. 201771010106东文财《面向对象程序设计(java)》实验12

    实验十二  图形程序设计 实验时间 2018-11-14 1.实验目的与要求 (1) 掌握Java GUI中框架创建及属性设置中常用类的API: (2) 掌握Java GUI中2D图形绘制常用类的AP ...

  6. Sklearn(v3)——SVM理论(4)

    二分类SVC中的样本不均衡问题:重要参数class_weight 对于分类问题,永远都逃不过的一个痛点就是样本不均衡问题.样本不均衡是指在一组数据集中,标签的一类天生 占有很大的比例,但我们有着捕捉出 ...

  7. Precision和Recall

    原文出自:http://blog.csdn.net/wangran51/article/details/7579100 最近一直在做相关推荐方面的研究与应用工作,召回率与准确率这两个概念偶尔会遇到, ...

  8. 基于Spatial CNN的车道线检测和交通场景理解

    SCNN车道线检测--(SCNN)Spatial As Deep: Spatial CNN for Traffic Scene Understanding(论文解读) Spatial As Deep: ...

  9. ML之RF:基于RF算法实现案例(数据集samtrain.csv、samval.csv、samtest.csv)

    ML之RF:基于RF算法实现案例(数据集samtrain.csv.samval.csv.samtest.csv) 目录 输出结果 核心代码 参考 输出结果 核心代码 #我们对训练集采用随机森林模型,并 ...

  10. 机器学里面的一些概念-召回率,精确度等的介绍

    准确率召回率 准确率召回率 http://blog.sina.com.cn/s/blog_4b59de070100ehl7.html 最近一直在做相关推荐方面的研究与应用工作,召回率与准确率这两个概念 ...

最新文章

  1. rocketmq之控制台rocketmq-console编译安装(二)
  2. getchar()函数的一些知识
  3. windows下安装python和Python-opencv
  4. 在ASP.NET Core 2.0中使用CookieAuthentication
  5. Xor sum HDU - 6955
  6. php获取当前世界,php获取网站alexa世界流量排名代码
  7. OpenCV——读取视频文件并写入文件
  8. 菜鸟教程 之 HTML DOM 和 浏览器BOM
  9. 微信开发 Java SDK
  10. java几种集合遍历速度对比
  11. webstorm phpstorm idea 如何修改文件类型 修改文件类型关联
  12. Ps“反转负冲”人像处理一例
  13. Handing Incomplete Heterogeneous Data using VAEs
  14. java string数组循环_java数组中String [ ] a={aa,bb,cc};利用for循环进行遍历
  15. 最强【网络安全】是哪些大学?看一下一流网络安全学院建设高校
  16. 001-云E办_后端项目搭建
  17. 【原创】老谷项目管理MSN群6.23记录
  18. 用HTML写美食网站论文,基于web的美食网站l论文.doc
  19. pytho简单爬虫_模拟登陆西电流量查询_实现一键查询自己的校园网流量
  20. 服务器托管、云主机的差别有哪些

热门文章

  1. 通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析
  2. 启动SecureCRT出现ImportError: No module named _sysconfigdata_nd
  3. class AbstractAPI(metaclass=AbstractAPIMeta):SyntaxError: invalid syntax
  4. pipe实现单工和半双工模式
  5. 机器学习 数据增加_【机器学习】数据降维概述
  6. linux查找并删除进程,linux中查找并kill一个名为server的进程
  7. java 制作小游戏_如何用java制作小游戏
  8. 2018年工业机器人销量排位_2020年全球工业机器人现状与竞争情况 中国为全球最大供应国...
  9. python中from import用法_python学习--Python之import与from...import的区别与用法
  10. 枚举 PROBLEM 1 生理周期