每个具体的参数代表什么,明确好。无非就是第几个样本,属于某个类别的概率,非常清晰

from paddlenlp.metrics import AccuracyAndF1@paddle.no_grad()
def evaluate(model, criterion, metric, data_loader):"""Given a dataset, it evals model and computes the metric.Args:model(obj:`paddle.nn.Layer`): A model to classify texts.data_loader(obj:`paddle.io.DataLoader`): The dataset loader which generates batches.criterion(obj:`paddle.nn.Layer`): It can compute the loss.metric(obj:`paddle.metric.Metric`): The evaluation metric."""model.eval()metric.reset()losses = []for batch in data_loader:input_ids, token_type_ids, labels = batchlogits = model(input_ids, token_type_ids)loss = criterion(logits, labels)losses.append(loss.numpy())correct = metric.compute(logits, labels)metric.update(correct)res = metric.accumulate()print("eval loss: %f, acc: %s, precision: %s, recall: %s, f1: %s, acc and f1: %s, "% (np.mean(losses),res[0],res[1],res[2],res[3],res[4],))model.train()metric.reset()return res[0], res[1], res[2], res[3], res[4]

paddlenlp二分类引入评估召回率F1指标 paddle.metric Accuracy相关推荐

  1. 视频|分类模型评估:精确率、召回率、ROC曲线、AUC与R语言生存分析时间依赖性ROC实现

    最近我们被客户要求撰写关于分类模型的研究报告,包括一些图形和统计输出. 本文将帮助您回答以下问题: ROC曲线是什么? 曲线下的面积是多少? 二元分类的决策阈值是多少? 分类模型可接受的 AUC值是多 ...

  2. 图像分类 图像分割的评价指标(混淆矩阵 正确率 精准率 召回率 F1分数 IOU dice系数)

    在图像分类或者图像分割中,为评价模型的预测效果,在训练过程中通常需要比较预测值与真实标签值的差距,即误差. 目录 图像分类过程的评价指标 混淆矩阵 正确率/准确率 精准率 召回率 F1分数 图像分割过 ...

  3. 精确度/召回率/F1值/Micro-F1和Macro-F1的理解

    如下图所示,假设有若干张图片,其中12张是狗的图片其余是猫的图片.现在利用程序去识别狗的图片,结果在识别出的8张图片中有5张是狗的图片,3张是猫的图片(属于误报). 图中,实心小圆代表狗的图片,虚心小 ...

  4. R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵、并使用summary函数基于混淆矩阵输出分类模型评估的其它详细指标(kappa、npv等13个)

    R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵(confusion matrix).并使用summary函数基于混淆矩阵输出分类模型评估的其它详细 ...

  5. [机器学习] 二分类模型评估指标---精确率Precision、召回率Recall、ROC|AUC

    一 为什么要评估模型? 一句话,想找到最有效的模型.模型的应用是循环迭代的过程,只有通过持续调整和调优才能适应在线数据和业务目标. 选定模型时一开始都是假设数据的分布是一定的,然而数据的分布会随着时间 ...

  6. 机器学习笔记-多分类下的召回率和F值

    分类任务中常见的评估指标,包括准确率(Accuracy).精确率(Precision).召回率(Recall)和值.但是在多分类场景中,我们通常也会采用召回率或者F值来作为评价指标. 1.分类评估指标 ...

  7. 机器学习分类问题指标评估内容详解(准确率、精准率、召回率、F1、ROC、AUC等)

    文章目录 前言 一.混淆矩阵(confusion matrix) 二.准确率,精准率,召回率,F1分数 1. 准确率(Accuracy) 2. 精确率(Precision) 3. 召回率(Recall ...

  8. 【数据挖掘】K-NN 分类 ( 简介 | 分类概念 | K-NN 分类实例 | K-NN 分类准确度评估 | K-NN 分类结果评价指标 | 准确率 | 召回率 )

    文章目录 I . K-NN 简介 II . K-NN 分类 III . K-NN 分类实例 IV . K-NN 分类 准确性评估方法 V . 保持法 VI . kkk-交叉确认法 VII . K-NN ...

  9. 机器学习——二分类、多分类的精确率和召回率

    机器学习有很多评估的指标.有了这些指标我们就横向的比较哪些模型的表现更好.我们先从整体上来看看主流的评估指标都有哪些: 分类问题评估指标: 准确率 – Accuracy 精确率(差准率)- Preci ...

最新文章

  1. 深度学习 CNN卷积神经网络 LeNet-5详解
  2. java 打印 排序 数字塔_求助,用循环方法输出以下数字塔
  3. C指针原理(38)-C快速入门
  4. jedis操作set_Jedis对redis的五大类型操作代码详解
  5. Android实现按钮点击效果(第一次点击变色,第二次恢复)
  6. 企业以太坊联盟发布了愿景文件
  7. CreateFile创建文件 writeFile 向文件中写入东西
  8. HDU2203 亲和串【字符串】
  9. Arrays.asList的用法
  10. lightoj 1382 - The Queue(树形dp)
  11. jQuery 2.0.3 源码分析Sizzle引擎 - 编译函数(大篇幅)
  12. 短视频素材:17个视频网站,涨粉必上热门
  13. 清华大学施一公,刚刚发现他的科学网的博客,好博啊
  14. RabbitMQ An unexpected connection driver error occured错误
  15. 杨凌职业技术学院计算机专业宿舍,杨凌职业技术学院宿舍怎么样
  16. MAC maven安装配置
  17. 稀疏表征:稀疏字典构建
  18. 【SLAM编译错误】CMakeFiles/Makefile2:252: recipe for target 'CMakeFiles/stereo_kitti.dir/all' failed
  19. ul和ol的区别以及经验总结
  20. matlab 归一化功率谱,求大神指点如何画归一化功率谱的图像啊

热门文章

  1. 飞客茶馆-常旅客互助社区 - 飞客茶馆旅行网
  2. php接口内session,php4的session功能评述(一)
  3. Scrapy抓取西刺高匿代理ip
  4. (13)UVM 史上最全TLM单向/双向/多向通信介绍
  5. K-means聚类算法代码
  6. 数据库系统从挂科到满分【精华再精华的数据库系统基础理论】3
  7. 计算机辅助物理化学实验 唐典勇课后答案,表面张力测定数据的模型拟合及MATLAB处理.pdf...
  8. 微信小程序开发初学:输入框 - input
  9. 字体设计符号组合多功能微信小程序源码下载支持多流量主模式
  10. 【Cpp】《Effective C++》第一章-让自己习惯C++