本文基于以下链接:sklearn中文文档,sklearn官网

模型选择Interface

make_scorer

sklearn.metrics.make_scorer(score_func, *, greater_is_better=True, needs_proba=False, needs_threshold=False, **kwargs)

构建一个计分器,用于模型进行参数选择

分类评估准则:Classification metrics

accuracy_score

sklearn.metrics.accuracy_score(y_true, y_pred, *, normalize=True, sample_weight=None)

分类准确性分数
在多分类中,该函数计算子集准确性:一个样本中预测的标签集必须与y中对应的标签集完全匹配。

参数

  • y_true:1维 array,label indicator array(标签指示数组),sparse matrix(稀疏矩阵)
  • y_pred:与上一样
    y_true就是y_test,y_pred就是你的模型根据x_test预测出的结果
  • normalize:bool,默认为True
    • True时返回准确率,False为准确的个数
  • sample_weight:array-like of shape(n_samples),默认为None
    • 设置某些权重

note
在二分类和多分类中,这个方法相当于jaccard_score方法

示例

>>> from sklearn.metrics import accuracy_score
>>> y_pred = [0, 2, 1, 3]
>>> y_true = [0, 1, 2, 3]
>>> accuracy_score(y_true, y_pred)
0.5
>>> accuracy_score(y_true, y_pred, normalize=False)
2
auc

sklearn.metrics.auc(x, y)
官方链接

使用梯形法则计算AUC

示例

>>> import numpy as np
>>> from sklearn import metrics
>>> y = np.array([1, 1, 2, 2])
>>> pred = np.array([0.1, 0.4, 0.35, 0.8])
>>> fpr, tpr, thresholds = metrics.roc_curve(y, pred, pos_label=2)
>>> metrics.auc(fpr, tpr)
0.75
classification_report

sklearn.metrics.classification_report(y_true, y_pred, *, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False, zero_division='warn')

构建文本报告,显示主要的分类度量

参数

  • y_true,y_pred:这两个参数不再赘述
  • labels:array,shape = [n_labels]
  • sample_weight:array,其shape为n_samples,default = None
    • 不为None时,表示设置sample的权重
  • digits:int
    • 只有out_dict为False时才有效,设置输出值的小数点位数
  • out_dict:bool,default=False
    • 若是True,将输出转为字典类型
  • zero_division:‘warn’,0 or 1,默认为’warn’
    • 设置值的返回。

示例

回归评估准则:Regression metrics

mean_absolute_error

sklearn.metrics.mean_absolute_error(y_true, y_pred, *, sample_weight=None, multioutput='uniform_average')

MAE(y,y^)=1n∑i=1n∣yi−yi^∣MAE(y,\hat{y}) = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y_i}|MAE(y,y^​)=n1​i=1∑n​∣yi​−yi​^​∣

示例

>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_absolute_error(y_true, y_pred)
0.75
#等价于以下
>>>y_true,y_pred = np.array(y_true),np.array(y_pred)
>>>np.sum(np.absolute(y_true-y_pred))/len(y_true)

sklearn学习笔记之metrics相关推荐

  1. SKlearn学习笔记——XGBoost

    SKlearn学习笔记--XGBoost 1. 概述 1.1 xgboost库与XGB的sklearn API 1.2 XGBoost的三大板块 2. 梯度提升树 2.1 提升集成算法:重要参数 n_ ...

  2. python sklearn学习笔记大全(常见代码速查)

    skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...

  3. sklearn学习笔记

    1.监督学习 1.1.广义线性模型 1.1.1.普通最小二乘法 class sklearn.linear_model.LinearRegression(fit_intercept=True, norm ...

  4. Sklearn学习笔记3 model_selection模块

    3 Model selection and evaluation 1 sklearn.model_selection: Model Selection 1.1 Splitter Classes(分组) ...

  5. DataWhale sklearn学习笔记(一)

    线性回归 数据生成: 生成数据的思路是设定一个二维的函数(维度高了没办法在平面上画出来),根据这个函数生成一些离散的数据点,对每个数据点我们可以适当的加一点波动,也就是噪声,最后看看我们算法的拟合或者 ...

  6. sklearn学习笔记之简单线性回归

    简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误 ...

  7. python之sklearn学习笔记

    sklearn介绍 scikit-learn是数据挖掘与分析的简单而有效的工具. 依赖于NumPy, SciPy和matplotlib. 它主要包含以下几部分内容: 从功能来分: classifica ...

  8. sklearn学习笔记4:聚类算法 K-Means

    聚类算法在sklearn中有两种表现形式,一种是类(和学过的分类算法及数据预处理方法都一样),需要实例化,训练并使用接口和属性来调用结果.另一种是函数,只需要输入特征矩阵和超参数,即可返回聚类的结果和 ...

  9. sklearn学习笔记(一)——数据预处理 sklearn.preprocessing

    python sklearn 更多 个人分类: Python 数据处理 sklearn 数据预处理 sklearn.preprocessing 查看全文 http://www.taodudu.cc/n ...

  10. sklearn学习笔记(一):数据预处理

    文章目录 1.缺失值处理 2. 数据的规范化 2.1 缩放规范化 2.1.1 最大值-最小值缩放 2.1.2 最大绝对值缩放 2.1.3 自定义缩放区间 2.2 标椎化 2.3 范数规范化 3. 非线 ...

最新文章

  1. 2022-2028年全球与中国漂白吸水棉市场研究及前瞻分析报告
  2. OpenCV中的内存泄漏检测
  3. LeetCode 140. 单词拆分 II
  4. C API向MySQL插入批量数据的快速方法——关于mysql_autocommit
  5. LDD3源码分析之阻塞型I/O
  6. Angular动态表单生成(八)
  7. いちがつ(2017/1)
  8. (转)iReaper for wp7正式发布
  9. 表示数值的字符串(有限状态自动机与搜索)
  10. 2013 ACM区域赛长沙 K Pocket Cube hdu 4801
  11. vue如何把数组转为json数组_vue.js,_vuejs Ajax取得一个数据json数组,vue.js - phpStudy...
  12. linux设置主机路由的接口,linux – 添加到特定主机的路由会发出特定的接口
  13. c#扩展方法奇思妙用高级篇八:Type类扩展
  14. java excel 操作方式_java excel兩種操作方式
  15. 金算盘加密狗维护信息
  16. 重启iis的命令是什么?三种简单的重启方式
  17. 【BP回归预测】鲸鱼算法优化BP神经网络回归预测(多输入单输出)【含Matlab源码 1554期】
  18. Python基础知识-字典dictionary
  19. huggingFace 中文模型实战——中文文本分类
  20. 美容院共享系统开发|共享模式具体应该怎么去做?

热门文章

  1. 《浪潮之巅》读书笔记——第6章 Microsoft
  2. Effects on PV3D
  3. Vert.x 之 HelloWorld
  4. Windows 创建 Redis 和 zookeeper 系统服务
  5. Codeforces Round #309 (Div. 1) A(组合数学)
  6. LinkedHashMap 底层分析
  7. Python基础---时间模块 (二)
  8. 图说单播,组播,广播,选播和地域播
  9. Bootstrap 更改Navbar默认样式
  10. some blogs for xna 3d game for windows phone!