sklearn学习笔记之metrics
本文基于以下链接:sklearn中文文档,sklearn官网
模型选择Interface
make_scorer
sklearn.metrics.make_scorer(score_func, *, greater_is_better=True, needs_proba=False, needs_threshold=False, **kwargs)
构建一个计分器,用于模型进行参数选择
分类评估准则:Classification metrics
accuracy_score
sklearn.metrics.accuracy_score(y_true, y_pred, *, normalize=True, sample_weight=None)
分类准确性分数
在多分类中,该函数计算子集准确性:一个样本中预测的标签集必须与y中对应的标签集完全匹配。
参数
- y_true:1维 array,label indicator array(标签指示数组),sparse matrix(稀疏矩阵)
- y_pred:与上一样
y_true就是y_test,y_pred就是你的模型根据x_test预测出的结果 - normalize:bool,默认为True
- True时返回准确率,False为准确的个数
- sample_weight:array-like of shape(n_samples),默认为None
- 设置某些权重
note
在二分类和多分类中,这个方法相当于jaccard_score方法
示例
>>> from sklearn.metrics import accuracy_score
>>> y_pred = [0, 2, 1, 3]
>>> y_true = [0, 1, 2, 3]
>>> accuracy_score(y_true, y_pred)
0.5
>>> accuracy_score(y_true, y_pred, normalize=False)
2
auc
sklearn.metrics.auc(x, y)
官方链接
使用梯形法则计算AUC
示例
>>> import numpy as np
>>> from sklearn import metrics
>>> y = np.array([1, 1, 2, 2])
>>> pred = np.array([0.1, 0.4, 0.35, 0.8])
>>> fpr, tpr, thresholds = metrics.roc_curve(y, pred, pos_label=2)
>>> metrics.auc(fpr, tpr)
0.75
classification_report
sklearn.metrics.classification_report(y_true, y_pred, *, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False, zero_division='warn')
构建文本报告,显示主要的分类度量
参数
- y_true,y_pred:这两个参数不再赘述
- labels:array,shape = [n_labels]
- sample_weight:array,其shape为n_samples,default = None
- 不为None时,表示设置sample的权重
- digits:int
- 只有out_dict为False时才有效,设置输出值的小数点位数
- out_dict:bool,default=False
- 若是True,将输出转为字典类型
- zero_division:‘warn’,0 or 1,默认为’warn’
- 设置值的返回。
示例
回归评估准则:Regression metrics
mean_absolute_error
sklearn.metrics.mean_absolute_error(y_true, y_pred, *, sample_weight=None, multioutput='uniform_average')
MAE(y,y^)=1n∑i=1n∣yi−yi^∣MAE(y,\hat{y}) = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y_i}|MAE(y,y^)=n1i=1∑n∣yi−yi^∣
示例
>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_absolute_error(y_true, y_pred)
0.75
#等价于以下
>>>y_true,y_pred = np.array(y_true),np.array(y_pred)
>>>np.sum(np.absolute(y_true-y_pred))/len(y_true)
sklearn学习笔记之metrics相关推荐
- SKlearn学习笔记——XGBoost
SKlearn学习笔记--XGBoost 1. 概述 1.1 xgboost库与XGB的sklearn API 1.2 XGBoost的三大板块 2. 梯度提升树 2.1 提升集成算法:重要参数 n_ ...
- python sklearn学习笔记大全(常见代码速查)
skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...
- sklearn学习笔记
1.监督学习 1.1.广义线性模型 1.1.1.普通最小二乘法 class sklearn.linear_model.LinearRegression(fit_intercept=True, norm ...
- Sklearn学习笔记3 model_selection模块
3 Model selection and evaluation 1 sklearn.model_selection: Model Selection 1.1 Splitter Classes(分组) ...
- DataWhale sklearn学习笔记(一)
线性回归 数据生成: 生成数据的思路是设定一个二维的函数(维度高了没办法在平面上画出来),根据这个函数生成一些离散的数据点,对每个数据点我们可以适当的加一点波动,也就是噪声,最后看看我们算法的拟合或者 ...
- sklearn学习笔记之简单线性回归
简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误 ...
- python之sklearn学习笔记
sklearn介绍 scikit-learn是数据挖掘与分析的简单而有效的工具. 依赖于NumPy, SciPy和matplotlib. 它主要包含以下几部分内容: 从功能来分: classifica ...
- sklearn学习笔记4:聚类算法 K-Means
聚类算法在sklearn中有两种表现形式,一种是类(和学过的分类算法及数据预处理方法都一样),需要实例化,训练并使用接口和属性来调用结果.另一种是函数,只需要输入特征矩阵和超参数,即可返回聚类的结果和 ...
- sklearn学习笔记(一)——数据预处理 sklearn.preprocessing
python sklearn 更多 个人分类: Python 数据处理 sklearn 数据预处理 sklearn.preprocessing 查看全文 http://www.taodudu.cc/n ...
- sklearn学习笔记(一):数据预处理
文章目录 1.缺失值处理 2. 数据的规范化 2.1 缩放规范化 2.1.1 最大值-最小值缩放 2.1.2 最大绝对值缩放 2.1.3 自定义缩放区间 2.2 标椎化 2.3 范数规范化 3. 非线 ...
最新文章
- 2022-2028年全球与中国漂白吸水棉市场研究及前瞻分析报告
- OpenCV中的内存泄漏检测
- LeetCode 140. 单词拆分 II
- C API向MySQL插入批量数据的快速方法——关于mysql_autocommit
- LDD3源码分析之阻塞型I/O
- Angular动态表单生成(八)
- いちがつ(2017/1)
- (转)iReaper for wp7正式发布
- 表示数值的字符串(有限状态自动机与搜索)
- 2013 ACM区域赛长沙 K Pocket Cube hdu 4801
- vue如何把数组转为json数组_vue.js,_vuejs Ajax取得一个数据json数组,vue.js - phpStudy...
- linux设置主机路由的接口,linux – 添加到特定主机的路由会发出特定的接口
- c#扩展方法奇思妙用高级篇八:Type类扩展
- java excel 操作方式_java excel兩種操作方式
- 金算盘加密狗维护信息
- 重启iis的命令是什么?三种简单的重启方式
- 【BP回归预测】鲸鱼算法优化BP神经网络回归预测(多输入单输出)【含Matlab源码 1554期】
- Python基础知识-字典dictionary
- huggingFace 中文模型实战——中文文本分类
- 美容院共享系统开发|共享模式具体应该怎么去做?
热门文章
- 《浪潮之巅》读书笔记——第6章 Microsoft
- Effects on PV3D
- Vert.x 之 HelloWorld
- Windows 创建 Redis 和 zookeeper 系统服务
- Codeforces Round #309 (Div. 1) A(组合数学)
- LinkedHashMap 底层分析
- Python基础---时间模块 (二)
- 图说单播,组播,广播,选播和地域播
- Bootstrap 更改Navbar默认样式
- some blogs for xna 3d game for windows phone!