1. 简介

scikit-learn是基于Python语言的机器学习库

2. 特点

简单高效的数据分析工具
可在多种环境中重复使用
建立在Numpy，Scipy以及matplotlib等数据科学库之上
开源且可商用的-基于BSD许可

3. 安装

pip方法：

pip install -U scikit-learn

conda方法：

conda install scikit-learn

3.1 注意事项

升级或卸载使用 Anaconda 安装的 scikit-learn，不应该使用 pip 命令！
应该用:

升级 scikit-learn:

conda update scikit-learn

卸载 scikit-learn:

conda remove scikit-learn

使用 pip install -U scikit-learn 升级或 pip uninstall scikit-learn 卸载可能无法正确删除 conda 命令安装的文件

pip 升级和卸载操作仅适用于通过 pip install 安装的软件包

4. 机器学习要做的事

一般来说，机器学习就是用 n 个样本数据训练模型，然后尝试预测未知数据的属性

如果每个样本是多个属性的数据（比如说是一个多维记录），就说它有许多“属性”，或称 features(特征)

5. 机器学习问题的分类

我们可以将学习问题分为两大类:

监督学习
无监督学习

监督学习
其中数据带有一个附加属性，即我们想要预测的结果值，这个问题可以是:

分类 :
样本属于两个或更多个类，我们想从已经标记的数据中学习如何预测未标记数据的类别。分类问题的一个示例是手写数字识别，其目的是将每个输入向量分配给有限数目的离散类别之一。我们通常把分类视作监督学习的一个离散形式（区别于连续形式），从有限的类别中，给每个样本贴上正确的标签。

回归 :
如果期望的输出由一个或多个连续变量组成，则该任务称为回归。回归问题的一个示例是预测鲑鱼的长度是其年龄和体重的函数。

无监督学习
其中训练数据由没有任何相应目标值的一组输入向量x组成。这种问题的目标可能是在数据中发现彼此类似的示例所聚成的组，这种问题称为聚类 , 或者，确定输入空间内的数据分布，称为密度估计，又或从高维数据投影数据空间缩小到二维或三维以进行可视化

6. 数据集

数据集可分为：

训练集
测试集

机器学习是从数据的属性中学习，并将它们应用到新数据的过程。这就是为什么机器学习中评估算法的普遍实践是把数据分割成训练集（我们从中学习数据的属性）和测试集（我们测试这些性质）

7. 加载sklearn自带的数据集

cikit-learn 提供了一些标准数据集，例如用于分类的 iris 和 digits 数据集和波士顿房价回归数据集

from sklearn import datasetsiris = datasets.load_iris()
digits = datasets.load_digits()

机器学习sklearn | sklearn简介相关推荐

Sklearn 损失函数如何应用到_菜鸟学机器学习，Sklearn库主要模块功能简介
导读作为一名数据分析师,当我初次接触数据分析三剑客(numpy.pandas.matplotlib)时,感觉每个库的功能都很多很杂,所以在差不多理清了各模块功能后便相继推出了各自教程(文末附链接): ...
菜鸟学机器学习，Sklearn库主要模块功能简介
导读作为一名数据分析师,当我初次接触数据分析三剑客(numpy.pandas.matplotlib)时,感觉每个库的功能都很多很杂,所以在差不多理清了各模块功能后便相继推出了各自教程(文末附链接): ...
Python sklearn机器学习各种评价指标——Sklearn.metrics简介及应用示例
Python Sklearn.metrics 简介及应用示例利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库. 无论利用机器学习算法进行 ...
python 机器学习_基于 Python 语言的机器学习工具Sklearn
本篇介绍了Sklearn机器学习基础,从Sklearn的简介,模块以及与tensorflow的优劣势对比来了解基于Python语言的机器学习工具. 01.Sklearn简介 sklearn(sc ...
机器学习之sklearn使用下载MNIST数据集进行分类识别
机器学习之sklearn使用下载MNIST数据集进行分类识别一.MNIST数据集 1.MNIST数据集简介 2.获取MNIST数据集二.训练一个二分类器 1.随机梯度下降(SGD)分类器 2.分类 ...
python的metrics_Python Sklearn.metrics 简介及应用示例
Python Sklearn.metrics 简介及应用示例利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库. 无论利用机器学习算法进行 ...
机器学习之sklearn基础教程！
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货作者:李祖贤,深圳大学,Datawhale高校群成员本次分享是基于sc ...
数据挖掘原理与算法：机器学习-＞{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}
数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...
ML之ME/LF：基于不同机器学习框架(sklearn/TF)下算法的模型评估指标(损失函数)代码实现及其函数(Scoring/metrics)代码实现(仅代码)
ML之ME/LF:基于不同机器学习框架(sklearn/TF)下算法的模型评估指标(损失函数)代码实现及其函数(Scoring/metrics)代码实现(仅代码) 目录单个评价指标各种框架下实现 1 ...

机器学习sklearn | sklearn简介