文章来源:https://blog.csdn.net/algorithmPro/article/details/103045824


Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具。它建立在 NumPy, SciPy, Pandas 和 Matplotlib 之上,里面的 API 的设计非常好,所有对象的接口简单,很适合新手上路。

在 Sklearn 里面有六大任务模块:分别是分类、回归、聚类、降维、模型选择和预处理,如下图从其官网的截屏。

要使用上述六大模块的方法,可以用以下的伪代码,注意 import 后面我用的都是一些通用名称,如 SomeClassifier, SomeRegressor, SomeModel,具体化的名称由具体问题而定,比如

  • SomeClassifier = RandomForestClassifier

  • SomeRegressor = LinearRegression

  • SomeModel = KMeans, PCA

  • SomeModel = GridSearchCV, OneHotEncoder

上面具体化的例子分别是随机森林分类器、线性回归器、K 均值聚类、主成分分析、网格追踪法、独热编码。

1.分类 (Classification)

  1. from sklearn import SomeClassifier

  2. from sklearn.linear_model import SomeClassifier

  3. from sklearn.ensemble import SomeClassifier

2.回归 (Regression)

  1. from sklearn import SomeRegressor

  2. from sklearn.linear_model import SomeRegressor

  3. from sklearn.ensemble import SomeRegressor

3.聚类 (Clustering)

from sklearn.cluster import SomeModel

4.降维 (Dimensionality Reduction)

from sklearn.decomposition import SomeModel

5.模型选择 (Model Selection)

from sklearn.model_selection import SomeModel

6.预处理 (Preprocessing)

from sklearn.preprocessing import SomeModel

SomeClassifier, SomeRegressor, SomeModel 其实都叫做估计器 (estimator),就像 Python 里「万物皆对象」那样,Sklearn 里「万物皆估计器」。

此外,Sklearn 里面还有很多自带数据集供,引入它们的伪代码如下。

7.数据集 (Dataset)

from sklearn.datasets import SomeData

Python:Sklearn概述相关推荐

  1. 大数据技术技能分析大赛——第一章 python数据分析概述

    目标:掌握python,进行数据处理.统计分析.回归建模和数据可视化. 教材:<大数据分析务实初级教程(python)## 标题> 第一章 python数据分析概述 1.数据分析概述 1 ...

  2. Python: sklearn库——数据预处理

    Python: sklearn库 -- 数据预处理 数据集转换之预处理数据:       将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化.       原因:数据集的标准化(服从均 ...

  3. Python+sklearn随机森林算法使用入门

    随机森林是一种集成学习方法,基本思想是把几棵不同参数的决策树(参考:Python+sklearn决策树算法使用入门)打包到一起,每棵决策树单独进行预测,然后计算所有决策树预测结果的平均值(适用于回归分 ...

  4. Python+sklearn使用朴素贝叶斯算法识别中文垃圾邮件

    总体思路与步骤: 1.从电子邮箱中收集垃圾和非垃圾邮件训练集. 2.读取全部训练集,删除其中的干扰字符,例如[]*..,等等,然后分词,删除长度为1的单个字. 3.统计全部训练集中词语的出现次数,截取 ...

  5. Python+sklearn使用支持向量机算法实现数字图片分类

    关于支持向量机的理论知识,大家可以查阅机器学习之类的书籍或网上资源,本文主要介绍如何使用Python扩展库sklearn中的支持向量机实现数字图片分类. 1.首先编写代码生成一定数量的含有数字的图片 ...

  6. KNN分类算法原理与Python+sklearn实现根据身高和体重对体型分类

    KNN算法是k-Nearest Neighbor Classification的简称,也就是k近邻分类算法.基本思路是在特征空间中查找k个最相似或者距离最近的样本,然后根据k个最相似的样本对未知样本进 ...

  7. Python+sklearn使用线性回归算法预测儿童身高

    问题描述:一个人的身高除了随年龄变大而增长之外,在一定程度上还受到遗传和饮食以及其他因素的影响,本文代码中假定受年龄.性别.父母身高.祖父母身高和外祖父母身高共同影响,并假定大致符合线性关系. imp ...

  8. [Python+sklearn] 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split()

    Python - sklearn 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split() 功能: 将数组或矩阵拆分为随机的训练子集和测试子集 ...

  9. [Python+sklearn] 计算混淆矩阵 confusion_matrix()函数

    python sklearn 计算混淆矩阵 confusion_matrix()函数 参考sklearn官方文档:sklearn.metrics.confusion_matrix. 功能: 计算混淆矩 ...

  10. [转载] 《python程序设计应用教程》第一章 python语言概述

    参考链接: Python语言的优势和应用 第一章 python语言概述 1.1 python语言简介 ① 众多的开源的科学计算软件包都提供了python的调用接口,例如:计算机视觉库OpenCV.三维 ...

最新文章

  1. 专为SaaS而生的PaaS平台!
  2. HDU-1128 Self Numbers 筛选
  3. 5800对于存储卡密码设置问题
  4. vba搜索java里面的sql_在EXCEL中使用SQL语句查询集锦-持续更新中,敬请关注
  5. 文件上传获取file的全路径名_Java中的File类与I/O流
  6. Web开发人员有用的代码比较工具
  7. 2_7 FlyweightMode 享元模式
  8. spring 构造函数注入_Spring构造函数依赖注入示例
  9. python中的[-1]、[:-1]、[::-1]、[n::-1]
  10. 如何访问静态成员php,php – 如何访问类的静态成员?
  11. 药业计算机系统专项内审检查表,2017年最新医疗器械内审检查表 分部门 已填写...
  12. C++:求数字i以后的n个素数
  13. matlab 自动交易系统设计2
  14. LM358恒流恒压原理
  15. InputBox函数用法小结
  16. contents属性
  17. 番茄炖牛腩做法,味美汤浓开胃爽口,牛腩入口即化,太下饭!
  18. 计算机科学与技术0775,0775 计算机科学与技术学硕专业介绍
  19. scrapy爬虫1--基础设置篇
  20. Android双卡终端默认SIM卡选择流程

热门文章

  1. 移动web——touch事件介绍
  2. DroidPlugin插件化开发
  3. [Leedcode][JAVA][第85题][第221题][最大正方形][动态规划]
  4. raid5需要几块硬盘_Raid5磁盘阵列数据恢复思路分析--附真实案例
  5. python中文编程教学_中谷python中文视频教程(全38集)
  6. java知识体系 servlet_03-Servlet 体系结构知识梳理
  7. python read()为什么返回少一个字符_python-熊猫read_excel(sheet name = None)返回字符串字典,而不是数据帧?...
  8. php仿微信上传图片压缩,PHP仿微信多图片预览上传实例代码
  9. linux 管道文件上机总结,[转载]LINUX 管道 fifo 等总结
  10. python随机划分数据集_Python之机器学习-sklearn生成随机数据