随着的机器学习日益重要,许多机器学习包也被人们开发出来,其中,scikit-learn是一种十分强大和广泛使用的python机器学习工具包。下面将叙述scikit-learn中常用的功能:

六大功能

Scikit-learn的基本功能主要被分为六大部分:分类(Classification),回归(Regression),聚类(Clustering),数据降维(Dimensionality reduction),模型选择(Model selection)和数据预处理(Preprocessing)。

Classification

分类是指识别给定对象的所属类别,属于监督学习的范畴,最常见的应用场景包括垃圾邮件检测和图像识别等。目前Scikit-learn已经实现的算法包括:支持向量机(SVM),最近邻,逻辑回归,随机森林,决策树以及多层感知器(MLP)神经网络等等。需要指出的是,由于Scikit-learn本身不支持深度学习,也不支持GPU加速,因此这里对于MLP的实现并不适合于处理大规模问题。

Regression

回归是指预测与给定对象相关联的连续值属性,最常见的应用场景包括预测药物反应和预测股票价格等。目前Scikit-learn已经实现的算法包括:支持向量回归(SVR),脊回归,Lasso回归,弹性网络(Elastic Net),最小角回归(LARS ),贝叶斯回归,以及各种不同的鲁棒回归算法等。可以看到,这里实现的回归算法几乎涵盖了所有开发者的需求范围,而且更重要的是,Scikit-learn还针对每种算法都提供了简单明了的用例参考。

Clustering

聚类是指自动识别具有相似属性的给定对象,并将其分组为集合,属于无监督学习的范畴,最常见的应用场景包括顾客细分和试验结果分组。目前Scikit-learn已经实现的算法包括:K-均值聚类,谱聚类,均值偏移,分层聚类,DBSCAN聚类等。

Dimensionality reduction

数据降维是指使用主成分分析(PCA)、非负矩阵分解(NMF)或特征选择等降维技术来减少要考虑的随机变量的个数,其主要应用场景包括可视化处理和效率提升。

Model selection

模型选择是指对于给定参数和模型的比较、验证和选择,其主要目的是通过参数调整来提升精度。目前Scikit-learn实现的模块包括:格点搜索,交叉验证和各种针对预测误差评估的度量函数。

Preprocessing

数据预处理是指数据的特征提取和归一化,是机器学习过程中的第一个也是最重要的一个环节。这里归一化是指将输入数据转换为具有零均值和单位权方差的新变量,但因为大多数时候都做不到精确等于零,因此会设置一个可接受的范围,一般都要求落在0-1之间。而特征提取是指将文本或图像数据转换为可用于机器学习的数字变量。需要特别注意的是,这里的特征提取与上文在数据降维中提到的特征选择非常不同。特征选择是指通过去除不变、协变或其他统计上不重要的特征量来改进机器学习的一种方法。

总结来说,Scikit-learn实现了一整套用于数据降维,模型选择,特征提取和归一化的完整算法/模块,Scikit-learn针对每个算法和模块都提供了丰富的参考样例和详细的说明文档。

scikit-learn功能大全相关推荐

  1. Scikit Learn: 在python中机器学习

    Warning 警告:有些没能理解的句子,我以自己的理解意译. 翻译自:Scikit Learn:Machine Learning in Python 作者: Fabian Pedregosa, Ga ...

  2. [转载]Scikit Learn: 在python中机器学习

    原址:http://my.oschina.net/u/175377/blog/84420 目录[-] Scikit Learn: 在python中机器学习 载入示例数据 一个改变数据集大小的示例:数码 ...

  3. 机器学习与Scikit Learn学习库

    摘要: 本文介绍机器学习相关的学习库Scikit Learn,包含其安装及具体识别手写体数字案例,适合机器学习初学者入门Scikit Learn. 在我科研的时候,机器学习(ML)是计算机科学领域中最 ...

  4. Spring Boot最新版集成邮件发送功能大全

    Spring Boot最新版集成邮件发送功能大全 前言 一.开启SMTP服务并获取授权码 二.创建Spring Boot项目 1.配置邮箱基本信息: 2.简单邮件发送: 3.发送带附件的邮件: 5.使 ...

  5. Windows 11快捷键功能大全 28个Windows 11快捷键功能介绍

    Windows 11快捷键功能大全 28个Windows 11快捷键功能介绍 1. Win+A 打开快速设置面板 2. Win+B 快速跳转系统托盘 3. Win+C 打开Microsoft Team ...

  6. python笔迹识别_python_基于Scikit learn库中KNN,SVM算法的笔迹识别

    之前我们用自己写KNN算法[网址]识别了MNIST手写识别数据 [数据下载地址] 这里介绍,如何运用Scikit learn库中的KNN,SVM算法进行笔迹识别. 数据说明: 数据共有785列,第一列 ...

  7. 华为手机日历的功能大全,赶快来试试

    华为手机上都会自带日历,方便人们查看日期和节假日,但是除了这个,你们还知道什么关于华为手机日历的隐藏功能吗?华为手机日历的功能大全,相信大多数人是不清楚的,不如看看这篇文章,get一些关于手机日历的隐 ...

  8. 用户登录查全表好还是用用户名好_白杨SEO:长尾关键词挖掘工具哪个好?5118站长工具功能大全看这...

    前言:这是白杨SEO公众号原创第175篇.经常有人问我关键词挖掘哪个工具好,怎么监控网站排名,怎么找出用户需求词等,所以今天就推荐一个SEO和新媒体从业者必备工具-5118站长工具. (上周在我的付费 ...

  9. 苹果计算机手机号隐藏功能,苹果手机隐藏功能大全

    苹果手机隐藏功能大全 其实 iPhone 本身有很多功能,不过却隐藏着在当中.下面是jy135小编收集整理的苹果手机隐藏功能大全,欢迎阅读. 首先来看看iPhone手机屏幕上操作的隐藏功能吧: 1. ...

  10. 我的世界服务器物品解绑,我的世界中国版里面各种东西的用法 物品用处功能大全...

    标签: 建筑 今天小编给大家带来我的世界中国版里面各种东西的用法,不少刚入坑的小伙伴对我的世界中国版里面的材料并不是很了解,一起去看看今天的物品用处功能大全吧~ 我的世界中国版里面各种东西的用法: N ...

最新文章

  1. MATLAB基础操作--命令窗口
  2. 建博客的原因。。。。
  3. Codeforces Round#433 简要题解
  4. MongoDB自动删除过期数据--TTL索引
  5. python基础-引用赋值与按值赋值
  6. oracle 自定义函数
  7. Sentinel(十六)之AHAS Sentinel 控制台
  8. redis压缩列表ziplist的连锁扩容
  9. Android开发环境搭建(Android Studio安装)
  10. 遥感影像单波段辐射定标处理
  11. 机器人编程和python的区别_乐高机器人编程和计算机编程的区别
  12. Python监听RabbitMq ready数量
  13. C语言高级应用---操作linux下V4L2摄像头应用程序
  14. 自动阅读教程--五条app
  15. 网络工程专业就业方向
  16. hdu 1789题解
  17. 时间片轮转算法(c++)
  18. 2022爱分析・消费品零售数字化厂商全景报告 | 爱分析报告
  19. 【Android开发】旧书交易系统(OBT),安卓购物软件开发,安卓聊天软件开发,数据库应用,安卓直连mysql数据库
  20. python解包操作_python解包如何使用?

热门文章

  1. 计算机硬件知识调查表,计算机硬件的调研报告(精).docx
  2. Echarts折线图动态获取数据实例(附java后台代码)
  3. 2020.07-Study_update.5
  4. Mina MEID/GSM Activator 1.0 三网信号激活,支持12.5.3~14.7
  5. C++ Learning (Next)
  6. 嵌入式c c++开发笔记(opencv图片,视频的翻转,截取,旋转)
  7. 游戏策划入门教程(前言)
  8. 关于kdb_trap_immed函数中$1号中断的详解(来自liujian)
  9. outlook邮箱如何群发邮件?outlook群发邮件如何相互之间看不到?
  10. html 在线播放器,实现简易html视频播放器的方法