Scikit-learn的功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。接下来通过一些例子来解释六类功能的主要作用。

1.分类

识别给定对象的类型,分类属于监督学习的范畴,最常见的应用场景包括图像识别和垃圾邮件检测。目前Scikit-learn已经实现的算法包括:支持向量机(SVM),逻辑回归,随机森林,最近邻,决策树等。

例1:猫狗识别

例2:中文垃圾邮件分类

2.回归

是指预测与给定对象相关联的连续值属性,最常见的应用场景包括预测股票价格和预测药物反应等。目前Scikit-learn 已经实现的算法包括:支持向量回归(SVR),弹性网络(Elastic Net),最小角回归(LARS ),贝叶斯回归等。

例3:特斯拉近10年股票价格分析预测

3.聚类

是指自动识别具有相似属性的对象,并将其分组为多个集合,属于无监督学习的范畴,最常见的应用场景包括顾客细分和试验结果分组。目前Scikit-learn已经实现的算法包括:K-均值聚类,谱聚类,均值偏移,分层聚类等。

例4:信用卡客户划分

4.数据降维

是指使用主成分分析(PCA)、非负矩阵分解(NMF)或特征选择等降维技术来减少要考虑的随机变量的个数,其主要应用场景包括可视化处理和效率提升。

例5:PCA数据降维

5.模型选择

是指对于给定参数和模型的比较、验证和选择,其主要目的是通过参数调整来提升精度。目前Scikit-learn实现的模块包括:格点搜索,交叉验证等。

例6:模型选择(评估方法)

6.数据预处理

是指数据的特征提取和归一化,是机器学习过程中的第一个也是最重要的一个环节。这里归一化是指将输入数据转换为具有零均值和单位权方差的新变量,但因为大多数时候都做不到精确等于零,因此会设置一个可接受的范围,一般都要求落在0-1之间。而特征提取是指将文本或图像数据转换为可用于机器学习的数字变量。

例7:恶意代码静态特征提取

Scikit-learn的六大功能相关推荐

  1. Scikit Learn: 在python中机器学习

    Warning 警告:有些没能理解的句子,我以自己的理解意译. 翻译自:Scikit Learn:Machine Learning in Python 作者: Fabian Pedregosa, Ga ...

  2. SharePoint 2010 产品六大功能模块

    对IT专业人员来说,新的产品,意味着新的功能,IT生产力提高的契机,更加关心如何使用新产品投入更少,产出更多.在本文中我们通过对SharePoint 2010产品的功能介绍.管理中心新功能介绍.系统新 ...

  3. [转载]Scikit Learn: 在python中机器学习

    原址:http://my.oschina.net/u/175377/blog/84420 目录[-] Scikit Learn: 在python中机器学习 载入示例数据 一个改变数据集大小的示例:数码 ...

  4. 机器学习与Scikit Learn学习库

    摘要: 本文介绍机器学习相关的学习库Scikit Learn,包含其安装及具体识别手写体数字案例,适合机器学习初学者入门Scikit Learn. 在我科研的时候,机器学习(ML)是计算机科学领域中最 ...

  5. python笔迹识别_python_基于Scikit learn库中KNN,SVM算法的笔迹识别

    之前我们用自己写KNN算法[网址]识别了MNIST手写识别数据 [数据下载地址] 这里介绍,如何运用Scikit learn库中的KNN,SVM算法进行笔迹识别. 数据说明: 数据共有785列,第一列 ...

  6. oracle spatial 论文,oraclespatial在实际应用中的六大功能体现

    oraclespatial在实际应用中的六大功能体现 Oracle Spatial在实际的应用中不但具有传统的GIS所有相关特性,而且Oracle Spatial还具有关系数据库的相关特性,就是这些特 ...

  7. 珠海先达MES系统六大功能解决电子组装行业可视化问题

    电子组装行业的发展背景: 在日益激烈的市场环境中,降低成本,加快交付周期,提高产品质量已经成为了制造业发展的重要目标.企业关注的是产品的生产周期,客户关注的是产品的质量.如何在企业和消费者达成平衡,保 ...

  8. 全球化同步时代,电子名片六大功能助你销售

    数字信息时代,给人们带来最大的便利就是移动通讯的快速性.多样性.兼容性.以前一部手机的通讯方式就只有两种:通话和短信,也就是声音和文字.而随着现代互联网进入4G时代(现在已经进入5G时代),移动终端手 ...

  9. 【scikit-learn】如何用Python和SciKit Learn 0.18实现神经网络

    本教程的代码和数据来自于 Springboard 的博客教程.本文的作者为 Jose Portilla,他是网络教育平台 Udemy 一门数据科学类课程的讲师. GitHub 链接:https://g ...

  10. python scikit learn 关闭开源_scikit learn 里没有神经网络?

    本教程的代码和数据来自于 Springboard 的博客教程,希望能为你提供帮助.作者为 Jose Portilla,他是网络教育平台 Udemy 一门数据科学类课程的讲师. GitHub 链接:ht ...

最新文章

  1. 水平分库分表的关键步骤和技术难点,分库分表的几种常见玩法及如何解决跨库查询等问题...
  2. 数据结构数组计算机中的应用,2018考研计算机:数据结构数组和广义表复习重点...
  3. jsonp跨域原理_Rust 搭建可跨域访问服务器JsonP(一)
  4. day05 数据类型
  5. Java 数组操作
  6. [ACCESS]档案数字化加工录入系统使用说明(干部职工退休档案)
  7. ue4 rootmotion动画、模型导入使用(注)
  8. python中scrapy框架爬取携程景点数据
  9. 学计算机的数学一定要好吗,学计算机一定要数学好吗?
  10. Python 计算父亲节和母亲节
  11. 冷山的博客思听书摘索引页
  12. 邮政挂号信终于可以网上查询了
  13. 介绍下微信刷票被禁了怎么办及微信拉票怎么人工买票的方法
  14. 3D游戏里的男女性角色模型是这样建模出来的
  15. MSDC 4.3 接口规范(18)
  16. Spring Security 退出登录(7)
  17. 电脑用js调用QQ客服聊天 阿星小栈
  18. 使用GEE或PIE下载Landsat8影像
  19. 发邮件怎么把附件内容直接显示_一年一度调剂忙,且看招生老师怎么说
  20. luoguP2231 [HNOI2002]跳蚤

热门文章

  1. 过完双11,我去闲鱼当二道贩子
  2. NoSQL和MemeryCache的出现意味着传统数据库使用方式的变革吗?(arvin-推荐--看评论)
  3. jsapi设计_Sketch插件如何架构
  4. 在Visual Paradigm如何创建电路图?
  5. 京东深圳手Q微信事业部测试工程师面试总结
  6. cloudreve 开源私有网盘(带离线下载)
  7. 金融 数据库 mysql_MySQL 和 PostgreSQL 哪个更适合做金融数据库
  8. 想不到 HR 都在 GitHub 捞人!五位开源大牛分享成长经历(文末福利)
  9. 飞凌单片机解密_GX28E01单片机解密
  10. 关于递归删除链表结点时为什么不会出现断链问题