scikit-learn是python进行数据挖掘与分析的重要而有效的工具,学习scikit-learn最重要的资料来源就是它的官网:

scikit-learn: machine learning in Python

一进官网就能看到它的6大功能:

classification

Regression

Clustering

Dimensionality reduction

Model selection

Preprocessing

它的API模块包括:

sklearn.base: Base classes and utility function

sklearn.cluster: Clustering

sklearn.cluster.bicluster: Biclustering

sklearn.covariance: Covariance Estimators

sklearn.model_selection: Model Selection

sklearn.datasets: Datasets

sklearn.decomposition: Matrix Decomposition

sklearn.dummy: Dummy estimators

sklearn.ensemble: Ensemble Methods

sklearn.exceptions: Exceptions and warnings

sklearn.feature_extraction: Feature Extraction

sklearn.feature_selection: Feature Selection

sklearn.gaussian_process: Gaussian Processes

sklearn.isotonic: Isotonic regression

sklearn.kernel_approximation: Kernel Approximation

sklearn.kernel_ridge: Kernel Ridge Regression

sklearn.discriminant_analysis: Discriminant Analysis

sklearn.linear_model: Generalized Linear Models

sklearn.manifold: Manifold Learning

sklearn.metrics: Metrics

sklearn.mixture: Gaussian Mixture Models

sklearn.multiclass: Multiclass and multilabel classification

sklearn.multioutput: Multioutput regression and classification

sklearn.naive_bayes: Naive Bayes

sklearn.neighbors: Nearest Neighbors

sklearn.neural_network: Neural network models

sklearn.calibration: Probability Calibration

sklearn.cross_decomposition: Cross decomposition

sklearn.pipeline: Pipeline

sklearn.preprocessing: Preprocessing and Normalization

sklearn.random_projection: Random projection

sklearn.semi_supervised: Semi-Supervised Learning

sklearn.svm: Support Vector Machines

sklearn.tree: Decision Tree

sklearn.utils: Utilities

经常玩数据比赛的人就会发现classification,Regression,Clustering,Dimensionality reduction,Model selection,Preprocessing这几样都会经常用到的。尤其是classification和Regression,不过如果你直接用他们进行分类或者回归,不对数据进行预处理和其他的操作的话,成绩通常不太会太好。

其实scikit-learn学习还真没有太多好说的,因为文档写的很好,而且例代码也很多,一般情况拿过例代码,调一调就好了。

比如你想试一下linear_model的Ridge,直接访问:

1.1. Linear Models

看一下Ridge的说明,如果想试一下,里面的例代码都写好了:

>>> from sklearn import linear_model

>>> reg = linear_model.Ridge (alpha = .5)

>>> reg.fit ([[0, 0], [0, 0], [1, 1]], [0, .1, 1])

Ridge(alpha=0.5, copy_X=True, fit_intercept=True, max_iter=None,

normalize=False, random_state=None, solver='auto', tol=0.001)

>>> reg.coef_

array([ 0.34545455, 0.34545455])

>>> reg.intercept_

0.13636...

用起来的顺序大概就是

1,拿过来,跑一下,理解一下。

2,改一改,代入自己的数据,跑一下,看看结果。

3,调一调参数,优化一下。

如果你在想了解函数的参数怎么回事,点击这个文档里这个函数的链接就行了啊。比如ridgeCV:

3.2.4.1.9. sklearn.linear_model.RidgeCV - scikit-learn 0.22 documentation

就酱,你已经成为一个合格的调包侠了。

sklearn pipeline_我的sklearn学习经验相关推荐

  1. sklearn中的Pipline(流水线学习器)

    简介 管道机制实现了对全部步骤的流式化封装和管理(streaming workflows with pipelines). 管道机制(也有人翻译为流水线学习器?这样翻译可能更有利于后面内容的理解)在机 ...

  2. sklearn中的XGBClassifier函数学习

    # 常规参数 booster gbtree 树模型做为基分类器(默认) gbliner 线性模型做为基分类器 silent silent=0时,不输出中间过程(默认) silent=1时,输出中间过程 ...

  3. 架构师成长之路-个人学习经验分享(公司研发峰会演讲ppt)

    前天在公司分享了一些学习经验,园子中感兴趣可以看看.建议大家使用pptPlex来看这个片子. 首先从我在成长中不同阶段的工作和体会来谈不同阶段的学习内容谈起,为了做好这些必修课,我会对知识+实践+思考 ...

  4. 一些真诚的学习经验和生活感悟

    学习经验 首先分享一下自己在学习技术的过程中的一些经验啦,这些也是自己在学习的过程中慢慢总结出来的,希望对大家有所启发. 持续学习 当前互联网发展太快了,我们可以发现现在很多技术更迭太快.比如说前端吧 ...

  5. Yoshua Bengio等大神传授:26条深度学习经验

    Yoshua Bengio等大神传授:26条深度学习经验 发表于2015-09-17 08:21| 13482次阅读| 来源Marek Rei| 29 条评论| 作者Marek Rei 深度学习Pyt ...

  6. sklearn之pipeline:sklearn.pipeline函数使用及其参数解释之详细攻略

    sklearn之pipeline:sklearn.pipeline函数使用及其参数解释之详细攻略 目录 sklearn.pipeline函数使用及其参数解释 sklearn.pipeline函数使用及 ...

  7. 强化学习—— 经验回放(Experience Replay)

    强化学习-- 经验回放(Experience Replay) 1.DQN的缺点 1.1 DQN 1.2 DQN的不足 1.2.1 经验浪费 1.2.2 相关更新(correlated update) ...

  8. 计算机相关专业学习经验总结

    计算机相关专业学习经验总结 无论学习计算机哪一个方向,完完全全可以在网络上找到相关, 你需要的完整的学习路线以及每一个学习步骤阶段 需要找到的东西和学习资料 勤自学.勤思考.勤搜索

  9. 小白一路走来,连续刷题三年,谈谈我的算法学习经验

    数据结构与算法应该算是一个比较难的模块,从小白一路走过来,从大一连续刷过好几年题,看过挺多书,踩过挺多坑,也涨了一些经验,姑且在这里分析一波对数据结构与算法 的学习经验,请耐心看完,相信对你会有所帮助 ...

最新文章

  1. sql中的三元运算符
  2. Android实现自动清空,android – 删除图像后自动刷新在gridview中不...
  3. 如何防止网页Demo被那些赖账的客户盗用
  4. 如何在面试结束后反问面试技术官?
  5. Django+xadmin 打造线上教育平台(二)-1(旧)
  6. Android学习笔记(十一)——将Fragment添加到Activity中以及参数传递
  7. 后台管理系统好用的UI框架
  8. 机器人教练走进驾校_机器人教练走进中通驾校
  9. JVM内存管理 (转)
  10. 实习成长之路:下层应用调不到上层方法怎么办?GoogleGuava事件上报来打配合
  11. python脚本读书心得_《利用Python进行数据分析》读书笔记(一)Python Basic
  12. Java:计算圆的面积和周长
  13. sop8语音芯片选型,九齐硕呈等等比较,看完此篇就足够了
  14. rss和css,RSS 简介
  15. Win32消息集合----方便查阅
  16. Windows10蓝屏触发及分析
  17. 24、基于原型的切比雪夫低通滤波器设计理论(插入损耗法)
  18. 火狐插件油猴Greasemonkey系列二
  19. 谷歌SEO优化入门:Google SEO优化方法(2022最新)
  20. API接口示例,淘宝商品详情接口(调用测试,数据获取)

热门文章

  1. 空调能窃听插座能放火?物联网成了“危”联网
  2. 再读UNPv1:复习、实践、小结
  3. html 页面内锚点定位及跳转方法总结
  4. 创建第二个 local network - 每天5分钟玩转 OpenStack(84)
  5. JSON字符串的解析
  6. #技术分享# “乐高”内核的诞生
  7. fastDFS同步问题讨论
  8. 组策略部署软件----将部署的软件分类
  9. javascript函数作用域与闭包
  10. 不丹的启示:用国民幸福总值替代GDP