sklearn pipeline_我的sklearn学习经验
scikit-learn是python进行数据挖掘与分析的重要而有效的工具,学习scikit-learn最重要的资料来源就是它的官网:
scikit-learn: machine learning in Python
一进官网就能看到它的6大功能:
classification
Regression
Clustering
Dimensionality reduction
Model selection
Preprocessing
它的API模块包括:
sklearn.base: Base classes and utility function
sklearn.cluster: Clustering
sklearn.cluster.bicluster: Biclustering
sklearn.covariance: Covariance Estimators
sklearn.model_selection: Model Selection
sklearn.datasets: Datasets
sklearn.decomposition: Matrix Decomposition
sklearn.dummy: Dummy estimators
sklearn.ensemble: Ensemble Methods
sklearn.exceptions: Exceptions and warnings
sklearn.feature_extraction: Feature Extraction
sklearn.feature_selection: Feature Selection
sklearn.gaussian_process: Gaussian Processes
sklearn.isotonic: Isotonic regression
sklearn.kernel_approximation: Kernel Approximation
sklearn.kernel_ridge: Kernel Ridge Regression
sklearn.discriminant_analysis: Discriminant Analysis
sklearn.linear_model: Generalized Linear Models
sklearn.manifold: Manifold Learning
sklearn.metrics: Metrics
sklearn.mixture: Gaussian Mixture Models
sklearn.multiclass: Multiclass and multilabel classification
sklearn.multioutput: Multioutput regression and classification
sklearn.naive_bayes: Naive Bayes
sklearn.neighbors: Nearest Neighbors
sklearn.neural_network: Neural network models
sklearn.calibration: Probability Calibration
sklearn.cross_decomposition: Cross decomposition
sklearn.pipeline: Pipeline
sklearn.preprocessing: Preprocessing and Normalization
sklearn.random_projection: Random projection
sklearn.semi_supervised: Semi-Supervised Learning
sklearn.svm: Support Vector Machines
sklearn.tree: Decision Tree
sklearn.utils: Utilities
经常玩数据比赛的人就会发现classification,Regression,Clustering,Dimensionality reduction,Model selection,Preprocessing这几样都会经常用到的。尤其是classification和Regression,不过如果你直接用他们进行分类或者回归,不对数据进行预处理和其他的操作的话,成绩通常不太会太好。
其实scikit-learn学习还真没有太多好说的,因为文档写的很好,而且例代码也很多,一般情况拿过例代码,调一调就好了。
比如你想试一下linear_model的Ridge,直接访问:
1.1. Linear Models
看一下Ridge的说明,如果想试一下,里面的例代码都写好了:
>>> from sklearn import linear_model
>>> reg = linear_model.Ridge (alpha = .5)
>>> reg.fit ([[0, 0], [0, 0], [1, 1]], [0, .1, 1])
Ridge(alpha=0.5, copy_X=True, fit_intercept=True, max_iter=None,
normalize=False, random_state=None, solver='auto', tol=0.001)
>>> reg.coef_
array([ 0.34545455, 0.34545455])
>>> reg.intercept_
0.13636...
用起来的顺序大概就是
1,拿过来,跑一下,理解一下。
2,改一改,代入自己的数据,跑一下,看看结果。
3,调一调参数,优化一下。
如果你在想了解函数的参数怎么回事,点击这个文档里这个函数的链接就行了啊。比如ridgeCV:
3.2.4.1.9. sklearn.linear_model.RidgeCV - scikit-learn 0.22 documentation
就酱,你已经成为一个合格的调包侠了。
sklearn pipeline_我的sklearn学习经验相关推荐
- sklearn中的Pipline(流水线学习器)
简介 管道机制实现了对全部步骤的流式化封装和管理(streaming workflows with pipelines). 管道机制(也有人翻译为流水线学习器?这样翻译可能更有利于后面内容的理解)在机 ...
- sklearn中的XGBClassifier函数学习
# 常规参数 booster gbtree 树模型做为基分类器(默认) gbliner 线性模型做为基分类器 silent silent=0时,不输出中间过程(默认) silent=1时,输出中间过程 ...
- 架构师成长之路-个人学习经验分享(公司研发峰会演讲ppt)
前天在公司分享了一些学习经验,园子中感兴趣可以看看.建议大家使用pptPlex来看这个片子. 首先从我在成长中不同阶段的工作和体会来谈不同阶段的学习内容谈起,为了做好这些必修课,我会对知识+实践+思考 ...
- 一些真诚的学习经验和生活感悟
学习经验 首先分享一下自己在学习技术的过程中的一些经验啦,这些也是自己在学习的过程中慢慢总结出来的,希望对大家有所启发. 持续学习 当前互联网发展太快了,我们可以发现现在很多技术更迭太快.比如说前端吧 ...
- Yoshua Bengio等大神传授:26条深度学习经验
Yoshua Bengio等大神传授:26条深度学习经验 发表于2015-09-17 08:21| 13482次阅读| 来源Marek Rei| 29 条评论| 作者Marek Rei 深度学习Pyt ...
- sklearn之pipeline:sklearn.pipeline函数使用及其参数解释之详细攻略
sklearn之pipeline:sklearn.pipeline函数使用及其参数解释之详细攻略 目录 sklearn.pipeline函数使用及其参数解释 sklearn.pipeline函数使用及 ...
- 强化学习—— 经验回放(Experience Replay)
强化学习-- 经验回放(Experience Replay) 1.DQN的缺点 1.1 DQN 1.2 DQN的不足 1.2.1 经验浪费 1.2.2 相关更新(correlated update) ...
- 计算机相关专业学习经验总结
计算机相关专业学习经验总结 无论学习计算机哪一个方向,完完全全可以在网络上找到相关, 你需要的完整的学习路线以及每一个学习步骤阶段 需要找到的东西和学习资料 勤自学.勤思考.勤搜索
- 小白一路走来,连续刷题三年,谈谈我的算法学习经验
数据结构与算法应该算是一个比较难的模块,从小白一路走过来,从大一连续刷过好几年题,看过挺多书,踩过挺多坑,也涨了一些经验,姑且在这里分析一波对数据结构与算法 的学习经验,请耐心看完,相信对你会有所帮助 ...
最新文章
- sql中的三元运算符
- Android实现自动清空,android – 删除图像后自动刷新在gridview中不...
- 如何防止网页Demo被那些赖账的客户盗用
- 如何在面试结束后反问面试技术官?
- Django+xadmin 打造线上教育平台(二)-1(旧)
- Android学习笔记(十一)——将Fragment添加到Activity中以及参数传递
- 后台管理系统好用的UI框架
- 机器人教练走进驾校_机器人教练走进中通驾校
- JVM内存管理 (转)
- 实习成长之路:下层应用调不到上层方法怎么办?GoogleGuava事件上报来打配合
- python脚本读书心得_《利用Python进行数据分析》读书笔记(一)Python Basic
- Java:计算圆的面积和周长
- sop8语音芯片选型,九齐硕呈等等比较,看完此篇就足够了
- rss和css,RSS 简介
- Win32消息集合----方便查阅
- Windows10蓝屏触发及分析
- 24、基于原型的切比雪夫低通滤波器设计理论(插入损耗法)
- 火狐插件油猴Greasemonkey系列二
- 谷歌SEO优化入门:Google SEO优化方法(2022最新)
- API接口示例,淘宝商品详情接口(调用测试,数据获取)