sklearn pipeline_使用python+sklearn实现管道、Anova和SVM
管道、Anova和SVM
先后运行带有anova的单变量特征选择,然后用所选特征训练一个SVM,最后使用子管道,可以将拟合系数映射回原始的特征空间。输出:
precision recall f1-score support
0 0.75 0.50 0.60 6 1 0.67 1.00 0.80 6 2 0.67 0.80 0.73 5 3 1.00 0.75 0.86 8
accuracy 0.76 25 macro avg 0.77 0.76 0.75 25weighted avg 0.79 0.76 0.76 25
[[-0.23912131 0. 0. 0. -0.3236911 0. 0. 0. 0. 0. 0. 0. 0.10836648 0. 0. 0. 0. 0. 0. 0. ] [ 0.43878747 0. 0. 0. -0.51415652 0. 0. 0. 0. 0. 0. 0. 0.04845652 0. 0. 0. 0. 0. 0. 0. ] [-0.65382998 0. 0. 0. 0.57962856 0. 0. 0. 0. 0. 0. 0. -0.04736524 0. 0. 0. 0. 0. 0. 0. ] [ 0.54403412 0. 0. 0. 0.58478491 0. 0. 0. 0. 0. 0. 0. -0.11344659 0. 0. 0. 0. 0. 0. 0. ]]
from sklearn import svmfrom sklearn.datasets import make_classificationfrom sklearn.feature_selection import SelectKBest, f_regressionfrom sklearn.pipeline import make_pipelinefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import classification_report
print(__doc__)
# 导入一些数据进行训练X, y = make_classification( n_features=20, n_informative=3, n_redundant=0, n_classes=4, n_clusters_per_class=2)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)
# ANOVA SVM-C# 1)方差分析滤镜,采用3种最佳特征anova_filter = SelectKBest(f_regression, k=3)# 2) svmclf = svm.LinearSVC()
anova_svm = make_pipeline(anova_filter, clf)anova_svm.fit(X_train, y_train)y_pred = anova_svm.predict(X_test)print(classification_report(y_test, y_pred))
coef = anova_svm[:-1].inverse_transform(anova_svm['linearsvc'].coef_)print(coef)
脚本的总运行时间:(0分钟0.341秒)估计的内存使用量: 8 MB下载Python源代码:plot_feature_selection_pipeline.py
下载Jupyter notebook源代码:plot_feature_selection_pipeline.ipynb
由Sphinx-Gallery生成的画廊☆☆☆为方便大家查阅,小编已将scikit-learn学习路线专栏文章统一整理到公众号底部菜单栏,同步更新中,关注公众号,点击左下方“系列文章”,如图:
欢迎大家和我一起沿着scikit-learn文档这条路线,一起巩固机器学习算法基础。(添加微信:mthler,备注:sklearn学习,一起进【sklearn机器学习进步群】开启打怪升级的学习之旅。)
sklearn pipeline_使用python+sklearn实现管道、Anova和SVM相关推荐
- sklearn pipeline_我的sklearn学习经验
scikit-learn是python进行数据挖掘与分析的重要而有效的工具,学习scikit-learn最重要的资料来源就是它的官网: scikit-learn: machine learning i ...
- python︱sklearn一些小技巧的记录(训练集划分/pipelline/交叉验证等)
sklearn里面包含内容太多,所以一些实用小技巧还是挺好用的. sklearn.cross_validation 如果没有了,则需要使用 sklearn.model_selection 文章目录 1 ...
- python pos函数_使用python+sklearn实现特征提取
sklearn.feature_extraction模块可用于以机器学习算法支持的格式从原始数据集(如文本和图像)中提取特征.**注意:**特征提取与特征选择有很大不同:前者是将任意数据(例如文本或图 ...
- Python: sklearn库——数据预处理
Python: sklearn库 -- 数据预处理 数据集转换之预处理数据: 将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化. 原因:数据集的标准化(服从均 ...
- python sklearn 归一化_第3章 Sklearn概述
Sklearn,该工具包是目前用于机器学习的五大主流Python包之一,适用于预处理.建模.验证及调优等机器学习开发的主要流程,覆盖除部分深度学习算法之外几乎所有常用的机器学习算法. Sklearn的 ...
- 高斯拟合 vc++代码_使用python+sklearn实现核岭回归和高斯回归的比较
核岭回归(KRR)和高斯回归(GPR)都通过在内部采用"内核技巧"来学习目标函数.KRR学习使用相应核函数(该核函数对应于原始空间中的非线性函数)将目标函数映射到内核空间中的线性函 ...
- Python+sklearn随机森林算法使用入门
随机森林是一种集成学习方法,基本思想是把几棵不同参数的决策树(参考:Python+sklearn决策树算法使用入门)打包到一起,每棵决策树单独进行预测,然后计算所有决策树预测结果的平均值(适用于回归分 ...
- Python+sklearn使用朴素贝叶斯算法识别中文垃圾邮件
总体思路与步骤: 1.从电子邮箱中收集垃圾和非垃圾邮件训练集. 2.读取全部训练集,删除其中的干扰字符,例如[]*..,等等,然后分词,删除长度为1的单个字. 3.统计全部训练集中词语的出现次数,截取 ...
- Python+sklearn使用支持向量机算法实现数字图片分类
关于支持向量机的理论知识,大家可以查阅机器学习之类的书籍或网上资源,本文主要介绍如何使用Python扩展库sklearn中的支持向量机实现数字图片分类. 1.首先编写代码生成一定数量的含有数字的图片 ...
- KNN分类算法原理与Python+sklearn实现根据身高和体重对体型分类
KNN算法是k-Nearest Neighbor Classification的简称,也就是k近邻分类算法.基本思路是在特征空间中查找k个最相似或者距离最近的样本,然后根据k个最相似的样本对未知样本进 ...
最新文章
- Android利用RecyclerView实现列表倒计时
- Eclipse项目启动不了
- 旷视孙剑团队提出Anchor DETR:基于Transformer的目标检测新网络
- 爱奇艺个性化推荐排序实践【转】
- 4分钟训练ImageNet!腾讯机智创造AI训练世界纪录
- linux 脚本 获取pid,Shell脚本中获取进程ID的方法
- android 子module混淆_Android 多模块打包混淆填坑记
- java 图像处理两例:图像缩放与圆角图片的制作
- 自制操作系统-使用汇编显示 hello world
- oracle 转成sql server,怎样把Oracle查询转换为SQL Server
- thinkphp-条件判断-范围判断-in
- GridView样式设置
- 阿里云 oss 存储临时Token访问
- Android 字符串求值工具(科学计算)
- C语言复杂构造数据类型ppt,复杂构造数据类型.ppt
- oracle的package是什么意思,Oracle的Package的作用及用法
- android+1024*768分辨率什么意思,网站上提示的建议用1024X768分辨率,是什么意思?...
- 发挥强大资源优势,移动云助推高校人才培养
- 【历史上的今天】10 月 9 日:谷歌收购 YouTube;中关村的第一家公司;BINAC 计算机建成
- 《每个人的商学院》思维导图整理