管道、Anova和SVM

先后运行带有anova的单变量特征选择，然后用所选特征训练一个SVM，最后使用子管道，可以将拟合系数映射回原始的特征空间。输出：

              precision    recall  f1-score   support

           0       0.75      0.50      0.60         6           1       0.67      1.00      0.80         6           2       0.67      0.80      0.73         5           3       1.00      0.75      0.86         8

    accuracy                           0.76        25   macro avg       0.77      0.76      0.75        25weighted avg       0.79      0.76      0.76        25

[[-0.23912131  0.          0.          0.         -0.3236911   0.   0.          0.          0.          0.          0.          0.   0.10836648  0.          0.          0.          0.          0.   0.          0.        ] [ 0.43878747  0.          0.          0.         -0.51415652  0.   0.          0.          0.          0.          0.          0.   0.04845652  0.          0.          0.          0.          0.   0.          0.        ] [-0.65382998  0.          0.          0.          0.57962856  0.   0.          0.          0.          0.          0.          0.  -0.04736524  0.          0.          0.          0.          0.   0.          0.        ] [ 0.54403412  0.          0.          0.          0.58478491  0.   0.          0.          0.          0.          0.          0.  -0.11344659  0.          0.          0.          0.          0.   0.          0.        ]]

from sklearn import svmfrom sklearn.datasets import make_classificationfrom sklearn.feature_selection import SelectKBest, f_regressionfrom sklearn.pipeline import make_pipelinefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import classification_report

print(__doc__)

# 导入一些数据进行训练X, y = make_classification(    n_features=20, n_informative=3, n_redundant=0, n_classes=4,    n_clusters_per_class=2)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# ANOVA SVM-C# 1)方差分析滤镜，采用3种最佳特征anova_filter = SelectKBest(f_regression, k=3)# 2) svmclf = svm.LinearSVC()

anova_svm = make_pipeline(anova_filter, clf)anova_svm.fit(X_train, y_train)y_pred = anova_svm.predict(X_test)print(classification_report(y_test, y_pred))

coef = anova_svm[:-1].inverse_transform(anova_svm['linearsvc'].coef_)print(coef)

脚本的总运行时间：(0分钟0.341秒)估计的内存使用量： 8 MB下载Python源代码:plot_feature_selection_pipeline.py下载Jupyter notebook源代码:plot_feature_selection_pipeline.ipynb由Sphinx-Gallery生成的画廊☆☆☆为方便大家查阅，小编已将scikit-learn学习路线专栏文章统一整理到公众号底部菜单栏，同步更新中，关注公众号，点击左下方“系列文章”，如图：

欢迎大家和我一起沿着scikit-learn文档这条路线，一起巩固机器学习算法基础。(添加微信：mthler，备注：sklearn学习，一起进【sklearn机器学习进步群】开启打怪升级的学习之旅。)

sklearn pipeline_使用python+sklearn实现管道、Anova和SVM相关推荐

sklearn pipeline_我的sklearn学习经验
scikit-learn是python进行数据挖掘与分析的重要而有效的工具,学习scikit-learn最重要的资料来源就是它的官网: scikit-learn: machine learning i ...
python︱sklearn一些小技巧的记录（训练集划分/pipelline/交叉验证等）
sklearn里面包含内容太多,所以一些实用小技巧还是挺好用的. sklearn.cross_validation 如果没有了,则需要使用 sklearn.model_selection 文章目录 1 ...
python pos函数_使用python+sklearn实现特征提取
sklearn.feature_extraction模块可用于以机器学习算法支持的格式从原始数据集(如文本和图像)中提取特征.**注意:**特征提取与特征选择有很大不同:前者是将任意数据(例如文本或图 ...
Python: sklearn库——数据预处理
Python: sklearn库 -- 数据预处理数据集转换之预处理数据: 将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化. 原因:数据集的标准化(服从均 ...
python sklearn 归一化_第3章 Sklearn概述
Sklearn,该工具包是目前用于机器学习的五大主流Python包之一,适用于预处理.建模.验证及调优等机器学习开发的主要流程,覆盖除部分深度学习算法之外几乎所有常用的机器学习算法. Sklearn的 ...
高斯拟合 vc++代码_使用python+sklearn实现核岭回归和高斯回归的比较
核岭回归(KRR)和高斯回归(GPR)都通过在内部采用"内核技巧"来学习目标函数.KRR学习使用相应核函数(该核函数对应于原始空间中的非线性函数)将目标函数映射到内核空间中的线性函 ...
Python+sklearn随机森林算法使用入门
随机森林是一种集成学习方法,基本思想是把几棵不同参数的决策树(参考:Python+sklearn决策树算法使用入门)打包到一起,每棵决策树单独进行预测,然后计算所有决策树预测结果的平均值(适用于回归分 ...
Python+sklearn使用朴素贝叶斯算法识别中文垃圾邮件
总体思路与步骤: 1.从电子邮箱中收集垃圾和非垃圾邮件训练集. 2.读取全部训练集,删除其中的干扰字符,例如[]*..,等等,然后分词,删除长度为1的单个字. 3.统计全部训练集中词语的出现次数,截取 ...
Python+sklearn使用支持向量机算法实现数字图片分类
关于支持向量机的理论知识,大家可以查阅机器学习之类的书籍或网上资源,本文主要介绍如何使用Python扩展库sklearn中的支持向量机实现数字图片分类. 1.首先编写代码生成一定数量的含有数字的图片 ...
KNN分类算法原理与Python+sklearn实现根据身高和体重对体型分类
KNN算法是k-Nearest Neighbor Classification的简称,也就是k近邻分类算法.基本思路是在特征空间中查找k个最相似或者距离最近的样本,然后根据k个最相似的样本对未知样本进 ...

sklearn pipeline_使用python+sklearn实现管道、Anova和SVM

管道、Anova和SVM

sklearn pipeline_使用python+sklearn实现管道、Anova和SVM相关推荐

最新文章

热门文章