管道、Anova和SVM

先后运行带有anova的单变量特征选择,然后用所选特征训练一个SVM,最后使用子管道,可以将拟合系数映射回原始的特征空间。输出:

              precision    recall  f1-score   support

           0       0.75      0.50      0.60         6           1       0.67      1.00      0.80         6           2       0.67      0.80      0.73         5           3       1.00      0.75      0.86         8

    accuracy                           0.76        25   macro avg       0.77      0.76      0.75        25weighted avg       0.79      0.76      0.76        25

[[-0.23912131  0.          0.          0.         -0.3236911   0.   0.          0.          0.          0.          0.          0.   0.10836648  0.          0.          0.          0.          0.   0.          0.        ] [ 0.43878747  0.          0.          0.         -0.51415652  0.   0.          0.          0.          0.          0.          0.   0.04845652  0.          0.          0.          0.          0.   0.          0.        ] [-0.65382998  0.          0.          0.          0.57962856  0.   0.          0.          0.          0.          0.          0.  -0.04736524  0.          0.          0.          0.          0.   0.          0.        ] [ 0.54403412  0.          0.          0.          0.58478491  0.   0.          0.          0.          0.          0.          0.  -0.11344659  0.          0.          0.          0.          0.   0.          0.        ]]
from sklearn import svmfrom sklearn.datasets import make_classificationfrom sklearn.feature_selection import SelectKBest, f_regressionfrom sklearn.pipeline import make_pipelinefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import classification_report

print(__doc__)

# 导入一些数据进行训练X, y = make_classification(    n_features=20, n_informative=3, n_redundant=0, n_classes=4,    n_clusters_per_class=2)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# ANOVA SVM-C# 1)方差分析滤镜,采用3种最佳特征anova_filter = SelectKBest(f_regression, k=3)# 2) svmclf = svm.LinearSVC()

anova_svm = make_pipeline(anova_filter, clf)anova_svm.fit(X_train, y_train)y_pred = anova_svm.predict(X_test)print(classification_report(y_test, y_pred))

coef = anova_svm[:-1].inverse_transform(anova_svm['linearsvc'].coef_)print(coef)

脚本的总运行时间:(0分钟0.341秒)估计的内存使用量: 8 MB下载Python源代码:plot_feature_selection_pipeline.py下载Jupyter notebook源代码:plot_feature_selection_pipeline.ipynb由Sphinx-Gallery生成的画廊☆☆☆为方便大家查阅,小编已将scikit-learn学习路线专栏文章统一整理到公众号底部菜单栏,同步更新中,关注公众号,点击左下方“系列文章”,如图:

欢迎大家和我一起沿着scikit-learn文档这条路线,一起巩固机器学习算法基础。(添加微信:mthler,备注:sklearn学习,一起进【sklearn机器学习进步群】开启打怪升级的学习之旅。)

sklearn pipeline_使用python+sklearn实现管道、Anova和SVM相关推荐

  1. sklearn pipeline_我的sklearn学习经验

    scikit-learn是python进行数据挖掘与分析的重要而有效的工具,学习scikit-learn最重要的资料来源就是它的官网: scikit-learn: machine learning i ...

  2. python︱sklearn一些小技巧的记录(训练集划分/pipelline/交叉验证等)

    sklearn里面包含内容太多,所以一些实用小技巧还是挺好用的. sklearn.cross_validation 如果没有了,则需要使用 sklearn.model_selection 文章目录 1 ...

  3. python pos函数_使用python+sklearn实现特征提取

    sklearn.feature_extraction模块可用于以机器学习算法支持的格式从原始数据集(如文本和图像)中提取特征.**注意:**特征提取与特征选择有很大不同:前者是将任意数据(例如文本或图 ...

  4. Python: sklearn库——数据预处理

    Python: sklearn库 -- 数据预处理 数据集转换之预处理数据:       将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化.       原因:数据集的标准化(服从均 ...

  5. python sklearn 归一化_第3章 Sklearn概述

    Sklearn,该工具包是目前用于机器学习的五大主流Python包之一,适用于预处理.建模.验证及调优等机器学习开发的主要流程,覆盖除部分深度学习算法之外几乎所有常用的机器学习算法. Sklearn的 ...

  6. 高斯拟合 vc++代码_使用python+sklearn实现核岭回归和高斯回归的比较

    核岭回归(KRR)和高斯回归(GPR)都通过在内部采用"内核技巧"来学习目标函数.KRR学习使用相应核函数(该核函数对应于原始空间中的非线性函数)将目标函数映射到内核空间中的线性函 ...

  7. Python+sklearn随机森林算法使用入门

    随机森林是一种集成学习方法,基本思想是把几棵不同参数的决策树(参考:Python+sklearn决策树算法使用入门)打包到一起,每棵决策树单独进行预测,然后计算所有决策树预测结果的平均值(适用于回归分 ...

  8. Python+sklearn使用朴素贝叶斯算法识别中文垃圾邮件

    总体思路与步骤: 1.从电子邮箱中收集垃圾和非垃圾邮件训练集. 2.读取全部训练集,删除其中的干扰字符,例如[]*..,等等,然后分词,删除长度为1的单个字. 3.统计全部训练集中词语的出现次数,截取 ...

  9. Python+sklearn使用支持向量机算法实现数字图片分类

    关于支持向量机的理论知识,大家可以查阅机器学习之类的书籍或网上资源,本文主要介绍如何使用Python扩展库sklearn中的支持向量机实现数字图片分类. 1.首先编写代码生成一定数量的含有数字的图片 ...

  10. KNN分类算法原理与Python+sklearn实现根据身高和体重对体型分类

    KNN算法是k-Nearest Neighbor Classification的简称,也就是k近邻分类算法.基本思路是在特征空间中查找k个最相似或者距离最近的样本,然后根据k个最相似的样本对未知样本进 ...

最新文章

  1. Android利用RecyclerView实现列表倒计时
  2. Eclipse项目启动不了
  3. 旷视孙剑团队提出Anchor DETR:基于Transformer的目标检测新网络
  4. 爱奇艺个性化推荐排序实践【转】
  5. 4分钟训练ImageNet!腾讯机智创造AI训练世界纪录
  6. linux 脚本 获取pid,Shell脚本中获取进程ID的方法
  7. android 子module混淆_Android 多模块打包混淆填坑记
  8. java 图像处理两例:图像缩放与圆角图片的制作
  9. 自制操作系统-使用汇编显示 hello world
  10. oracle 转成sql server,怎样把Oracle查询转换为SQL Server
  11. thinkphp-条件判断-范围判断-in
  12. GridView样式设置
  13. 阿里云 oss 存储临时Token访问
  14. Android 字符串求值工具(科学计算)
  15. C语言复杂构造数据类型ppt,复杂构造数据类型.ppt
  16. oracle的package是什么意思,Oracle的Package的作用及用法
  17. android+1024*768分辨率什么意思,网站上提示的建议用1024X768分辨率,是什么意思?...
  18. 发挥强大资源优势,移动云助推高校人才培养
  19. 【历史上的今天】10 月 9 日:谷歌收购 YouTube;中关村的第一家公司;BINAC 计算机建成
  20. 《每个人的商学院》思维导图整理

热门文章

  1. Kafka副本同步机制理解
  2. 网站漏洞渗透检测过程与修复方案
  3. AS3和Flex常用知识100条
  4. 【转载】深入浅出VA函数
  5. [jQuery]20+ Brilliant and Advanced jQuery Effects
  6. jBPM研究情况报告
  7. myeclipse修改maven settings
  8. 原创:爱是两个人的事
  9. 开源监控——cacti
  10. jQuery新的事件绑定机制on()