1.数据准备和生成模型的Pipeline

Pipeline最小化数据损失
Pipeline能够处理训练数据和评估数据集之间的数据泄漏问题,通常在数据处理过程中对分离出的所有数据子集做同样的数据处理,如正态化处理。

from pandas import read_csv
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
filename='/home/duan/pima indians.txt'
names=['preg','plas','pres','skin','test','mass','pedi','age','class']
dataset=read_csv(filename,names=names)array=dataset.values
X=array[:,0:8]
Y=array[:,8]
seed=7kfold=KFold(n_splits=num_folds, random_state=seed)
steps=[]
steps.append(('Standardize',StandardScaler()))
steps.append(('lda',LinearDiscriminantAnalysis()))model=Pipeline(steps)
result=cross_val_score(model,X,Y,cv=kfold)
print(result.mean())

运行结果为:

0.773462064251538

2.特征选择和生成模型的Pipeline

Pipeline也提供了一个工具(FeatureUnion)来保证数据特征选择时数据的稳固性。

from pandas import read_csv
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.pipeline import FeatureUnion
from sklearn.pipeline import Pipeline
from sklearn.decomposition import PCA
from sklearn.feature_selection import SelectKBest
from sklearn.linear_model import LogisticRegressionfilename='/home/duan/pima indians.txt'
names=['preg','plas','pres','skin','test','mass','pedi','age','class']
dataset=read_csv(filename,names = names)array=dataset.values
X=array[:,0:8]
Y=array[:,8]
seed=7kfold=KFold(n_splits = num_folds, random_state=seed)#生成featuresunion
features=[]
features.append(('pca',PCA()))
features.append(('select_best',SelectKBest(k=6)))#生成Pipeline
steps=[]
steps.append(('feature_union',FeatureUnion(features)))
steps.append(('Logistic',LogisticRegression()))model=Pipeline(steps)
result=cross_val_score(model,X,Y,cv=kfold)
print(result.mean())

运行结果:

0.7799555707450445

《深度学习Python实践》第14章——自动流程相关推荐

  1. 零基础学习Python 作业 第14章

    ==========CH14 homework========== 0 还记得如何定义一个跨越多行的字符串吗(请至少写出两种实现的方法)? Answer: '\', '()', "' cod ...

  2. 【神经网络与深度学习-TensorFlow实践】-中国大学MOOC课程(四)(Python语言基础(2))

    [神经网络与深度学习-TensorFlow实践]-中国大学MOOC课程(四)(Python语言基础(2)) 第4讲 Python语言基础(2) 4.1 内置数据结构 4.1.1 序列数据结构(sequ ...

  3. 人工神经网络理论、设计及应用_TensorFlow深度学习应用实践:教你如何掌握深度学习模型及应用...

    前言 通过TensorFlow图像处理,全面掌握深度学习模型及应用. 全面深入讲解反馈神经网络和卷积神经网络理论体系. 结合深度学习实际案例的实现,掌握TensorFlow程序设计方法和技巧. 着重深 ...

  4. 解析深度学习:语音识别实践 (俞栋等著) 完整pdf[44MB]

    AlphaGo与李世石的围棋大战激发了人们对人工智能是非的诸多争论.人工智能背后的工作原理深度学习跳入大众的视野.AlphaGo的大获全胜一定程度展示了深度学习在应用领域的成功,而语音识别正是深度学习 ...

  5. 【神经网络与深度学习-TensorFlow实践】-中国大学MOOC课程(八)(TensorFlow基础))

    [神经网络与深度学习-TensorFlow实践]-中国大学MOOC课程(八)(TensorFlow基础)) 8 TensorFlow基础 8.1 TensorFlow2.0特性 8.1.1 Tenso ...

  6. 深度学习笔记第二门课 改善深层神经网络 第一周:深度学习的实践层面

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  7. 2.1)深度学习笔记:深度学习的实践层面

    目录 1)Train/Dev/Test sets 2)Bias/Variance 3)Regularization(重点) 4)Why regularization reduces overfitti ...

  8. 02.改善深层神经网络:超参数调试、正则化以及优化 W1.深度学习的实践层面(作业:初始化+正则化+梯度检验)

    文章目录 作业1:初始化 1. 神经网络模型 2. 使用 0 初始化 3. 随机初始化 4. He 初始化 作业2:正则化 1. 无正则化模型 2. L2 正则化 3. DropOut 正则化 3.1 ...

  9. 【神经网络与深度学习-TensorFlow实践】-中国大学MOOC课程(十四)(卷积神经网络))

    [神经网络与深度学习-TensorFlow实践]-中国大学MOOC课程(十四)(卷积神经网络)) 14 卷积神经网络 14.1 深度学习基础 14.1.1 深度学习的基本思想 14.1.2 深度学习三 ...

  10. 八大深度学习最佳实践

    翻译 | AI科技大本营 参与 | 刘畅 [AI 科技大本营导读] 2017年,许多的人工智能算法得到了实践和应用.名博Hack Noon作者 Brian Muhia 认为想要玩转人工智能,不仅要拥有 ...

最新文章

  1. Java HttpSession 详解
  2. MQTT---HiveMQ源代码具体解释(十八)Cluster-kryo与Serializer
  3. 如何实现一个权限管理系统?(附源码)
  4. .Neter们,你真的应该了解下EFCore3.x
  5. SLB访问日志分析:基于客户端来源和HTTP状态码的实践
  6. 永中向香港博览会主办方演示云办公(转载)
  7. 使用VS2015的Visual Studio Installer打包
  8. ubuntu 18.04下 配置qt opencv的坑
  9. mysql主从延迟_MySQL主从同步个般是多久的延迟?
  10. 【转】 delphi --- WinSocket应用
  11. 农用地包括哪些地类_设施农用地属于什么地类、包括哪些用地?
  12. 火热升级:360Safe VS 雅虎助手
  13. SQL查询语句之查询数据
  14. 在ubuntu16.04下利用cmake+VC code,断点调试
  15. 罗格斯的计算机科学,罗格斯大学计算机科学研究生申请截止日期
  16. 搭建个人网站--域名申请
  17. 高德地图marker事件监听-高德地图marker绑定事件就执行了[解决立即执行]
  18. 【机器学习炼丹炉】使用便宜的x99和二手显卡,单显卡的学习机器在3000元,多显卡更贵,可以用支架,架起显卡,用做算法的学习使用,模型训练需要显卡的算力支持,低成本做算法研究,万一从入门到放弃了呢
  19. 推荐一款最好用的windows文件管理器
  20. 继承Handler还是实现Handler.Callback?

热门文章

  1. (每日一题 day 003 - 二维前缀和+动态规划) 1314. 矩阵区域和
  2. Jedis对redis分布式锁的操作(设置过期时间,UUID,LUA脚本)
  3. mfc oracle数据库编程,testmfc - 源码下载|数据库系统|Oracle数据库|源代码 - 源码中国...
  4. u盘数据恢复的原理_电脑磁盘文件数据误删恢复原理、方法总结
  5. 变量不在选择列表中_Python3中的表达式运算符
  6. python image 转成字节_Python 办公自动化之 Excel(下)
  7. eclipse java 报错信息_解决Eclipse启动时报Initializing Java Tooling异常信息
  8. android 添加联系人地址,android – 如何向联系人添加新字段?
  9. SLAM_2021_F-LOAM:基于激光雷达的快速里程计和建图
  10. 从零开始搭二维激光SLAM --- 前言