接上一篇《天池学习赛:工业蒸汽量预测2——特征工程》

数据划分:

from sklearn.model_selection import train_test_split #切分数据new_train_pca_16=new_train_pca_16.fillna(0)#采用PCA保留的16维特征的数据
train=new_train_pca_16[new_train_pca_16.columns]
target=new_train_pca_16['target']#划分数据集   训练集80%验证机20%
train_data,test_data,train_target,test_target=train_test_split(train,target,\test_size=0.2,random_state=0)
from sklearn.metrics import mean_squared_error  #评价指标

线性回归模型:

#从sklearn引入线性模型
from sklearn.linear_model import LinearRegressionclf=LinearRegression()
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("LinearRegression:  ",score)

k近邻回归模型:

from sklearn.neighbors import KNeighborsRegressorclf=KNeighborsRegressor(n_neighbors=3)#最近的三个
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("KNeighborsRegressor:  ",score)

决策树回归模型:

from sklearn.tree import DecisionTreeRegressorclf=DecisionTreeRegressor()
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("DecisionTreeRegressor:  ",score)

随机森林回归模型:

from sklearn.ensemble import RandomForestRegressorclf=RandomForestRegressor(n_estimators=200)     #200树
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("RandomForestRegressor:  ",score)

LightGBM回归模型:

from lightgbm import LGBMRegressorclf=LGBMRegressor(learning_rate=0.01,\max_depth=-1,\n_estimators=5000,\boosting_type='gbdt',\random_state=2019,\objective='regression')
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("LGBMRegressor:  ",score)

下一篇《天池学习赛:工业蒸汽量预测4——模型验证》

天池学习赛:工业蒸汽量预测3——模型训练相关推荐

  1. 天池学习赛:工业蒸汽量预测4——模型验证

    上一篇<天池学习赛:工业蒸汽量预测3--模型训练>中已经是使用了几种机器学习的模型,接下来将介绍一些模型的评价方法. 目录 1 模型评估的方法 2 模型调参 3 赛题模型验证与调参 3.1 ...

  2. 天池大赛之工业蒸汽量预测(有史以来最全面)

    目录 1.导包与数据挖掘 1.1导包 1.2 数据载入 1.3 数据合并 1.4 数据分布 1.5 特征清洗 1.6 特征可视化 1.7 相关性系数 1.8 归一化 1.9 Box-Cox变换对连续变 ...

  3. 天池比赛:工业蒸汽量预测

    https://tianchi.aliyun.com/competition/entrance/231693/introduction 偶然看到一句话:最重要的是提特征,特征决定上限,模型只是无限逼近 ...

  4. 天池学习赛:工业蒸汽量预测2——特征工程

    上一篇<天池学习赛:工业蒸汽量预测1--数据探索> 目录 1.特征工程 1.1 预处理 1.2 特征处理 1.3 特征降维 1.3.1 特征选择 1.3.2 线性降维 2.赛题代码 3 结 ...

  5. 天池学习赛:工业蒸汽量预测5——特征优化

    上一篇<天池学习赛:工业蒸汽量预测4--模型验证> 目录 1 特征优化的方法 1.1 合成特征 1.2 特征变换 1.3 用决策树创造新特征 1.4 特征组合 2 赛题特征优化代码 1 特 ...

  6. 天池工业蒸汽量预测-模型调参

    本文改编自<阿里云天池大赛赛题解析-机器学习篇>工业蒸汽量预测的模型调参.进行了部分素材的替换和知识点的归纳总结.新增了Datawhale8月集成学习中的网格搜索.随机搜索的内容 上一篇工 ...

  7. python建模大赛算法_Python数据分析kaggle-Titanic+天池-工业蒸汽量预测建模算法

    做数据分析许久了, 简单写写比赛的数据分析项目思路 一 使用逻辑回归/随机森林等对kaggle比赛项目 "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存"进行简单的数据分析过程, ...

  8. 天池学习赛:工业蒸汽量预测1——数据探索

    目录 0.赛题介绍 1.数据分析知识 2.代码实现 0.赛题介绍 火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能.在这一系列的能量转化中, ...

  9. 【机器学习】阿里云天池竞赛——工业蒸汽量预测(2)

    机器学习经典赛题:工业蒸汽量预测(2) 机器学习经典赛题:工业蒸汽量预测(2) 3.1 特征工程的重要性和处理 3.2 数据预处理和特征处理 3.2.1 数据预处理 3.2.2 特征处理 3.3 特征 ...

最新文章

  1. 4,fail-fast错误机制
  2. SAP BW查看数据源提取方法
  3. 使用Selenium或WebDriver测试GWT应用
  4. which oracle linux,(总结)Linux下Oracle11gR2的ORA-00845错误解决方法
  5. 前端学习(2929):vue改变多个样式的组合
  6. Python《使用Selenium实现自动化操作》
  7. 【2】Docker数据卷
  8. python确定指标权重_python 实现熵权法确定各指标的权重
  9. 如何使用Transact-SQL进行事务处理[示例]
  10. getJSON()的使用
  11. windows下如何安装ipython_Windows下IPython安装
  12. 【转】自动化专业十大看家课程
  13. 在TMS320F2812上实现从flash拷贝整个程序到RAM上运行的方法探讨
  14. 2022.7.20 JETSON NANO 2GB 跑Swin-Transformer-Object-Detection。(配置:UBUNTU18/PYTHON3.6/PYTORCH1.6.0...)
  15. 未支付订单超时处理分析
  16. 微博长图快速排版生成工具
  17. Excel表格如何筛选出重复的数据?
  18. Python netCDF4
  19. arnold渲染器预览窗口打开时保存有可能崩溃,解决方法如下
  20. Processing Arduino 音频频谱显示

热门文章

  1. 圆变成长方形什么变了_中班数学教案详案图形变变变含PPT课件
  2. java根据父类找子类_在java中实现多态时,可以通过父类变量引用子类的对象。_学小易找答案...
  3. 【CVPR 2019】Strong-Weak Distribution Alignment for Adaptive Object Detection
  4. Spring框架XML配置文件使用外部Bean属性注入
  5. Altium AD20常用的操作快捷键,个人总结精炼版,全干货超实用
  6. 【自考总结】烟火里的尘埃
  7. 使用socket实现基于select模型的网络聊天室
  8. 表格中点击获得行列的值、刷新页面
  9. LeetCode 28. 实现strStr()
  10. 题解 P3367 【【模板】并查集】