天池学习赛：工业蒸汽量预测3—

接上一篇《天池学习赛：工业蒸汽量预测2——特征工程》

数据划分：

from sklearn.model_selection import train_test_split #切分数据new_train_pca_16=new_train_pca_16.fillna(0)#采用PCA保留的16维特征的数据
train=new_train_pca_16[new_train_pca_16.columns]
target=new_train_pca_16['target']#划分数据集   训练集80%验证机20%
train_data,test_data,train_target,test_target=train_test_split(train,target,\test_size=0.2,random_state=0)

from sklearn.metrics import mean_squared_error  #评价指标

线性回归模型:

#从sklearn引入线性模型
from sklearn.linear_model import LinearRegressionclf=LinearRegression()
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("LinearRegression:  ",score)

k近邻回归模型:

from sklearn.neighbors import KNeighborsRegressorclf=KNeighborsRegressor(n_neighbors=3)#最近的三个
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("KNeighborsRegressor:  ",score)

决策树回归模型:

from sklearn.tree import DecisionTreeRegressorclf=DecisionTreeRegressor()
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("DecisionTreeRegressor:  ",score)

随机森林回归模型:

from sklearn.ensemble import RandomForestRegressorclf=RandomForestRegressor(n_estimators=200)     #200树
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("RandomForestRegressor:  ",score)

LightGBM回归模型:

from lightgbm import LGBMRegressorclf=LGBMRegressor(learning_rate=0.01,\max_depth=-1,\n_estimators=5000,\boosting_type='gbdt',\random_state=2019,\objective='regression')
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("LGBMRegressor:  ",score)

下一篇《天池学习赛：工业蒸汽量预测4——模型验证》

天池学习赛：工业蒸汽量预测3——模型训练相关推荐

天池学习赛：工业蒸汽量预测4——模型验证
上一篇<天池学习赛:工业蒸汽量预测3--模型训练>中已经是使用了几种机器学习的模型,接下来将介绍一些模型的评价方法. 目录 1 模型评估的方法 2 模型调参 3 赛题模型验证与调参 3.1 ...
天池大赛之工业蒸汽量预测（有史以来最全面）
目录 1.导包与数据挖掘 1.1导包 1.2 数据载入 1.3 数据合并 1.4 数据分布 1.5 特征清洗 1.6 特征可视化 1.7 相关性系数 1.8 归一化 1.9 Box-Cox变换对连续变 ...
天池比赛：工业蒸汽量预测
https://tianchi.aliyun.com/competition/entrance/231693/introduction 偶然看到一句话:最重要的是提特征,特征决定上限,模型只是无限逼近 ...
天池学习赛：工业蒸汽量预测2——特征工程
上一篇<天池学习赛:工业蒸汽量预测1--数据探索> 目录 1.特征工程 1.1 预处理 1.2 特征处理 1.3 特征降维 1.3.1 特征选择 1.3.2 线性降维 2.赛题代码 3 结 ...
天池学习赛：工业蒸汽量预测5——特征优化
上一篇<天池学习赛:工业蒸汽量预测4--模型验证> 目录 1 特征优化的方法 1.1 合成特征 1.2 特征变换 1.3 用决策树创造新特征 1.4 特征组合 2 赛题特征优化代码 1 特 ...
天池工业蒸汽量预测-模型调参
本文改编自<阿里云天池大赛赛题解析-机器学习篇>工业蒸汽量预测的模型调参.进行了部分素材的替换和知识点的归纳总结.新增了Datawhale8月集成学习中的网格搜索.随机搜索的内容上一篇工 ...
python建模大赛算法_Python数据分析kaggle-Titanic+天池-工业蒸汽量预测建模算法
做数据分析许久了, 简单写写比赛的数据分析项目思路一使用逻辑回归/随机森林等对kaggle比赛项目 "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存"进行简单的数据分析过程, ...
天池学习赛：工业蒸汽量预测1——数据探索
目录 0.赛题介绍 1.数据分析知识 2.代码实现 0.赛题介绍火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能.在这一系列的能量转化中, ...
【机器学习】阿里云天池竞赛——工业蒸汽量预测（2）
机器学习经典赛题:工业蒸汽量预测(2) 机器学习经典赛题:工业蒸汽量预测(2) 3.1 特征工程的重要性和处理 3.2 数据预处理和特征处理 3.2.1 数据预处理 3.2.2 特征处理 3.3 特征 ...

天池学习赛：工业蒸汽量预测3——模型训练

天池学习赛：工业蒸汽量预测3——模型训练相关推荐

最新文章

热门文章