天池学习赛:工业蒸汽量预测3——模型训练
接上一篇《天池学习赛:工业蒸汽量预测2——特征工程》
数据划分:
from sklearn.model_selection import train_test_split #切分数据new_train_pca_16=new_train_pca_16.fillna(0)#采用PCA保留的16维特征的数据
train=new_train_pca_16[new_train_pca_16.columns]
target=new_train_pca_16['target']#划分数据集 训练集80%验证机20%
train_data,test_data,train_target,test_target=train_test_split(train,target,\test_size=0.2,random_state=0)
from sklearn.metrics import mean_squared_error #评价指标
线性回归模型:
#从sklearn引入线性模型
from sklearn.linear_model import LinearRegressionclf=LinearRegression()
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("LinearRegression: ",score)
k近邻回归模型:
from sklearn.neighbors import KNeighborsRegressorclf=KNeighborsRegressor(n_neighbors=3)#最近的三个
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("KNeighborsRegressor: ",score)
决策树回归模型:
from sklearn.tree import DecisionTreeRegressorclf=DecisionTreeRegressor()
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("DecisionTreeRegressor: ",score)
随机森林回归模型:
from sklearn.ensemble import RandomForestRegressorclf=RandomForestRegressor(n_estimators=200) #200树
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("RandomForestRegressor: ",score)
LightGBM回归模型:
from lightgbm import LGBMRegressorclf=LGBMRegressor(learning_rate=0.01,\max_depth=-1,\n_estimators=5000,\boosting_type='gbdt',\random_state=2019,\objective='regression')
clf.fit(train_data,train_target)
test_pred=clf.predict(test_data)
score=mean_squared_error(test_target,clf.predict(test_data))
print("LGBMRegressor: ",score)
下一篇《天池学习赛:工业蒸汽量预测4——模型验证》
天池学习赛:工业蒸汽量预测3——模型训练相关推荐
- 天池学习赛:工业蒸汽量预测4——模型验证
上一篇<天池学习赛:工业蒸汽量预测3--模型训练>中已经是使用了几种机器学习的模型,接下来将介绍一些模型的评价方法. 目录 1 模型评估的方法 2 模型调参 3 赛题模型验证与调参 3.1 ...
- 天池大赛之工业蒸汽量预测(有史以来最全面)
目录 1.导包与数据挖掘 1.1导包 1.2 数据载入 1.3 数据合并 1.4 数据分布 1.5 特征清洗 1.6 特征可视化 1.7 相关性系数 1.8 归一化 1.9 Box-Cox变换对连续变 ...
- 天池比赛:工业蒸汽量预测
https://tianchi.aliyun.com/competition/entrance/231693/introduction 偶然看到一句话:最重要的是提特征,特征决定上限,模型只是无限逼近 ...
- 天池学习赛:工业蒸汽量预测2——特征工程
上一篇<天池学习赛:工业蒸汽量预测1--数据探索> 目录 1.特征工程 1.1 预处理 1.2 特征处理 1.3 特征降维 1.3.1 特征选择 1.3.2 线性降维 2.赛题代码 3 结 ...
- 天池学习赛:工业蒸汽量预测5——特征优化
上一篇<天池学习赛:工业蒸汽量预测4--模型验证> 目录 1 特征优化的方法 1.1 合成特征 1.2 特征变换 1.3 用决策树创造新特征 1.4 特征组合 2 赛题特征优化代码 1 特 ...
- 天池工业蒸汽量预测-模型调参
本文改编自<阿里云天池大赛赛题解析-机器学习篇>工业蒸汽量预测的模型调参.进行了部分素材的替换和知识点的归纳总结.新增了Datawhale8月集成学习中的网格搜索.随机搜索的内容 上一篇工 ...
- python建模大赛算法_Python数据分析kaggle-Titanic+天池-工业蒸汽量预测建模算法
做数据分析许久了, 简单写写比赛的数据分析项目思路 一 使用逻辑回归/随机森林等对kaggle比赛项目 "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存"进行简单的数据分析过程, ...
- 天池学习赛:工业蒸汽量预测1——数据探索
目录 0.赛题介绍 1.数据分析知识 2.代码实现 0.赛题介绍 火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能.在这一系列的能量转化中, ...
- 【机器学习】阿里云天池竞赛——工业蒸汽量预测(2)
机器学习经典赛题:工业蒸汽量预测(2) 机器学习经典赛题:工业蒸汽量预测(2) 3.1 特征工程的重要性和处理 3.2 数据预处理和特征处理 3.2.1 数据预处理 3.2.2 特征处理 3.3 特征 ...
最新文章
- 4,fail-fast错误机制
- SAP BW查看数据源提取方法
- 使用Selenium或WebDriver测试GWT应用
- which oracle linux,(总结)Linux下Oracle11gR2的ORA-00845错误解决方法
- 前端学习(2929):vue改变多个样式的组合
- Python《使用Selenium实现自动化操作》
- 【2】Docker数据卷
- python确定指标权重_python 实现熵权法确定各指标的权重
- 如何使用Transact-SQL进行事务处理[示例]
- getJSON()的使用
- windows下如何安装ipython_Windows下IPython安装
- 【转】自动化专业十大看家课程
- 在TMS320F2812上实现从flash拷贝整个程序到RAM上运行的方法探讨
- 2022.7.20 JETSON NANO 2GB 跑Swin-Transformer-Object-Detection。(配置:UBUNTU18/PYTHON3.6/PYTORCH1.6.0...)
- 未支付订单超时处理分析
- 微博长图快速排版生成工具
- Excel表格如何筛选出重复的数据?
- Python netCDF4
- arnold渲染器预览窗口打开时保存有可能崩溃,解决方法如下
- Processing Arduino 音频频谱显示
热门文章
- 圆变成长方形什么变了_中班数学教案详案图形变变变含PPT课件
- java根据父类找子类_在java中实现多态时,可以通过父类变量引用子类的对象。_学小易找答案...
- 【CVPR 2019】Strong-Weak Distribution Alignment for Adaptive Object Detection
- Spring框架XML配置文件使用外部Bean属性注入
- Altium AD20常用的操作快捷键,个人总结精炼版,全干货超实用
- 【自考总结】烟火里的尘埃
- 使用socket实现基于select模型的网络聊天室
- 表格中点击获得行列的值、刷新页面
- LeetCode 28. 实现strStr()
- 题解 P3367 【【模板】并查集】