kaggle House_Price_final

代码

import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import Imputer
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
import matplotlib.pyplot as plt
from sklearn.preprocessing import Imputer
from xgboost import XGBRegressortrain_path = r"C:\Users\cbattle\Desktop\train.csv"
test_path = r"C:\Users\cbattle\Desktop\test.csv"
out_path = r"C:\Users\cbattle\Desktop\out.csv"# 读入数据
train = pd.read_csv(train_path)
test = pd.read_csv(test_path)
print('train:',train.shape)
print('test :',test.shape)# 划分X,y
X = train.drop(['Id','SalePrice'],axis=1)
y = train['SalePrice']
Xtest = test.drop(['Id'],axis=1)
print('X    :',X.shape)
print('y    :',y.shape)
print('Xtest:',Xtest.shape)
# for col in X:
#     print(X[col].dtype,col)key = [col for col in Xif X[col].dtype in ['int64','float64']or X[col].dtype == 'object' and X[col].nunique()<10]
X = X[key]
Xtest = Xtest[key]# 独热编码
key = [col for col in Xif X[col].dtype in ['int64','float64']or X[col].dtype == 'object' and X[col].nunique()<10]
X = X[key]
Xtest = Xtest[key]print(X.shape, Xtest.shape)
X = pd.get_dummies(X)
Xtest = pd.get_dummies(Xtest)
X, Xtest = X.align(Xtest, join = 'left', axis=1)
print(X.shape, Xtest.shape)# 填补空值
my_imputer = Imputer()
X = my_imputer.fit_transform(X)
Xtest = my_imputer.transform(Xtest)
print(X.shape, Xtest.shape)# 决策树
# decisionTree = DecisionTreeRegressor()
# decisionTree.fit(X,y)
# ans = decisionTree.predict(Xtest)# XG boost
xgb = XGBRegressor()
xgb.fit(X,y,verbose=False)
ans = xgb.predict(Xtest)# my_model = XGBRegressor(n_estimators=1000)
# my_model.fit(train_X, train_y, early_stopping_rounds=5,
#              eval_set=[(val_X, val_y)], verbose=False)
# ans = my_model.predict(Xtest)# 输出
myAns = pd.DataFrame({'Id':test['Id'],'SalePrice':ans})
myAns.to_csv(r"C:\Users\cbattle\Desktop\out.csv", index=False)
print('ok')

转载于:https://www.cnblogs.com/cbattle/p/8810851.html

kaggle House_Price_XGBoost相关推荐

  1. 【Kaggle Learn】Python 1-4

    [Kaggle Learn]Python https://www.kaggle.com/learn/python 一. Hello, Python A quick introduction to Py ...

  2. Kaggle上的犬种识别(ImageNet Dogs)

    Kaggle上的犬种识别(ImageNet Dogs) Dog Breed Identification (ImageNet Dogs) on Kaggle 在本节中,将解决在Kaggle竞赛中的犬种 ...

  3. 基于Kaggle的图像分类(CIFAR-10)

    基于Kaggle的图像分类(CIFAR-10) Image Classification (CIFAR-10) on Kaggle 一直在使用Gluon's data package数据包直接获得张量 ...

  4. 泰坦尼克号数据集_机器学习(入门)--Kaggle项目之泰坦尼克号

    电影<泰坦尼克号>改编自一个真实故事.1912年4月15日,这艘号称"永不沉没"的泰坦尼克号在首航期间,撞上冰山后沉没,船上的2224名乘客和机组人员,其中只有772人 ...

  5. [干货]Kaggle热门 | 用一个框架解决所有机器学习难题

    新智元推荐 来源:LinkedIn 作者:Abhishek Thakur 译者:弗格森 [新智元导读]本文是数据科学家Abhishek Thakur发表的Kaggle热门文章.作者总结了自己参加100 ...

  6. keras bi-lstm_LSTM用于文本生成的应用介绍-使用Keras和启用GPU的Kaggle Kernels

    keras bi-lstm by Megan Risdal 梅根·里斯达尔(Megan Risdal) LSTM用于文本生成的应用介绍-使用Keras和启用GPU的Kaggle Kernels (An ...

  7. kaggle之数据分析从业者用户画像分析

    数据为kaggle社区发布的数据分析从业者问卷调查分析报告,其中涵盖了关于该行业不同维度的问题及调查结果.本文的目的为提取有用的数据,进行描述性展示.帮助新从业的人员更全方位地了解这个行业. 参考学习 ...

  8. 如何在 Kaggle 首战中进入前 10%(转)

    如何在 Kaggle 首战中进入前 10%(转) 来源:https://dnc1994.com/2016/04/rank-10-percent-in-first-kaggle-competition/ ...

  9. Kaggle金牌得主的Python数据挖掘框架,机器学习基本流程都讲清楚了

    作者 | 刘早起 来源 | 早起Python 导语:很多同学在学习机器学习时往往掉进了不停看书.刷视频的,但缺少实际项目训练的坑,有时想去练习却又找不到一个足够完整的教程,本项目翻译自kaggle入门 ...

最新文章

  1. 易语言tcp多线程服务端客户端_从TCP协议到TCP通信的各种异常现象和分析
  2. PHP程序员如何突破成长瓶颈(转)
  3. android wp8相机,体验提升明显 WP8.1相机对比专业拍摄
  4. Geary 0.13.0 发布,GNOME 3 Email 客户端应用
  5. SpringCloud Ribbon(四)之全局配置与服务配置
  6. K8S从懵圈到熟练 - 节点下线姊妹篇
  7. java 自定义注解+AOP实现日志记录
  8. getQueryString方法使用
  9. 误差反向传播法(二)【神经网络以层的方式实现】
  10. 【报告分享】2019年中国智能门锁发展与应用白皮书.pdf
  11. 华硕P4P800-X 主板南桥芯片又烧坏了......
  12. 使用Docker Swarm来运行服务
  13. 深度学习常用的数据集,包括各种数据跟图像数据
  14. 按键精灵---后台按键及鼠标操作
  15. 我的世界java版版本号_我的世界JAVA版1.17版本内容预览
  16. vc模拟 tabletpc_业力和TabletPC笔
  17. 2021世界人工智能大会开幕,百度飞桨荣获“SAIL之星”奖项
  18. Spel表达式,${property:defaultValue}
  19. leetcode - 22 672. 灯泡开关 Ⅱ
  20. Unity使用全局钩子

热门文章

  1. ListBox简单应用
  2. 电动力学每日一题 2021/10/11
  3. UA PHYS515A 电磁理论III 静磁学问题2 标量势方法与向量势方法简介
  4. SVN 图标和工具、wc.db学习
  5. java web 项目在tomcat上显示空白页的解决
  6. 电力管理信息系统数据库表总结
  7. opencv学习笔记(六)---图像梯度
  8. bootstrap-select实现下拉框多选效果
  9. kafka log4j配置
  10. AngularJS进阶学习