kaggle房价预测(House Prices: Advanced Regression Techniques)数据内容超级详细整理
之前只是单纯的学习各种算法,没有实际联系过,因此决定在kaggle上先找一个入门级别的项目学习一下,希望能获得更多的知识。现在找的项目是预测房价:House Prices: Advanced Regression Techniques。链接为:https://www.kaggle.com/c/house-prices-advanced-regression-techniques/overview。
已下载数据集,但是特征数据有很多,所以决定先整理一下。
1、MSSubClass:建筑物类型
不同类型由不同的数字表示,具体如下:
20 1-STORY 1946 & NEWER ALL STYLES
30 1-STORY 1945 & OLDER
40 1-STORY W/FINISHED ATTIC ALL AGES
45 1-1/2 STORY - UNFINISHED ALL AGES
50 1-1/2 STORY FINISHED ALL AGES
60 2-STORY 1946 & NEWER
70 2-STORY 1945 & OLDER
75 2-1/2 STORY ALL AGES
80 SPLIT OR MULTI-LEVEL
85 SPLIT FOYER
90 DUPLEX - ALL STYLES AND AGES
120 1-STORY PUD (Planned Unit Development) - 1946 & NEWER
150 1-1/2 STORY PUD - ALL AGES
160 2-STORY PUD - 1946 & NEWER
180 PUD - MULTILEVEL - INCL SPLIT LEV/FOYER
190 2 FAMILY CONVERSION - ALL STYLES AND AGES
2、MSZoning:房屋销售分类
不同类型由不同的字母表示,具体如下:
A Agriculture 农业
C Commercial 商业
FV Floating Village Residential 浮村住宅
I Industrial 工业
RH Residential High Density 高密度住宅
RL Residential Low Density 低密度住宅
RP Residential Low Density Park 低密度住宅庭院
RM Residential Medium Density 中密度住宅
3、LotFrontage:与房屋相连的街道的延长英尺,就是街道的长度
4、LotArea:房屋占地面积(平方英尺)
5、Street:连接房屋的道路类型
Grvl Gravel 砾石
Pave Paved 铺平的
6、Alley: 连接房屋的胡同道路类型
Grvl Gravel 砾石
Pave Paved 铺平的
NA No alley access 没有胡同
7、LotShape: 房屋的形状
Reg Regular 规则的
IR1 Slightly irregular 轻微不规则
IR2 Moderately Irregular 中度不规则
IR3 Irregular 不规则
8、LandContour: 房屋的平坦度
Lvl Near Flat/Level 几乎平坦
Bnk Banked - Quick and significant rise from street grade to building 倾斜-从街道级快速显著上升到房屋
HLS Hillside - Significant slope from side to side 山坡-从一侧到另一侧明显的坡度
Low Depression 凹陷
9、Utilities: 可用的设施类型
AllPub All public Utilities (E,G,W,& S) 所有设施
NoSewr Electricity, Gas, and Water (Septic Tank) 电、气、水(化粪池)
NoSeWa Electricity and Gas Only 只有电和气
ELO Electricity only 只有电
10、LotConfig: 房屋布局
Inside Inside lot 内侧
Corner Corner lot 拐角
CulDSac Cul-de-sac 死胡同
FR2 Frontage on 2 sides of property 房屋两侧临街
FR3 Frontage on 3 sides of property 房屋三侧临街
11、LandSlope: 房屋的倾斜度
Gtl Gentle slope 轻微倾斜
Mod Moderate Slope 中度倾斜
Sev Severe Slope 严重倾斜
12、Neighborhood: 埃姆斯市范围内的实际位置
Blmngtn Bloomington Heights
Blueste Bluestem
BrDale Briardale
BrkSide Brookside
ClearCr Clear Creek
CollgCr College Creek
Crawfor Crawford
Edwards Edwards
Gilbert Gilbert
IDOTRR Iowa DOT and Rail Road
MeadowV Meadow Village
Mitchel Mitchell
Names North Ames
NoRidge Northridge
NPkVill Northpark Villa
NridgHt Northridge Heights
NWAmes Northwest Ames
OldTown Old Town
SWISU South & West of Iowa State University
Sawyer Sawyer
SawyerW Sawyer West
Somerst Somerset
StoneBr Stone Brook
Timber Timberland
Veenker Veenker
13、Condition1: 邻近主要道路或铁路
Artery Adjacent to arterial street 邻近主干道
Feedr Adjacent to feeder street 邻近干线道
Norm Normal 一般
RRNn Within 200' of North-South Railroad 南北铁路200'以内
RRAn Adjacent to North-South Railroad 邻近南北铁路
PosN Near positive off-site feature--park, greenbelt, etc. 靠近正场外特征-公园、绿地等
PosA Adjacent to postive off-site feature 邻近正场外特征
RRNe Within 200' of East-West Railroad 东西铁路200'以内
RRAe Adjacent to East-West Railroad 邻近东西铁路
14、Condition2: 邻近主要道路或铁路,如果有二个存在
Artery Adjacent to arterial street
Feedr Adjacent to feeder street
Norm Normal
RRNn Within 200' of North-South Railroad
RRAn Adjacent to North-South Railroad
PosN Near positive off-site feature--park, greenbelt, etc.
PosA Adjacent to postive off-site feature
RRNe Within 200' of East-West Railroad
RRAe Adjacent to East-West Railroad
15、BldgType: 住宅类型
1Fam Single-family Detached 单独的独户
2FmCon Two-family Conversion; originally built as one-family dwelling 双户转换,但建成一户住宅的样子
Duplx Duplex 双层公寓
TwnhsE Townhouse End Unit 联排别墅末端房屋
TwnhsI Townhouse Inside Unit 联排别墅里面房屋
16、HouseStyle:住宅样式
1Story One story 平房
1.5Fin One and one-half story: 2nd level finished 一层半房:第二层完成
1.5Unf One and one-half story: 2nd level unfinished 一层半房:第二层未完成
2Story Two story 两层
2.5Fin Two and one-half story: 2nd level finished 两层半房:第二层完成
2.5Unf Two and one-half story: 2nd level unfinished 两层半房:第二层未完成
SFoyer Split Foyer 分门厅
SLvl Split Level 错层式
17、OverallQual: 对房子的整体材料和装修进行评级
10 Very Excellent
9 Excellent
8 Very Good
7 Good
6 Above Average
5 Average
4 Below Average
3 Fair
2 Poor
1 Very Poor
18、OverallCond: 评估房子的整体状况
10 Very Excellent
9 Excellent
8 Very Good
7 Good
6 Above Average
5 Average
4 Below Average
3 Fair
2 Poor
1 Very Poor
19、YearBuilt: 原施工日期
20、YearRemodAdd: 改造日期(如无改造或增加,与施工日期相同)
21、RoofStyle:屋顶类型
Flat Flat 平坦的
Gable Gable 三角墙
Gambrel Gabrel (Barn) 谷仓
Hip Hip 斜脊
Mansard Mansard 折线型屋顶
Shed Shed 棚式
22、RoofMatl: 屋顶材料
ClyTile Clay or Tile
CompShg Standard (Composite) Shingle
Membran Membrane
Metal Metal
Roll Roll
Tar&Grv Gravel & Tar
WdShake Wood Shakes
WdShngl Wood Shingles
23、Exterior1st:房屋外部遮盖物
AsbShng Asbestos Shingles
AsphShn Asphalt Shingles
BrkComm Brick Common
BrkFace Brick Face
CBlock Cinder Block
CemntBd Cement Board
HdBoard Hard Board
ImStucc Imitation Stucco
MetalSd Metal Siding
Other Other
Plywood Plywood
PreCast PreCast
Stone Stone
Stucco Stucco
VinylSd Vinyl Siding
Wd Sdng Wood Siding
WdShing Wood Shingles
24、Exterior2nd: 房屋外部遮盖物(如果不止一种材料)
AsbShng Asbestos Shingles
AsphShn Asphalt Shingles
BrkComm Brick Common
BrkFace Brick Face
CBlock Cinder Block
CemntBd Cement Board
HdBoard Hard Board
ImStucc Imitation Stucco
MetalSd Metal Siding
Other Other
Plywood Plywood
PreCast PreCast
Stone Stone
Stucco Stucco
VinylSd Vinyl Siding
Wd Sdng Wood Siding
WdShing Wood Shingles
25、MasVnrType: 砖石饰面类型
BrkCmn Brick Common
BrkFace Brick Face
CBlock Cinder Block
None None
Stone Stone
26、MasVnrArea: 砖石饰面面积(平方英尺)
27、ExterQual: 评估外部材料的质量
Ex Excellent
Gd Good
TA Average/Typical
Fa Fair
Po Poor
28、ExterCond:评估外部材料的现状
Ex Excellent
Gd Good
TA Average/Typical
Fa Fair
Po Poor
29、Foundation: 基础类型
BrkTil Brick & Tile
CBlock Cinder Block
PConc Poured Contrete
Slab Slab
Stone Stone
Wood Wood
30、BsmtQual: 评估地下室高度
Ex Excellent (100+ inches)
Gd Good (90-99 inches)
TA Typical (80-89 inches)
Fa Fair (70-79 inches)
Po Poor (<70 inches
NA No Basement
31、BsmtCond:评估地下室总体情况
Ex Excellent
Gd Good
TA Typical - slight dampness allowed
Fa Fair - dampness or some cracking or settling
Po Poor - Severe cracking, settling, or wetness
NA No Basement
32、BsmtExposure: 根据步行或花园级地下室墙壁
Gd Good Exposure
Av Average Exposure (split levels or foyers typically score average or above)
Mn Mimimum Exposure
No No Exposure
NA No Basement
33、BsmtFinType1:地下室完工面积等级
GLQ Good Living Quarters
ALQ Average Living Quarters
BLQ Below Average Living Quarters
Rec Average Rec Room
LwQ Low Quality
Unf Unfinshed
NA No Basement
34、BsmtFinSF1: 地下室完工面积(平方英尺)
35、BsmtFinType2: 地下室完工面积等级(如果有多种类型)
36、BsmtFinSF2: 地下室完工等级2的面积(平方英尺)
37、BsmtUnfSF: 未完工地下室面积(平方英尺)
38、TotalBsmtSF: 地下室总面积(平方英尺)
39、Heating: 供暖系统类型
Floor Floor Furnace
GasA Gas forced warm air furnace
GasW Gas hot water or steam heat
Grav Gravity furnace
OthW Hot water or steam heat other than gas
Wall Wall furnace
40、HeatingQC:供暖系统质量和情况
Ex Excellent
Gd Good
TA Average/Typical
Fa Fair
Po Poor
41、CentralAir: 中央空调
N No
Y Yes
42、Electrical: 电力系统
SBrkr Standard Circuit Breakers & Romex
FuseA Fuse Box over 60 AMP and all Romex wiring (Average)
FuseF 60 AMP Fuse Box and mostly Romex wiring (Fair)
FuseP 60 AMP Fuse Box and mostly knob & tube wiring (poor)
Mix Mixed
43、1stFlrSF:一楼面积(平方英尺)
44、2ndFlrSF: 二楼面积(平方英尺)
45、 LowQualFinSF: 所有楼层已完工的低质量面积(平方英尺)
46、 GrLivArea: 地面上生活面积(平方英尺)
47、BsmtFullBath:地下室全浴室
48、BsmtHalfBath: 地下室一半浴室
49、FullBath: 地面上所有浴室
50、HalfBath: 地面上一半浴室
51、BedroomAbvGr: 地面上卧室(不包括地下室卧室)
52、KitchenAbvGr:地面上厨房
53、KitchenQual: 厨房质量
Ex Excellent
Gd Good
TA Typical/Average
Fa Fair
Po Poor
54、TotRmsAbvGrd: 地面上所有房间(不包括浴室)
55、Functional: 家庭功能(假设是典型的,除非有必要扣除)
Typ Typical Functionality
Min1 Minor Deductions 1
Min2 Minor Deductions 2
Mod Moderate Deductions
Maj1 Major Deductions 1
Maj2 Major Deductions 2
Sev Severely Damaged
Sal Salvage only
56、Fireplaces: 壁炉数量
57、FireplaceQu: 壁炉质量
Ex Excellent - Exceptional Masonry Fireplace
Gd Good - Masonry Fireplace in main level
TA Average - Prefabricated Fireplace in main living area or Masonry Fireplace in basement
Fa Fair - Prefabricated Fireplace in basement
Po Poor - Ben Franklin Stove
NA No Fireplace
58、GarageType: 车库位置
2Types More than one type of garage
Attchd Attached to home
Basment Basement Garage
BuiltIn Built-In (Garage part of house - typically has room above garage)
CarPort Car Port
Detchd Detached from home
NA No Garage
59、GarageYrBlt: 车库建成年份
60、GarageFinish:车库内部完成度
Fin Finished
RFn Rough Finished
Unf Unfinished
NA No Garage
61、GarageCars: 车位大小
62、GarageArea:车库面积(平方英尺)
63、GarageQual: 车库质量
Ex Excellent
Gd Good
TA Typical/Average
Fa Fair
Po Poor
NA No Garage
64、GarageCond:车库情况
Ex Excellent
Gd Good
TA Typical/Average
Fa Fair
Po Poor
NA No Garage
65、PavedDrive: 铺砌车道
Y Paved
P Partial Pavement
N Dirt/Gravel
66、WoodDeckSF:木甲板面积(平方英尺)
67、OpenPorchSF: 开放式门廊面积(平方英尺)
68、EnclosedPorch: 封闭门廊面积(平方英尺)
69、3SsnPorch: 三季门廊面积(平方英尺)
70、ScreenPorch: 屏风门廊面积(平方英尺)
71、PoolArea: 游泳池面积(平方英尺)
72、PoolQC: 游泳池质量
Ex Excellent
Gd Good
TA Average/Typical
Fa Fair
NA No Pool
73、Fence: 围栏质量
GdPrv Good Privacy
MnPrv Minimum Privacy
GdWo Good Wood
MnWw Minimum Wood/Wire
NA No Fence
74、MiscFeature: 其他类别未涵盖的其他功能
Elev Elevator
Gar2 2nd Garage (if not described in garage section)
Othr Other
Shed Shed (over 100 SF)
TenC Tennis Court
NA None
75、MiscVal: 其它功能的价值(美元)
76、MoSold: 月售出 (MM)
77、YrSold: 年售出(YYYY)
78、SaleType: 销售类型
WD Warranty Deed - Conventional
CWD Warranty Deed - Cash
VWD Warranty Deed - VA Loan
New Home just constructed and sold
COD Court Officer Deed/Estate
Con Contract 15% Down payment regular terms
ConLw Contract Low Down payment and low interest
ConLI Contract Low Interest
ConLD Contract Low Down
Oth Other
79、SaleCondition: 销售情况
Normal Normal Sale
Abnorml Abnormal Sale - trade, foreclosure, short sale
AdjLand Adjoining Land Purchase
Alloca Allocation - two linked properties with separate deeds, typically condo with a garage unit
Family Sale between family members
Partial Home was not completed when last assessed (associated with New Homes)
80、SalePrice: 销售价格
kaggle房价预测(House Prices: Advanced Regression Techniques)数据内容超级详细整理相关推荐
- Kaggle: House Prices: Advanced Regression Techniques
Kaggle: House Prices: Advanced Regression Techniques notebook来自https://www.kaggle.com/neviadomski/ho ...
- kaggle房价预测(House Prices: Advanced Regression Techniques)详解
这几天做kaggle上的房价预测题目,有一些需要记录的点. 1.当数据是skew的时候需要进行log操作,比如这里的房价 之后可以把所有偏度大于一个阈值的都log化,至于偏度相关的知识,请看https ...
- Kaggle比赛(二)House Prices: Advanced Regression Techniques
房价预测是我入门Kaggle的第二个比赛,参考学习了他人的一篇优秀教程:https://www.kaggle.com/serigne/stacked-regressions-top-4-on-lead ...
- House Prices: Advanced Regression Techniques(房价预测)
问题背景:购房者需要购买梦想中的房子,你需要从房子的79个变量中预测房子的价格是多少. 分为以下几个步骤: 导入数据观察每个变量特征的意义以及对于房价的重要程度 筛选出主要影响房价的变量 清洗和转换变 ...
- kaggle房价预测特征意思_R语言实战:复杂数据处理和分析之Kaggle房价预测
1)明确分析的目的 本次数据分析的数据来源于kaggle上有关于房价预测,数据来源:House Prices: Advanced Regression Techniques.此次的分析目的已经很明确了 ...
- kaggle房价预测特征意思_Kaggle之预测房价
分析背景 要求购房者描述他们梦想中的房子,他们可能不会从地下室天花板的高度或靠近东西方铁路开始.但是这个游乐场比赛的数据集证明了价格谈判比卧室或白色栅栏的数量更多. 有79个解释变量描述(几乎)爱荷华 ...
- 0907实战KAGGLE房价预测数据
数据集: 本文主要对KAGGLE房价预测数据进行预测,并提供模型的设计以及超参数的选择. 该数据集共有1460个数据样本,80个样本特征 数据集介绍可参照: House Prices - Adv ...
- 【学习记录】Kaggle房价预测
问题描述: 让购房者描述他们梦想中的房子,他们可能不会从地下室的天花板的高度或者是距离铁路的距离来考虑.但是这个数据集可以包含了影响房价的因素.79 个解释变量(几乎)描述了爱荷华州艾姆斯住宅的各个方 ...
- kaggle房价预测-回归模型
目录 1 项目背景 2 初始数据分析 目标值分析 特征与目标值相关性 变量特征相关性 3 数据预处理 目标变量正态分布化 异常值处理 缺失值处理 转换特征 保存训练集和测试集 4 模型预测 岭回归 l ...
最新文章
- Word、Acrobat 中的朗读功能
- 印制塑料卡片中的IC芯片
- 新冠疫苗厂商科兴成立房地产公司?网友:准备打疫苗送房子了?
- python基础补充内容
- linux查看磁盘挂载的三种方法
- html 显示状态条,怎么控制html5 video 控制条显示和隐藏时间
- 基于密度的停留点识别方法
- Eclipse 插件ibeetl
- ckEditor使用JS代码调用的方法
- Cloudstack
- 分类信息网站模板(ICP许可证)已通过审核-两套样式模板
- python创建空文本文件_Python空白txt文件创建
- 线性系统和非线性系统——《应用非线性动力学》读书笔记
- 卸载wps后安装office图标异常的问题
- php 抽奖活动_PHP实现活动人选抽奖功能
- mac注销快捷键_mac关机的快捷键,不要强制关机。
- 内积、外积、元素积、克罗内克积的区分及用法【python】
- 经典机器学习算法:k近邻法
- mysql 一个月以前_mysql查询昨天 一周前 一月前 一年前的数据
- Leaflet修改地图中心点定位
热门文章
- 计算机是如何启动的 阮一峰,计算机是如何启动的? - 阮一峰的网络日志.pdf
- express实现多级路由文件
- java编写的媒体播放器_BlogJava: 用Java构造自己的媒体播放器
- 如何利用计算机知识月入过万,干货丨如何在一个月内通过高级软考证
- 51Nod-1166大数开平方(java版本)
- Django blog项目《二十五》:项目优化《1》使用celery异步任务和定时任务
- 子查询作为检索表时的不同使用场景以及是否需要添加别名的问题
- 千万别小看任何一个穷人
- 量子不确定性包含什么
- [HTMLDOM]onmousedown、onmouseup 以及onclick事件触发顺序