Sberbank Russian Housing Market比赛总结
第一次真正意义上参加kaggle比赛,都是工作之余看看别人的kernel,然后整理整理自己的分析代码。
总体来说,本次比赛对我而言更像一个入门比赛,更多的是走走kaggle比赛的整个流程,看看高手们都是怎么分析解决问题的。一边学习技术、理论知识、分析问题的思路,一边研究比赛题目。结果不是最重要的,最重要的收获与进步!
本次比赛总结启示:
1)没有充分考虑房屋价格随时间的变化,因为房间一段时间是涨价的,一段时间是降价的。本次俄罗斯房价训练数据从2011-2015.6,测试数据从2015.7月开始,所以测试数据跟训练数据的后部分数据关系最为密切。因为2015年开始房价是开始下跌趋势,所以测试数据应该也是这样的,这点没有关注到。
2)看kernel里面很多人把train的房屋价格乘以一个magic number,比如0.969等等,效果确实不错。一开始不太理解,现在明白了,因为他们看到了测试数据是走低的趋势,所以把整个训练数据的价格都调低,这样训练出来的模型预测的价格就会偏低,进而更接近测试数据。我认为该方法并不太可取,这样做也许在该比赛确实能得到较好的效果。但是模型仅仅适应这一部分数据,overfitting了,没有什么泛化能力。
3)价格的走低,其实是与经济因素密切关联的,所以有人就利用经济方便的特征对价格做了修正,比如将价格除以某个经济指标,预测后再还原价格,这样就不需要什么maigic number。
4)没有对预测价格做Ensemble
5)特征工程做的不够充分,没有充分挖掘特征信息,创造新特征。
6)其它人解决思路:
转载于:https://www.cnblogs.com/gczr/p/7136924.html
Sberbank Russian Housing Market比赛总结相关推荐
- China‘s Housing Market Economy Is Crumbling
Evergrandes: The Evergrande Group n. 恒大集团 collapse /kəˈlæps/ v./n. 崩溃,崩塌 rapidly adv. 快速地,迅 ...
- 【Kaggle】 Russia房产价格预测top1%(22/3270)方案总结
一起加入这次沉浸式学习吧,本次分享的方案基本上包好了结构化数据比赛的基本流程:数据分析.数据预处理,特征工程.模型训练以及模型融合,大家可以留在周末学习一波. 比赛名称:Sberbank Russia ...
- Kaggle比赛整理
传送门:https://www.kaggle.com/competitions点击打开链接 这里仅列出前50个比赛,全部的271个比赛word版下载地址: 正在进行的比赛 1. Home Cr ...
- 数据(机器学习/深度学习)竞赛平台——Kaggle
这篇文章适合那些刚接触Kaggle.想尽快熟悉Kaggle并且了解项目情况的朋友.本文分为两部分介绍Kaggle,Part One简单介绍Kaggle,Part Two将简单介绍正规的竞赛的项目,大家 ...
- 【转载】数据(机器学习/深度学习)竞赛平台——Kaggle 置顶
这篇文章适合那些刚接触Kaggle.想尽快熟悉Kaggle并且了解项目情况的朋友.本文分为两部分介绍Kaggle,Part One简单介绍Kaggle,Part Two将简单介绍正规的竞赛的项目,大家 ...
- 机器学习里的bias的一些处理方法和思考
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:砍手豪 链接:https://zhuanlan.zhihu. ...
- 免费资源_第三篇 竞赛(1)_Kaggle
Kaggle传送门:点击打开链接 这里仅列出前50个比赛,全部的271个比赛word版下载地址: 正在进行的比赛 1. Home Credit Default Risk 利用各种替代数据(包括 ...
- 【机器学习基础】回归相关指标优化
作者: 尘沙杰少.谢嘉嘉.DOTA.有夕 赛题理解,分析,规划之回归相关指标优化 此处我们列举kaggle过往几年中,在回归问题中经常出现的一些评估指标,因为在数据竞赛中我们更多的是考虑在特定评测指标 ...
- Covariate Shift(协变量偏移)
转载于https://zhuanlan.zhihu.com/p/205183444 此系列文章为笔者学习工作中的阶段性总结,难免有纰漏,如有不正之处,欢迎指正,大家共同成长. Covariate Sh ...
最新文章
- 《LeetCode力扣练习》剑指 Offer 15. 二进制中1的个数 Java
- vue无缝滚动的插件开发填坑分享
- echarts地图罗平县的json_Echarts全国省市区县地图数据文件(含js及json)
- RSGAN:对抗模型中的“图灵测试”思想
- C++ primer 第8章 IO库
- 五光十色的白,荣耀9X PRO全息冰岛白正式开售
- jQuery - 按回车键触发跳转
- 拓端tecdat:R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性
- php数据类型之自动转换和强制转换
- 如何给linux添加新硬盘(转)
- ass字幕转换成文本文件
- SEO优化之alt属性和title属性
- PNP与NPN的转换电路
- 数理统计实(试)验—双因素方差分析(有交互作用)excel操作分析方差分析表怎么看?
- Java学习笔记-Lambda表达式
- jQuery下载所有版本(实时更新……)
- 雷泰RAYR3I2MSCL3+高温红外测温仪的参数指标
- Hive的内置HASH()函数使用哪种哈希算法
- AIR780E使用AT连接TCP收发数据
- java小组坦克大战游戏开发文档开发日志_java实现坦克大战游戏