2020泰迪杯数据挖掘挑战赛总结(A题)
写在开始:转眼间,泰迪杯数据挖掘挑战赛已经过去了10多天,趁着结果还没出来,还有这股热乎劲,写篇文章总结下。
文章目录
- 最初
- 学习阶段
- 解题阶段
- 最终
最初
- 最初的参赛原因简单粗暴。
- 后来也渐渐发现,白嫖也的确学到不少。
- 刚开始组队,选好队友很重要,和我组队的两个队员是两个数学学院的大佬。他们每个人都对比赛特别上心。组长也及其负责,这对我们后来的讨论,学习,解题有了很大的鼓励。
学习阶段
- 在学习阶段是比赛整个阶段中对自我提升最大的阶段。那段时间真的是我整个学期学习最认真的时间,除去上课时间,每天从早学到晚,学习数据分析和机器学习。你只有学的足够深才能在解题的时候有更多的思路,更好的思考。
- 一个组三个人,一个负责写论文,一个负责算法设计,一个负责编程,身为一个准程序员,我理所应当的成了负责编程的那个人。每天跟着教学视频敲代码成了我的日常工作,有道云笔记记了很多,这些都会成为往后的知识财富。正好我也是大数据专业,数据分析也是一项基本技能。
- 偶尔会开语音讨论近期进度和对题目的理解,我们组选的是看起来较难的A题。虽然A题看起来较难,但是A题最起码全是数据,没有对文字型或其他类型数据的处理,也会好做一些。
- 在学习阶段就要多学习,认真学。需要学的不仅是教程视频。还要尽量多的百度一些论文阅读,学习别人的思路。
解题阶段
- 比赛的数据量基本上都特别大,所以运行起来就会特别慢,一般一个程序运行一个多小时都是有可能的。所以我专门为前段时间白嫖的阿里云服务器配置了Python3运行环境,用XShell远程管理,写好程序后rz上传到服务器,然后让服务器在后台运行程序,自己继续写下一部分。事实证明,这个方法很有效果,大大节省了我们运行程序的时间。
- 解题阶段要多讨论,多讨论,多讨论!不同的人对题目的理解可能不太一样。我在一开始的理解就偏离了团队的路线,后来在一次讨论中才发现并及时调整。
- 在解题中要实验多个模型,不能死追着一个模型不放,可能下一个模型就比这个模型要更好。
- 介绍一个比较好用的库pandas-profiling,可以一键生成漂亮的数据总体预览,也可以生成HTML文件。如果加在论文中,会比较好看。具体使用方法见点击直达
- 另外,代码记得写注释,文件名记得备注清楚,不然到最后整理代码的时候你能疯,别问我咋知道的。。。
最终
- 比赛结束,不论结果怎样,最起码在这个过程中我们学到了很多,这就足够了。借用我在比赛中说的一句话:参赛本来的目的就是学习,放平心态就好,得奖也好,得不了奖也罢,只要我们尽力了,在这个过程中学到东西了,那这个比赛参加的就有价值。坚持到底,就是胜利者!
- 最后祝那些参加了的和将要参加比赛的童鞋们取得好成绩,也希望我们组能够取得优异的成绩吧。
- 时间——2020年5月21日。
2020泰迪杯数据挖掘挑战赛总结(A题)相关推荐
- 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 31页省一等奖论文及代码
相关链接 (1)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统负荷预测分析 问题一Baseline方案 (2)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统 ...
- 【第十一届泰迪杯数据挖掘挑战赛】A 题:新冠疫情防控数据的分析 思路+代码(持续更新)
[第十一届泰迪杯数据挖掘挑战赛]A 题:新冠疫情防控数据的分析 思路+代码(持续更新) 问题背景 解决问题 代码下载 数据分析 Task1 Task2 Task 3 问题背景 自 2019 年底至今, ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码
[2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 23页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一
相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】C题:泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一
相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题二
相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...
- 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 问题二 时间突变分析 Python实现
目录 相关链接 完整代码下载链接 1 定义绘图函数 2 通过对原始测量应用阈值来查找异常值 3 手动设置阈值 4 使用分位数设置阈值 5 3Sigma原则(IQR) 6 设定分位数 6.1 导入数据 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
[2023年第十一届泰迪杯数据挖掘挑战赛]A题:新冠疫情防控数据的分析 32页和40页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]A题:新冠疫情防控数据的分析 ...
- 【第十一届“泰迪杯”数据挖掘挑战赛】B题产品订单的数据分析与需求预测“解题思路“”以及“代码分享”
[第十一届泰迪杯B题产品订单的数据分析与需求预测产品订单的数据分析与需求预测 ]第一大问代码分享(后续更新LSTM+informer多元预测多变量模型) PS: 代码全写有注释,通俗易懂,包看懂!!! ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
更新时间:2023-3-30 1 题目 一.背景 自2019年底至今,全国各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓 延.维持社会生活及经济秩序的正常运行是疫情防控的重要课题.大数据分析为 ...
最新文章
- 过滤一批数据_手把手教你学numpy,从此数据处理不再慌【三】
- mysql 5.6 online ddl_mysql5.6的online ddl功能测试
- 如何科学观象?生物学家建立大象行为库,参考上百篇文献,“翻译”500种大象行为...
- /etc/rsyncd.conf
- msql查询指定日期
- mysql空表_MySQL中两种快速创建空表的方式
- angularjs 路由 传参
- mysql数据库一列多值查询
- java读取html文件内容的代码_【代码审计】xyhcms3.5后台任意文件读取
- ajax通用代码,通用代码之一: 轻松使用Ajax
- Servlet自动刷新页面
- 18. MySQL 命令
- vptr初始化语义学
- 便捷的收集数据工具—Sniffer嗅探器
- 浅谈计算机网络发展方向,浅谈计算机网络的发展方向
- 史上最骚最全最详细的IO流教程,小白都能看懂!
- 超简单集成HMS Scan Kit扫码SDK,轻松实现扫码购
- 王烁老师 - 问得太少你吃亏
- writing | 如何写好一篇学术论文(三)标点符号的使用,改写段落
- [思想][励志]《真希望我20几岁就知道的事 What I Wish I Knew When I Was 20》 -- 蒂娜·齐莉格(美)...