写在开始:转眼间,泰迪杯数据挖掘挑战赛已经过去了10多天,趁着结果还没出来,还有这股热乎劲,写篇文章总结下。

文章目录

  • 最初
  • 学习阶段
  • 解题阶段
  • 最终

最初

  • 最初的参赛原因简单粗暴。
  • 后来也渐渐发现,白嫖也的确学到不少。
  • 刚开始组队,选好队友很重要,和我组队的两个队员是两个数学学院的大佬。他们每个人都对比赛特别上心。组长也及其负责,这对我们后来的讨论,学习,解题有了很大的鼓励。

学习阶段

  • 在学习阶段是比赛整个阶段中对自我提升最大的阶段。那段时间真的是我整个学期学习最认真的时间,除去上课时间,每天从早学到晚,学习数据分析和机器学习。你只有学的足够深才能在解题的时候有更多的思路,更好的思考。
  • 一个组三个人,一个负责写论文,一个负责算法设计,一个负责编程,身为一个准程序员,我理所应当的成了负责编程的那个人。每天跟着教学视频敲代码成了我的日常工作,有道云笔记记了很多,这些都会成为往后的知识财富。正好我也是大数据专业,数据分析也是一项基本技能。
  • 偶尔会开语音讨论近期进度和对题目的理解,我们组选的是看起来较难的A题。虽然A题看起来较难,但是A题最起码全是数据,没有对文字型或其他类型数据的处理,也会好做一些。
  • 在学习阶段就要多学习,认真学。需要学的不仅是教程视频。还要尽量多的百度一些论文阅读,学习别人的思路。

解题阶段

  • 比赛的数据量基本上都特别大,所以运行起来就会特别慢,一般一个程序运行一个多小时都是有可能的。所以我专门为前段时间白嫖的阿里云服务器配置了Python3运行环境,用XShell远程管理,写好程序后rz上传到服务器,然后让服务器在后台运行程序,自己继续写下一部分。事实证明,这个方法很有效果,大大节省了我们运行程序的时间。
  • 解题阶段要多讨论,多讨论,多讨论!不同的人对题目的理解可能不太一样。我在一开始的理解就偏离了团队的路线,后来在一次讨论中才发现并及时调整。
  • 在解题中要实验多个模型,不能死追着一个模型不放,可能下一个模型就比这个模型要更好。
  • 介绍一个比较好用的库pandas-profiling,可以一键生成漂亮的数据总体预览,也可以生成HTML文件。如果加在论文中,会比较好看。具体使用方法见点击直达
  • 另外,代码记得写注释,文件名记得备注清楚,不然到最后整理代码的时候你能疯,别问我咋知道的。。。

最终

  • 比赛结束,不论结果怎样,最起码在这个过程中我们学到了很多,这就足够了。借用我在比赛中说的一句话:参赛本来的目的就是学习,放平心态就好,得奖也好,得不了奖也罢,只要我们尽力了,在这个过程中学到东西了,那这个比赛参加的就有价值。坚持到底,就是胜利者!
  • 最后祝那些参加了的和将要参加比赛的童鞋们取得好成绩,也希望我们组能够取得优异的成绩吧。
  • 时间——2020年5月21日。

2020泰迪杯数据挖掘挑战赛总结(A题)相关推荐

  1. 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 31页省一等奖论文及代码

    相关链接 (1)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统负荷预测分析 问题一Baseline方案 (2)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统 ...

  2. 【第十一届泰迪杯数据挖掘挑战赛】A 题:新冠疫情防控数据的分析 思路+代码(持续更新)

    [第十一届泰迪杯数据挖掘挑战赛]A 题:新冠疫情防控数据的分析 思路+代码(持续更新) 问题背景 解决问题 代码下载 数据分析 Task1 Task2 Task 3 问题背景 自 2019 年底至今, ...

  3. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码

    [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 23页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预 ...

  4. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一

    相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...

  5. 【2023年第十一届泰迪杯数据挖掘挑战赛】C题:泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一

    相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职 ...

  6. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题二

    相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...

  7. 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 问题二 时间突变分析 Python实现

    目录 相关链接 完整代码下载链接 1 定义绘图函数 2 通过对原始测量应用阈值来查找异常值 3 手动设置阈值 4 使用分位数设置阈值 5 3Sigma原则(IQR) 6 设定分位数 6.1 导入数据 ...

  8. 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

    [2023年第十一届泰迪杯数据挖掘挑战赛]A题:新冠疫情防控数据的分析 32页和40页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]A题:新冠疫情防控数据的分析 ...

  9. 【第十一届“泰迪杯”数据挖掘挑战赛】B题产品订单的数据分析与需求预测“解题思路“”以及“代码分享”

    [第十一届泰迪杯B题产品订单的数据分析与需求预测产品订单的数据分析与需求预测 ]第一大问代码分享(后续更新LSTM+informer多元预测多变量模型) PS: 代码全写有注释,通俗易懂,包看懂!!! ...

  10. 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解

    更新时间:2023-3-30 1 题目 一.背景 自2019年底至今,全国各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓 延.维持社会生活及经济秩序的正常运行是疫情防控的重要课题.大数据分析为 ...

最新文章

  1. 过滤一批数据_手把手教你学numpy,从此数据处理不再慌【三】
  2. mysql 5.6 online ddl_mysql5.6的online ddl功能测试
  3. 如何科学观象?生物学家建立大象行为库,参考上百篇文献,“翻译”500种大象行为...
  4. /etc/rsyncd.conf
  5. msql查询指定日期
  6. mysql空表_MySQL中两种快速创建空表的方式
  7. angularjs 路由 传参
  8. mysql数据库一列多值查询
  9. java读取html文件内容的代码_【代码审计】xyhcms3.5后台任意文件读取
  10. ajax通用代码,通用代码之一: 轻松使用Ajax
  11. Servlet自动刷新页面
  12. 18. MySQL 命令
  13. vptr初始化语义学
  14. 便捷的收集数据工具—Sniffer嗅探器
  15. 浅谈计算机网络发展方向,浅谈计算机网络的发展方向
  16. 史上最骚最全最详细的IO流教程,小白都能看懂!
  17. 超简单集成HMS Scan Kit扫码SDK,轻松实现扫码购
  18. 王烁老师 - 问得太少你吃亏
  19. writing | 如何写好一篇学术论文(三)标点符号的使用,改写段落
  20. [思想][励志]《真希望我20几岁就知道的事 What I Wish I Knew When I Was 20》 -- 蒂娜·齐莉格(美)...

热门文章

  1. 《机器人学导论》约翰 第二章
  2. Java反序列化漏洞之殇
  3. 开心网为何不再开心了
  4. windows如何离线打补丁安全需知
  5. Windows 运行jar包
  6. 三成手机电子书暗藏陷阱 诱骗下载强行吸费
  7. 第9章、图像按钮ImageButton(从零开始学Android)
  8. Flutter 自定义 ImageButton
  9. ASP.NET 路由实现页面静态化
  10. 计算机毕业论文java毕业设计论文题目基于SpringBoot项目源码旅游信息管理系统[包运行成功]