一、2021中兴捧月杯算法赛

本次比赛我参加的是迪杰斯特拉门派,题目是人口流量预测。最终成绩:西北区域优胜奖,38/500,初赛全国前50可进入复赛,获得区域优胜,然后组织面试,根据面试结果,大概15人左右可进入全国总决赛。总体来说,中兴算法赛的难度不是很大(但想做得好冲击国奖还是很有难度),且可获得很多招聘机会,非常推荐大家参加。

初赛一阶段

给定训练数据集(传感器ID,日期,流量),测试数据集(传感器ID,日期(后91天)),完成流量预测任务。
其实这个赛题的难度就在于数据处理方面,有的传感器可能损坏或者出现测量噪声,数据可能缺失或者异常,而且提供的特征只有ID号和日期,这都增加了比赛的难度。
初赛我利用决策树和随机森林作了很多尝试,有效果提升,但不够好,LGB和XGB出现了很差的效果,而且一直不知道什么原因(可能特征太少?)。最后还是5天的滑动平均效果最好。。。

初赛二阶段

初赛二阶段其实和初赛一阶段差不多,就是增加了传感器和数据量,总数据量好像在千万级别。
这一阶段我做了更多特征工程的工作,直接将当时的笔记搬过来:
一、 数据处理
1.1预处理

初赛第二阶段的数据较第一阶段增加了ID数目和数据量。经检查,没有发现重复值、缺失值,只发现三行数据的“value”值大于100,视为异常值,直接删除。
1.2构造特征
初始特征:id(1)
年月日特征(4)
累积天数特征(6)
周几特征(7)
季节特征(8)
年月周one-hot(29)
周末特征(30)
上中下旬特征及one-hot(34)
月份,星期组合特征(37)

将滑动平均值也作为特征:
4天滑动平均:roll4_last
特征归一化

除此之外,尝试过7、14、28天的滑动均值,平均流量,均值分箱等特征,但效果均不好;

1.3划分数据集
按时间序列划分训练集、测试集,训练集最大是第715天(以2017-1-1为起始),以91天作为验证集,则[625:]为验证集,不足的划分到训练集里面!

二、 模型训练
2.1 滑动均值baseline

以4天为窗口对每个ID作滑动均值,并将每个ID的最后一天的滑动均值roll4_last作为赛题测试集的预测值:
在自己的验证集得分为68.914分,在赛题测试集上得分为62.865分。

2.2 基于树模型
(1)基于所有构造的特征,不进行任何处理效果很差
(2)利用决策树,挑选特征,在赛题测试集上可以取得61分
(3)利用PCA+LGBM,在自己验证集上得分58,在赛题测试集上效果不好

2.3 其他尝试
(1)注意到value值的严重偏态分布,使用对数变换、boxcox变换,效果有微弱提升,但不明显;
(2)注意到赛题评分的20%误差,尝试修改损失函数权重,使大于20%误差的梯度加大,但结果也无明显提升;
(3)根据每个ID的平均流量来划分区域,分区域预测:
ave_value > 80 : 看最后一天是否是100,是则输出100,不是则输出nan
43 < ave_value <= 80
17 < ave_value <= 43
10 < ave_value <= 17
5 < ave_value <= 10
1 < ave_value <= 5
0 < ave_value <= 1
ave_value == 0 : 输出nan
ave_value == -1 :
效果也无提升。

复赛

复赛采取线上面试的形式,两个面试官,一个负责询问比赛建模过程,另一个负责问其他方面。

总结

这个题的数据有点变态,以后在数据处理、特征工程上还要下很大功夫。

二、2021模面大赛

本次模拟面试赛旨在通过提前模拟面试,提高同学们的面试技巧与能力,获奖者还可提前获得校招直通终面的资格。我本来报名了,但后来由于时间安排和其它原因没有参赛,全程只听了第一场宣讲讲座,有一个交大的大学长作了关于面试技巧的分享,个人觉得有所收获,现把它总结如下,希望对明年的自己和校招的朋友们有所帮助。

标题:面试“十问”

1.简历和面试的关系是什么?
简历是为了获得面试资格,针对不同的求职岗位,简历需要具有针对性,每份简历为不同公司独家定制
2.面试的核心逻辑是什么?
仔细了解岗位描述,思考公司需要什么样的人?我就是你想要的人,我做好了哪些准备,所以我来面试。
3.面试的第一个问题是什么?
自我介绍,有一个重点:我这次来应聘什么岗位,我很愿意加入!
4.面试的最后一个问题?
反问环节,注意你的面试官是负责专业面的,不要问薪资这类HR的问题,通常比较喜欢回答的是入职之后的培训问题和晋升机制相关问题。
5.应该如何介绍自己的项目?
逻辑:什么项目?在其中扮演什么角色?使用什么软件、工具、技巧、语言?取得了什么收获?注意最好有量化数据!
6.以何种心态、姿态面对考官?
不卑不亢、破釜沉舟,注意压力面试问题。
7.群体面试如何应对?
技术类面试,一般没有“群面”(无领导面试)。
8.如何回答压根就不会的问题?
(1)勇敢承认自己不会;(2)我认为…,我猜想…,尝试解决问题,尝试给出思路…;(3)反客为主,虽然我不会…,但我在另一个方面…比较强。
9.面试中我注意过自己的礼仪吗?
老师问了问题,思考几秒再作回答,以表稳重。
10.我准备好了吗?

2021中兴捧月杯算法大赛模面大赛总结相关推荐

  1. “中兴捧月”杯 校园赛事嘉年华 | 程序设计大赛(初赛) | 数字化婚姻尝试配对

    一.标题:     数字化婚姻配对尝试 二.题目: 建立一个模型,来模拟推导社会男女择偶过程. 为了模型简化,一个人的特性指标有三个,这里假设为财富.样貌.品格,每个指标均可取值1-100之间任意数字 ...

  2. “中兴捧月”报文监视器的实现

    前一段时间和几个好友组队参加了中兴举办的"中兴捧月杯"程序设计大赛,跌跌撞撞竟然进了复赛,不过最终还是没能入围区域决赛,还是感觉很遗憾.这里把当时复赛的题目以及我们被Out的代码拿 ...

  3. 2020中兴捧月算法大赛-阿尔法(MOT)赛道--赛后总结

    比赛结束了,很荣幸拿到了中兴捧月算法大赛 MOT赛道 全国总决赛第二名的亚军奖杯,这估计也是我找到工作前最后一个比赛了,收获满满,下面算是自己给自己写的一个简单的赛后总结,做的比较粗糙,细节也就不多赘 ...

  4. 2020年中兴捧月算法大赛---埃德加考特派赛题解析及代码

    写在前面 三月份疫情期间在家闲来无事, 各大公司举办了很多的算法比赛, 但是大多是人工智能相关, 而我这个菜鸡又不会这方面的, 这时发现了中兴捧月的埃德加考特派赛道, 也就是数据库相关本科课设, 恰好 ...

  5. 谈谈中兴捧月大赛决赛以及总结

    前言 四月份,在师兄的推荐下,报名参加了中兴捧月大赛.一开始只是为了混一个面笔试的资格(因为提交有效成绩即可免笔试),然后为了找一个简单的赛道,注册了几个号看了两三个赛道的题目.发现自己每个都不熟悉, ...

  6. 2020中兴捧月算法赛道傅里叶派赛题菜鸡回顾

    最近抱着试水的心理参加了2020中兴捧月算法大赛傅里叶派赛题.从4.19号由旁观者转变为参赛者,到5.8号提交完成最后的文档和代码,前后算起来也有20天了.虽然自己比较菜,但毕竟是第一次参加这种比较正 ...

  7. 中兴捧月大赛之方案探讨

    昨天参加完中兴捧月的决赛,感觉特别的糟糕.说实话,感觉中兴这次比赛搞得真的很奇葩!一是比赛搞得让我觉得公司对整个比赛的态度有点随意,有点不正式.二是比赛的赛题要求每天都在变,感觉不天天关注活动交流区, ...

  8. 2023第十三届“中兴捧月”全球精英挑战赛今日正式启动

    3月31日,第十三届"中兴捧月"全球精英挑战赛正式启动! 由中兴通讯主办的"中兴捧月"大赛,自2009年首次举办至今,已走过13个年头,是广大高校师生的重点关注 ...

  9. Deepsort_V2 2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名

    2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名方案 初赛:多目标跟踪:指标MOTA和MOTP, 后期的大量实验证明检测算法相对于跟踪更重要. 数据集分析: 1.人群密集稀疏场景: 2.场景(白天 ...

  10. 2019中兴捧月算法大赛历程

    1.初赛 题目是网络流量均衡.再带宽限制的图中求不同请求带宽的各条业务的最短路径使总成本最小. 解题思路: 对业务进行排序,优先级高的业务去走热点链路,优先级低的业务发现热点链路已经达到带宽上限就绕路 ...

最新文章

  1. ubuntu创建vim php文件,在ubuntu 上配置vim的php开发环境
  2. 阿里的“扫地僧”,2年“抄”了20万页古籍
  3. Nginx源码研究之nginx限流模块详解
  4. cidaemon.exe是什么进程及如何关闭cidaemon.exe进程
  5. 2.Ridge Regression 岭回归
  6. WebsocketWebSSH
  7. laravel-admin 中怎么给 grid 的列添加行数序号
  8. design短语的用法总结_design的意思、用法、搭配和例句
  9. key store是否创建_EKS-实践一 创建EKS集群
  10. linux 命令详解 十六
  11. america/los_angeles 时区 java_在Java ME中将“America / Los Angeles”时区转换为“PST”或“PDT”...
  12. [科研自学神器]中国大学MOOC下载器
  13. 情人节送男生什么礼物好,情人节送礼清单
  14. 统一网关Gateway
  15. 使用h5制作一个五子棋游戏
  16. 浙大MPA常规批复试上岸经验分享
  17. win7 锁定后硬盘灯常亮
  18. 海康硬盘录像机报警输出配置设置
  19. 【SLAM】LIO-SAM解析——后端优化mapOptimization(5)
  20. 程序员如何选择有价值的开源方向?

热门文章

  1. 使用fiddler+itunes来做到下载APP在AppStore中的历史版本 注意事项
  2. Beego 使用redigo连接redis
  3. Flash动画短片制作流程注意点
  4. VS2010中文版莫名的错误
  5. PLC十字路口交通灯设计
  6. 计算机辅助模具设计实训心得6,模具设计实训心得体会3篇
  7. 关于字符编码与word微软雅黑字体的抽风浅析
  8. 只需45秒,用Python给故宫画一组雪景手绘图
  9. Eclipse快捷键 10个最有用的快捷键
  10. Oracle 数据库的常用备份方法