前言

今天是2022年1月10日,决赛答辩在1月7日结束了,最终取得了第二名的成绩,拿到了浦发银行和百度智能云的招聘绿色通道和5万奖金,可以说是我人生中拿到过的奖励最高的一次比赛了,休息了两天后决定对这次比赛做一个简单的总结。

比赛题目

比赛链接在此2021“智荟杯”浦发百度高校极客挑战赛 - 百度AI Studio - 人工智能学习与实训社区

我们参加的是算法赛道,比赛题目简单点说就是一个下棋博弈的游戏,每一支队伍都要设计一个模型,然后不同队伍之间的不同模型会进行下棋对决,赢的人会加分,输的人会扣分,然后按最终得分进行排名。下棋游戏名字叫“捕碳大作战”,具体的规则非常复杂,有兴趣的可以在这里了解一下。

初赛

我搜了一下这个比赛,好像2018年是第一届,所以我参加的2021年的是第四届,参赛人数并不算多,初赛一共只有92支队伍参赛,但是晋级规则有点奇怪,排名前15所高校中排名第一的队伍晋级总决赛,也就是说一个学校只能晋级一支队伍,这样可能是为了防止某些学校太厉害全部进复赛了,导致一些弱一点的学校没有机会了吧。

师兄跟我说这个比赛参加的人很少,参赛有机会去线下答辩,可以出去旅游,于是我果断参加了,结果初赛开始后才知道光是我们学校就有三支队伍参赛,而且有一支队伍和我们是一个实验室的,实力很强,我们当时都是前15名,所以只要我们能打败他们队伍就可以进决赛,否则哪怕在前15名也晋级不了。

当时初赛最后那几天真的是绝望,我们无论怎么改模型都打不过同校的另一支队伍,每天都在坐牢,又不想放弃,毕竟排名在前15名。我们不断分析与他们之间的对局,仔细分析为什么我们的模型会输,然后不断改进,但也始终打不过。在最后一天封榜之后,我们发现我们的模型虽然打不赢他们,但是可以打赢排名更靠前队伍,而他们的模型虽然能打赢我们,但是打不赢排名更靠前的队伍,这就导致最终我们以极小的分数差领先了他们,从而晋级了决赛。

初赛解决方案

这种下棋博弈游戏的最好解决方案就是强化学习,阿尔法狗就是用强化学习在围棋上打败了人类冠军。但是强化学习对硬件的要求很高,需要学习大量的对局,我们实验室最好的服务器是RTX8000,我们使用比赛官方提供的baseline进行测试,将RTX8000的48G内存全部用满,训练了三天三夜,也只训练了10000轮对局,要知道阿尔法狗可是训练了几千万轮对局,这让我们对使用强化学习解决这个问题的方案产生了极大的不安。不过我们还是先试了试强化学习,为了让模型能够和旗鼓相当的对手进行训练,我们设计了一些简单的规则算法,并通过调整采用这些规则输出的action的最终概率来模拟不同实力的对手,让模型能够从易到难的去学习下棋策略。除此以外,我们还修改了模型的结构,提取的特征以及reward,但是效果一直很差,强化学习训练出来的模型始终打不过我们随便设计的简单规则算法,不知道是因为我们设计的reward和模型不好还是因为模型训练的不够久。

初赛一共只给了三周时间,我们花了一周半在强化学习上,结果没有任何进展。然后我们发现,虽然比赛介绍上的标签写了强化学习,但规则中并没有强制要求用强化学习,于是我们灵机一动,开始写纯规则算法。作为前ACM选手,这种纯规则算法自然是难不倒我,但最大的问题在于各种策略以及超参数的选取,比如说捕碳员捕到多少碳回家、种植员在收益率高于多少时种树、捕碳员和种植员的比例等,这些参数的设置只能依靠经验或者观察对局从而进行人工调整。为了保证各个agent不会相撞,不会目标冲突,我们专门设计了防撞和防目标冲突的算法,给每个agent的候选动作打分,然后排序,按分高到分低依次分配action,如果分高的候选动作下一步要走这个地点,那么分低的候选动作就禁止走这个地点。具体的代码如果有需要可以私信我,我可以发给你,不过我猜应该没人想要这个源码吧

2021“智荟杯”浦发百度高校极客挑战赛——比赛总结相关推荐

  1. 银联高校极客挑战赛 初赛 第一场、第二场合集(3+3题)

    第一场 A. 码队女朋友的王者之路 测试用例 测试1 4 5 2 2 00101 5 1 2 11110 6 2 3 000000 7 6 6 0000001 测试2 1 1 1 1 0 测试3 1 ...

  2. 银联高校极客挑战赛 初赛 第二场

    开场几十分钟后才开始打的,实验室居然锁门了... A. 码队GO 左上.右下角为(1,1).(x,y)的矩阵的大小,dp处理 然后一个裸的二分答案 (1,1) (x,y) (x-k,y-k) 三个点 ...

  3. 2022第二届低代码极客挑战赛邀你来战!

    随着数字经济的加速深化,80%+的企业与机构对业务需求的敏捷响应.高效低成本的开发与运维有着强烈的需求,而在这其中,越来越多企业与机构的领导者在IT建设以及数字化转型探索中,会考虑利用低代码/零代码产 ...

  4. 26万奖金 | 第一届 E-MapReduce 极客挑战赛 诚邀英才前来挑战!

    日前," 第一届 E-MapReduce 极客挑战赛 "在阿里云天池官网正式开赛.据悉,本次大赛由阿里云.英特尔联合举办,聚焦 SparkSQL 执行效率,探索 TPC-DS 测试 ...

  5. 26万奖金 | 阿里云 E-MapReduce 极客挑战赛邀你来战!

    日前," 第一届 E-MapReduce 极客挑战赛 "在阿里云天池官网正式开赛.据悉,本次大赛由阿里云.英特尔联合举办,聚焦 Spark SQL 执行效率,探索 TPC-DS 测 ...

  6. 腾讯极客挑战赛第一期:解开一道即将尘封十几年的封印 writeup

    文章目录 腾讯极客挑战赛第一期:解开一道即将尘封十几年的封印 writeup 简要说明 第一题 1+1=? 第二题 (x*18-27)/3-(x+7496)=0, x=? 第三题 `41*x-31*x ...

  7. 【最强大脑】全球脑王的极客挑战赛之路:1413876分夺冠如何炼成?

    导语 | 在腾讯云+社区联合腾讯码客.腾讯安全平台部全新打造的创新赛事[腾讯极客挑战赛 | 鹅罗斯方块]中,4570名参赛者为我们带来前所未有.异彩纷呈的作品.一场技术竞技,把一群志同道合的开发者聚集 ...

  8. 近期活动盘点:首届Apache Flink 极客挑战赛、2019年社会计算机国际会议

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: 7 月 24 日,阿里云峰会上海开发者大会开源大数据专场,阿里巴巴集团副总裁.计算平台事业部总裁贾扬清与英特尔高级首席工程师.大数据分析和 ...

  9. 报名 | 首届!Apache Flink 极客挑战赛强势来袭,重磅奖项等你拿,快来组队报名啦!...

    7 月 24 日,阿里云峰会上海开发者大会开源大数据专场,阿里巴巴集团副总裁.计算平台事业部总裁贾扬清与英特尔高级首席工程师.大数据分析和人工智能创新院院长戴金权共同发布首届 Apache Flink ...

  10. 第三届Apache Flink 极客挑战赛暨AAIG CUP攻略发布!

    简介:阿里云 周云峰(云岩).淘系技术部 黄家明(明小)两位老师共同解读第三届Apache Flink 极客挑战赛暨AAIG CUP赛题内容 本文作者:阿里云 周云峰(云岩).淘系技术部 黄家明(明小 ...

最新文章

  1. usaco Dual Palindromes
  2. 论文理解 R-FCN:基于区域的全卷积网络来检测物体
  3. SQL Serever学习7——数据表2
  4. 金蝶凭证序时簿在哪_来了!金蝶日常账务处理大全
  5. 工业交换机与工业路由器的区别
  6. Linux 内存管理 | 物理内存、内存碎片、伙伴系统、SLAB分配器
  7. 酷动网博客整站源码+Panda PRO主题+7000条完整数据
  8. springboot情操陶冶-@SpringBootApplication注解解析
  9. pytorch学习笔记(二十二):Pooling
  10. SpringBoot法律知识分享问答论坛 lawbbs.liuyanzhao.com
  11. 隐私问题不想用自己手机收验证码怎么办?
  12. gsp计算机系统测试题答案,新版GSP计算机系统专业知识培训测试题
  13. 视频直播系统源码,比较图片
  14. 性能分析工具Systrace的使用详解
  15. als算法参数_ALS算法 (面试准备)
  16. 120 行代码实现纯 Web 剪辑视频
  17. HDMI转MIPIDSI芯片,东芝TC358870
  18. MobaXterm 详细安装使用教程 官网
  19. 苹果iphone 6s手机测评
  20. bluekitchen-stm32f1/csr8311移植笔记(4)-database driver

热门文章

  1. Android性能优化之启动速度优化
  2. mssql数据库和Oracle数据库注入
  3. springBoot 文件压缩加密
  4. linux7 (RHEL7.5)超详细系统安装步骤
  5. 基于btest.so的策略测试方案
  6. 布尔逻辑代数化简公式
  7. shader篇-处理复杂光照
  8. 电脑网络适配器黄色感叹号,无法连接WiFi?显示适配器黄色小标?
  9. 八个处理好职场人际关系的必备技巧
  10. aspack的简单脱壳,望大牛勿喷。