【采访】腾讯社交广告高校算法大赛第二周周冠军——Groot 比赛经验及心得分享

经过又一周紧张又激烈的角逐

腾讯社交广告高校算法大赛产生了第二周周冠军

他们的名字叫Groot

三个冷静沉着的大男孩

低调的实力派,祝贺你们

小编对咱们的周冠军同学进行了短暂的采访

于是就有了下面这篇分享

周冠军 Groot

大家好,我们是Groot队,我是Groot队的队长wsss,还有两位队员,gjj,抓马,现在都是中国科学技术大学的研究生,很荣幸有机会与大家分享本次比赛的经验。最早有参加过Kaggle的Bosch Production Line Performance比赛,虽然成绩不理想,但也积累了一些经验,再加上大家的努力,侥幸在这次比赛拿了一次周冠军。

下面主要介绍一下我们在这次比赛的一些思路,希望能够帮助到大家:

  1. 训练集构造

和之前郭达雅大神的分享经验类似,比赛初期最重要的就是构建有效的训练集,能够尽量与线上情况同步,数据集划分方案大家可以参考腾讯广告算法大赛官方公众号推荐参考的几个比赛的信息。在构造好训练集合后,一般来说如果线上线下的差距比较大那有可能是你提取的特征有信息泄露,或者是你在对提交数据部分的特征提取与在训练集上面提取的特征方式有较大出入。

2、模型选择

现在可以选择的模型有很多,就目前而言我们选择的还是XGB,因为相比较其他的模型,它整个的训练反馈过程会比较迅速,有利于前期快速的对特征进行迭代,可能以后也可能会去尝试一些不同的模型,我们目前的主要精力是放在特征工程的部分。

3、特征工程

除去之前的数据预处理等工序,比赛很大的一部分工作应该就是特征工程了,按我们暂时的思路来说,最主要特征的来源一部分是参考之前同类比赛的分享经验,另一部分就是针对本次数据的理解,一般是进行一些统计信息的分析,再一个就是在你构造的数据集中,观察原始数据,我们可能会选择性的对一些label=1的用户进行一些分析,针对他的历史交互,安装app等信息,从用户的角度去思考可能决定他点击广告后发生激活的原因,由此提取出一些可能的特征,之后再进行特征提取以及验证,因为目前我们的特征数目以及模型比较小,完整的训练加预测基本可以在几十秒就可以完成,所以比较方便我们对特征的筛查以及利用xgbfir等工具对特征的分析。一般来说通过对特征的分析也会一定程度加深对数据的理解以及发现一些可能的特征之间的关联。

4、设备

初赛的数据大小还可以接受,我们的程序基本没有进行太多优化,可能大一点的内存会方便你加载整个数据进行观察,不过对于提特征以及后面的训练部分,基本资源消耗很少,一般的笔记本电脑就足以完成。

感想:

总的来说这次拿周冠军多少有些巧合成分,我们的经验也不是很充足,所以有不对的地方还希望各位多多谅解。对于没有参加过类似比赛的同学,我们觉得还是应该尽量参与,因为即使最后没有取得理想的成绩,通过比赛结束后优胜队伍的分享你也会学到很多东西,这个和直接等比赛结束再去看优胜队伍的比赛方案是不一样的,希望大家都能通过比赛学习到一些东西,有所成长。

最后祝大家比赛取得好成绩!

【采访】腾讯社交广告高校算法大赛第二周周冠军——Groot 比赛经验及心得分享相关推荐

  1. 【采访】腾讯社交广告高校算法大赛第三周周冠军——到底对不队比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第三周周冠军--到底对不队比赛经验及心得分享 经过又一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第三周周冠军 他们的名字叫"到底对不队" 这 ...

  2. 【采访】腾讯社交广告高校算法大赛决赛第一周最大进步队伍——SkullGreymon比赛经验及心得分享

    这是腾讯社交广告高校算法大赛进入决赛阶段 进步最大的一支队伍 他们的名字叫SkullGreymon 他们低调到照片都不放 小编也不知道怎么介绍 只知道队长同我一样喜欢哆啦A梦 那应该是个有童真爱想象的 ...

  3. 【采访】腾讯社交广告高校算法大赛 决赛第一周周冠军——ThreeIdiots比赛经验及心得分享 腾讯广告算法大赛

    这是腾讯社交广告高校算法大赛进入决赛阶段 产生的第一个周冠军 他们的名字叫ThreeIdiots 据说ThreeIdiots是谜一般的存在 大家都在猜他们到底是何方神圣 忍不住先提前透露一下关键词 低 ...

  4. 【专访】首届腾讯社交广告“高校算法大赛”落幕 冠亚季军团队参赛心得精彩分享

    导言: 7月6日,首届腾讯社交广告"高校算法大赛"正式落幕.在众多参赛团队中,来自南京大学的三人组合"nju_newbie"一举夺得决赛冠军,将30万元奖金收入 ...

  5. 【采访】腾讯社交广告高校算法大赛决赛第二周最大进步队伍——拔萝卜比赛经验及心得分享

    腾讯社交广告高校算法大赛决赛第二周 进步最大的一支队伍 她的名字叫拔萝卜 这是一支单人队伍 而且还是少有的女孩子哦 可爱.乖巧.独立的小女孩 祝贺你 话不多说直接上照片 小编对咱们的周进步冠军同学进行 ...

  6. 【采访】腾讯社交广告高校算法大赛决赛第二周周冠军——nju_newbiew比赛经验及心得分享

    腾讯社交广告高校算法大赛决赛 第二周周冠军 他们的名字叫nju_newbiew 进入决赛之后他们的成绩是火速提升 直到稳定在第一名 这又是一支谜一般的队伍 今天小编就来给大家揭开神秘大佬的面纱 三个偶 ...

  7. 【采访】腾讯社交广告高校算法大赛第一周周冠军——郭达雅 比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第一周周冠军--郭达雅 比赛经验及心得分享 经过一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第一位周冠军 他的名字叫郭达雅 一个腼腆沉静的小男孩 低调的实力派, ...

  8. 腾讯社交广告高校算法大赛——总结

    #腾讯社交广告高校算法大赛--总结 Another url: https://bulihanjie.github.io/2017/07/08/腾讯社交广告高校算法大赛总结/ 题目描述 http://a ...

  9. 【干货】从点击率预估的视角看腾讯社交广告算法大赛

    [干货]从点击率预估的视角看腾讯社交广告算法大赛 大赛简介 腾讯社交广告算法大赛以广告领域常见的转化率预估问题作为出题思路,从用户历史一个月的行为数据中采样竞赛数据,数据规模达几十GB.比赛题目足够诚 ...

最新文章

  1. php 阻塞消息队列,linux 消息队列阻塞
  2. 山东省枣庄市台儿庄区云平台运维故障处理一例
  3. python里、能用分支结构写出循环的算法吗_python变量运算符分支结构循环结构及例题...
  4. Win2003磁盘分区调整
  5. PHP linux spl_autoload_register区分大小写
  6. C# 获取UTC 转换时间戳为C#时间
  7. 手机微信html整人代码大全,让微信卡死的代码是什么 微信整人代码汇总
  8. 通过身份证地址或家庭地址获取行政区划代码
  9. Windows驱动一些概念WDK WDF WDM WDI
  10. 天空的心事,只有云懂
  11. C++模拟手机调查问卷
  12. WPF/Silverlight积累
  13. igh ethercat主站文档(中文翻译上)
  14. 关于发那科工具偏移指令
  15. 程序员该如何管理后宫:皇后造小人(工厂模式)
  16. ap module omap4460
  17. 屏幕录制大师哪款好用?这3款录屏工具,值得推荐!
  18. 未来IT革命5.0之路,何去何从?
  19. ? Emoji ? - 收藏集 - 掘金
  20. [洛谷P3391]文艺平衡树

热门文章

  1. MySQL高级知识(一)——基础
  2. 用户数据销售额分析动态大屏看板+大屏数据可视化图表组件(折线图+圆柱图+散点图+饼图+漏斗图+雷达图+水位图)+智能web端高保真大数据动态可视化大屏看板+中国动态地图+智慧电商实时动态数据大屏看板
  3. scrapy 基本操作
  4. 卷积神经网络之ResNet网络模型学习
  5. Python学习之布尔和数字
  6. HDU 5835 Danganronpa 贪心
  7. android选择本地图片并裁剪
  8. 给Editplus去掉.bak文件
  9. Linux常用指令---快捷键
  10. Qt学习笔记 信号和槽