【采访】腾讯社交广告高校算法大赛第三周周冠军——到底对不队比赛经验及心得分享
【采访】腾讯社交广告高校算法大赛第三周周冠军——到底对不队比赛经验及心得分享
经过又一周紧张又激烈的角逐
腾讯社交广告高校算法大赛产生了第三周周冠军
他们的名字叫“到底对不队”
这是由两位女孩一位男孩组成的队伍
正所谓男女搭配 效果加倍
真理始终是真理
小编对咱们的周冠军同学进行了短暂的采访
于是就有了下面这篇分享
…
在这里不得不多叨叨两句
两个小美女居然看不见
小编也不满意
所以打算在最后放个彩蛋~
底部有惊喜哦…
周冠军 到底对不队
大家好,我们是到底对不队,我是小昵子,另外两名队员是pfllo和zjm,我们是北京大学的研究生。我们队伍成员之前都没有参加过类似的比赛,所以完全没有经验,参与比赛的过程中也是磕磕碰碰,这次能侥幸得了一次周冠军真的很开心。
为了配合pfllo,我们整了个看不见的团队合照。
进入正题,我们的比赛心得主要有以下几个方面:
- 数据方面
我们前期花了不少时间在数据集的构造上。一方面我们尝试了一些数据清洗的策略,把数据集中明显不靠谱的数据剔除掉了;另一方面我们也尝试了只用某几天作为数据集,但是发现还是用全集效果更好一些,可能跟初赛的数据量并不是特别大有关。在validation划分方面,我们随机选取数据集的10%作为validation。由于不同的随机数种子产生的validation集的log-loss会有一些差别,我们也尝试了一些随机数种子使得线上跟线下的差距尽量小一些。
2、特征工程方面
我们一开始只是将所有初始特征,还有很多认为可能有效果的特征统统加入到模型中。然后开始奋力调参数,希望可以用“聪明”的模型来寻找到特征、数据之间隐含的关系。但是经过一段时间“不进则退”的状态,也看了大佬们的经验分享,我们决定仔细推敲每一组特征,并且积极借鉴大佬们的思路。
(1)不加没用的特征:特征之间如果存在强相关性会给模型造成干扰。需要控制变量,保留最有效、精简的特征。我们是使用逐一删除,对比实验来验证特征有效性。
(2)多看比赛经验、相关论文:站在巨人的肩膀上分析问题,常常能够事半功倍。我们借鉴了CTR预估等相关比赛的经验,参考了Kaggle的历届比赛分享,也看了相关获奖队伍的代码,受益匪浅。对于加特征时需要考虑的细节变得更加清楚。
(3)观察数据,因地制宜找特征:特征工程的构建需要紧密联系数据特点。判断某个特征是否有意义,不能只是空想,要做统计分析。我们可以关注一个特征在不同标签中的比例,关注是否有哪些特殊的情况会对转化有很大的影响,这种情况的占比是否大,是否有加为特征的必要……这一系列的问题都需要观察数据,做恰当的统计进行分析。
3、训练方面
相信很多人都遇到过onehot转的时候维度太大直接爆炸的问题,我们也是一样,所以采用了稀疏编码。考虑到数据量较大的问题,所以我们也花了时间在提升速度方面工作,比如xgboost的并行化配置等。后期数据更大,建议一开始就实现一个比较高效的训练方式,能够快速迭代看结果是比较关键的环节。
最后祝大家都能取得好成绩。
【采访】腾讯社交广告高校算法大赛第三周周冠军——到底对不队比赛经验及心得分享相关推荐
- 【采访】腾讯社交广告高校算法大赛第二周周冠军——Groot 比赛经验及心得分享
[采访]腾讯社交广告高校算法大赛第二周周冠军--Groot 比赛经验及心得分享 经过又一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第二周周冠军 他们的名字叫Groot 三个冷静沉着的大男孩 低 ...
- 【采访】腾讯社交广告高校算法大赛决赛第二周最大进步队伍——拔萝卜比赛经验及心得分享
腾讯社交广告高校算法大赛决赛第二周 进步最大的一支队伍 她的名字叫拔萝卜 这是一支单人队伍 而且还是少有的女孩子哦 可爱.乖巧.独立的小女孩 祝贺你 话不多说直接上照片 小编对咱们的周进步冠军同学进行 ...
- 【采访】腾讯社交广告高校算法大赛决赛第一周最大进步队伍——SkullGreymon比赛经验及心得分享
这是腾讯社交广告高校算法大赛进入决赛阶段 进步最大的一支队伍 他们的名字叫SkullGreymon 他们低调到照片都不放 小编也不知道怎么介绍 只知道队长同我一样喜欢哆啦A梦 那应该是个有童真爱想象的 ...
- 【采访】腾讯社交广告高校算法大赛 决赛第一周周冠军——ThreeIdiots比赛经验及心得分享 腾讯广告算法大赛
这是腾讯社交广告高校算法大赛进入决赛阶段 产生的第一个周冠军 他们的名字叫ThreeIdiots 据说ThreeIdiots是谜一般的存在 大家都在猜他们到底是何方神圣 忍不住先提前透露一下关键词 低 ...
- 【采访】腾讯社交广告高校算法大赛决赛第二周周冠军——nju_newbiew比赛经验及心得分享
腾讯社交广告高校算法大赛决赛 第二周周冠军 他们的名字叫nju_newbiew 进入决赛之后他们的成绩是火速提升 直到稳定在第一名 这又是一支谜一般的队伍 今天小编就来给大家揭开神秘大佬的面纱 三个偶 ...
- 【采访】腾讯社交广告高校算法大赛第一周周冠军——郭达雅 比赛经验及心得分享
[采访]腾讯社交广告高校算法大赛第一周周冠军--郭达雅 比赛经验及心得分享 经过一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第一位周冠军 他的名字叫郭达雅 一个腼腆沉静的小男孩 低调的实力派, ...
- 【专访】首届腾讯社交广告“高校算法大赛”落幕 冠亚季军团队参赛心得精彩分享
导言: 7月6日,首届腾讯社交广告"高校算法大赛"正式落幕.在众多参赛团队中,来自南京大学的三人组合"nju_newbie"一举夺得决赛冠军,将30万元奖金收入 ...
- 腾讯社交广告高校算法大赛——总结
#腾讯社交广告高校算法大赛--总结 Another url: https://bulihanjie.github.io/2017/07/08/腾讯社交广告高校算法大赛总结/ 题目描述 http://a ...
- 【干货】从点击率预估的视角看腾讯社交广告算法大赛
[干货]从点击率预估的视角看腾讯社交广告算法大赛 大赛简介 腾讯社交广告算法大赛以广告领域常见的转化率预估问题作为出题思路,从用户历史一个月的行为数据中采样竞赛数据,数据规模达几十GB.比赛题目足够诚 ...
最新文章
- 洛谷4072 SDOI2016征途 (斜率优化+dp)
- oracle基本笔记整理及案例分析1
- 栈与队列在SGI STL的底层实现
- jquery mysql实现加入购物车_jQuery实现加入购物车飞入动画效果
- 520 丁磊向全国英语老师“表白”:再送有道词典笔
- mysql 建模教程 pdf,PowerDesigner 15 系统分析与建模实战 PDF扫描版[50MB]
- 几款常用的文献管理软件
- 一个有趣的二维码生成库Qart
- 电脑网页无法解析服务器dns,电脑无法解析服务器dns地址怎么办
- 【Unity3D小功能】Unity3D中在创建完项目后自动创建文件夹列表
- 图形界面介绍Create Pin Blockage
- 世界鸭都的病态美食审美
- JAVA自定义监听器(通过新线程+while+violate)
- 苹果x微信语音十秒就断_原来苹果手机信号差是这个原因!教你4个方法,信号马上满格...
- pycharm如何打开回退上一步按钮
- 使用SpringCloudConfig连接git报错Cannot clone or checkout repository:xxx
- kernel停在Starting kernel 分析
- Fluent常用模型介绍-流体模拟仿真ansys
- html简单打字游戏,javascript实现简单打字游戏
- R实战| PCA、tSNE、UMAP三种降维方法在R中的实现
热门文章
- SAP License:SAP有限度的多语言支持
- Version Control
- uiautomatorviewer 查看元素新思路
- GitHub For Beginners: Don’t Get Scared, Get Started
- zbb20171215 bootstrap 日期控件.rar
- pdf转html插件~~~pdf2htmlEX安装,配置及使用
- linux 计算机概论 Linux介绍
- React-Native 之 TabBarIOS
- IOS第12天(3,UIViewController的生命周期)
- 谷歌chrome浏览器桌面提醒 webkitNotifications