腾讯社交广告高校算法大赛决赛
第二周周冠军
他们的名字叫nju_newbiew
进入决赛之后他们的成绩是火速提升

直到稳定在第一名
这又是一支谜一般的队伍

今天小编就来给大家揭开神秘大佬的面纱
三个偶像与实力派兼顾的大男孩
祝贺你们
小编对咱们的周冠军同学进行了短暂的采访
于是就有了下面这篇分享
.....

周冠军 nju_newbiew

大家好, 我们是nju_newbiew队。 我们的队伍都来自于南京大学, 分别是yy, cold rain 和 sf。群里似乎有位大佬名字也是newbiew, 纯属巧合。 这里我们要为给这位大佬造成的困扰道歉。能够拿到这次比赛的周冠军, 我们感到非常幸运。 其实这个周冠军拿的也是比较勉强, 我们A榜的最佳成绩0.101717其实是多个模型的加权平均, 单模型最佳成绩并不优于后面的各位大佬, 可以说这个周冠军更多是因为我们模型融合的比较早而已。

言归正传, 下面我们分享一下比赛的心得:

1、数据处理
进入决赛后数据量变得很大, 文件读写很慢, 而且经常会导致内存不足。 所以我们会对原始数据简单处理一下, 能用int8存储的就用int8存储, 此外, 我们使用h5格式存储文件, 读写都非常快。 其次, 关于选用哪些数据进行训练。 目前, 我们是用全集进行训练的, 会删除一些异常数据, 相信大家稍微观察一下数据就可以发现这些异常数据。

2、线下验证集
相信大家都遇到了线下提升, 线上下降的情况。 构造线下的验证集确实是一件比较棘手的事, 我们的观点与上周的周冠军ThreeIdiots相同, 严格按照时序关系构造测试集, 否则容易发生信息泄露。 通常情况下, 我们会比较一组参数或模型在27号, 28号, 29号这三天分别作为测试集时的性能, 通过这样的方式, 我们线下与线上一致性还是挺强的, 不过仍然偶尔会出现相反的情况。

3、特征工程
特征这一块可以说是我们的短板, 至今还不懂群里各位大佬说的trick。 我们的特征主要是一些基本的统计信息, 最好的单模型用到的特征算上原始特征只有40几维。 关于群里讨论最多的转化率, 我们试过全局统计, 窗口统计, 平滑与不平滑, 并没有发现太多的差异性。 目前我们采用的转化率是统计点击日之前的转化率, 不统计出现次数过少的, 这么做纯粹是因为简单, 速度快, 而且在我们的实验里效果并不差于那些复杂的手段, 可能在我们的模型里转化率并不重要。 其次, 我们也尝试过使用Word2vec, Doc2vec等思想为user, app学习低维向量特征, 但实验结果都不太理想, 我们已经放弃了使用安装列表。

4、模型
再次与上周的周冠军ThreeIdiots一致, 我们初赛时使用了GBDT与FFM等模型, 发现线上GBDT的性能要好于FFM, 而决赛反了过来。 与大家关注于特征工程不同, 我们大多数时间都在进行模型调参和模型改进上面(纯粹是因为兴趣, 并不是说这样做是对的), 最好的单模性其实也是FFM模型, wide&deep模型也有不错的结果。 我们最近的工作主要集中于改进模型的训练效率, 因为模型训练速度实在太重要了, 特别是需要进行stacking的时候, 相信大家也都体验到了这一点。 最后一个星期, 我们应该会主要集中于更好的进行模型融合吧。

最后说两句感言, 也是对自己的勉励: 希望大家把比赛当做乐趣, 而不是煎熬。 有时间多看看别人的比赛经验和相关的论文, 比赛最终的目的还是学习。

祝大家都能取得好成绩。

【采访】腾讯社交广告高校算法大赛决赛第二周周冠军——nju_newbiew比赛经验及心得分享相关推荐

  1. 【采访】腾讯社交广告高校算法大赛决赛第二周最大进步队伍——拔萝卜比赛经验及心得分享

    腾讯社交广告高校算法大赛决赛第二周 进步最大的一支队伍 她的名字叫拔萝卜 这是一支单人队伍 而且还是少有的女孩子哦 可爱.乖巧.独立的小女孩 祝贺你 话不多说直接上照片 小编对咱们的周进步冠军同学进行 ...

  2. 【采访】腾讯社交广告高校算法大赛决赛第一周最大进步队伍——SkullGreymon比赛经验及心得分享

    这是腾讯社交广告高校算法大赛进入决赛阶段 进步最大的一支队伍 他们的名字叫SkullGreymon 他们低调到照片都不放 小编也不知道怎么介绍 只知道队长同我一样喜欢哆啦A梦 那应该是个有童真爱想象的 ...

  3. 【采访】腾讯社交广告高校算法大赛 决赛第一周周冠军——ThreeIdiots比赛经验及心得分享 腾讯广告算法大赛

    这是腾讯社交广告高校算法大赛进入决赛阶段 产生的第一个周冠军 他们的名字叫ThreeIdiots 据说ThreeIdiots是谜一般的存在 大家都在猜他们到底是何方神圣 忍不住先提前透露一下关键词 低 ...

  4. 【采访】腾讯社交广告高校算法大赛第二周周冠军——Groot 比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第二周周冠军--Groot 比赛经验及心得分享 经过又一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第二周周冠军 他们的名字叫Groot 三个冷静沉着的大男孩 低 ...

  5. 【采访】腾讯社交广告高校算法大赛第三周周冠军——到底对不队比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第三周周冠军--到底对不队比赛经验及心得分享 经过又一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第三周周冠军 他们的名字叫"到底对不队" 这 ...

  6. 【采访】腾讯社交广告高校算法大赛第一周周冠军——郭达雅 比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第一周周冠军--郭达雅 比赛经验及心得分享 经过一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第一位周冠军 他的名字叫郭达雅 一个腼腆沉静的小男孩 低调的实力派, ...

  7. 【专访】首届腾讯社交广告“高校算法大赛”落幕 冠亚季军团队参赛心得精彩分享

    导言: 7月6日,首届腾讯社交广告"高校算法大赛"正式落幕.在众多参赛团队中,来自南京大学的三人组合"nju_newbie"一举夺得决赛冠军,将30万元奖金收入 ...

  8. 腾讯社交广告高校算法大赛——总结

    #腾讯社交广告高校算法大赛--总结 Another url: https://bulihanjie.github.io/2017/07/08/腾讯社交广告高校算法大赛总结/ 题目描述 http://a ...

  9. 【干货】从点击率预估的视角看腾讯社交广告算法大赛

    [干货]从点击率预估的视角看腾讯社交广告算法大赛 大赛简介 腾讯社交广告算法大赛以广告领域常见的转化率预估问题作为出题思路,从用户历史一个月的行为数据中采样竞赛数据,数据规模达几十GB.比赛题目足够诚 ...

最新文章

  1. java B2B2C Springboot仿淘宝电子商城系统-负载均衡之ribbon+feign
  2. 小米node2红外_使用python-miio控制小米智能插座
  3. zkui:好用的zookeeper ui工具
  4. mysql中去重的用法_mysql中去重 distinct 用法
  5. 走马观花:Visual Studio Code Name Orcas Mar07CTP /体验DLINQ
  6. java 反应堆模式_Netty中的三种Reactor(反应堆)
  7. windows CA的几点记录小结
  8. 自定义控件之圆形的image
  9. TextWatcher实现输入关键字筛选数据
  10. 关于注册keil的事儿,为啥注册成功之后keil还是提示会限制2K内存
  11. Java移位运算符:<<,>>,>>>
  12. 用计算机画图评课稿,小学信息技术三年级下册《图形的复制与粘贴》说课稿
  13. java pandora_Pandora FMS监视简介
  14. 数字麦克风PDM信号采集与STM32 I2S接口应用(三)
  15. FireWorks-程序员的做图工具
  16. 刘宇凡:人人都是自媒体
  17. CSDN如何获取积分(转载)
  18. cmd命令行中文显示乱码解决办法
  19. 任天堂超级玛丽(SuperMario)改编的超级企鹅(java)搞笑版,绝对给力
  20. 往事如烟 - 笑傲江湖

热门文章

  1. SAP License:SAP财务管理的认识
  2. 风控模型及特征的上线部署方法
  3. 智能排班系统、班次、班表、考勤、年假、调休、审批、请假、培训、值班、换班、加班、工时、自动排班、智能预测、人力需求预测、授权、团队、锁定量排、规则权重设置、菜单、角色、数据监控、工作台、axure
  4. 2019-1、CentOS7+安装Tengine_2_3_2(Nginx 1_17_0)
  5. js按钮频繁提交解决方案:
  6. 新建项目虚拟环境及pycharm配置
  7. saltstack returners
  8. 数据结构-队列和栈的那些事(三)
  9. Codeforces 148D:Bag of mice 概率DP
  10. Android ADB 用法