这是腾讯社交广告高校算法大赛进入决赛阶段

进步最大的一支队伍

他们的名字叫SkullGreymon

他们低调到照片都不放

小编也不知道怎么介绍

只知道队长同我一样喜欢哆啦A梦

那应该是个有童真爱想象的男孩儿吧

小编对咱们的周冠军同学进行了短暂的采访

于是就有了下面这篇分享

.....

最大进步队 —— SkullGreymon

大家好,我们是SkullGreymon队,这单词略有点生僻,是丧尸暴龙兽的意思。起这个名字不因为我们比较丧尸,相反,我们是青年公寓F座宿舍里的三个良好公民。

初赛我们是最后一周才开始做的,可算是有惊无险,最后两天比较忙,以为提交0.1009能够保证进复赛了,然后复赛再蓄力搞,没想到最后排名蹭蹭掉到173,差点没进了复赛,不过也因跌得福,有幸获得这次最大进步奖,那么接下来介绍下复赛相比于初赛的进步点。

首先,对提升贡献最大的应该是群里说的trick, 由于我们进决赛才加的群,然后挺频繁看到这个字眼,然而也没有人具体提出是什么,总是戛然而止,令人望洋兴叹。于是乎,我们开始寻找这个传说中的特征,说来也巧,我们刚好有个特征提错了,修改成它正确的打开方式,刚好带来2个千分点的提升,这个跟群里说的trick带来的提升吻合了,然后根据其他辅助信息,确认这个应该就是要找的那个传说中的特征,这个特征给我们复赛提供了2个千分点的提升,应该算是头号进步助手了。

其次,恰逢更换数据,数据量变大了,很多选手由于内存问题停滞了一段时间,而我们刚好比较快地跑完了初赛的特征和模型,时间上快了一步,以至于我们在复赛初期排名较靠前,之后大家都上来了,这点就可以忽略了。特征的提取上我们全部使用的pandas和numpy对数据进行操作,这里简单介绍一些节省内存的方法:

1. 我们是将数据按天进行划分来提取特征,那么对其他表merge之前,我们其实可以只留下在这一天中出现过的app、creativeID、positionID等等,这样能大幅减少计算量;

2. 对两个表merge前我们只需要留下需要的那些列,比如只计算positionID的统计特征时,其他不相关的列(比如connectionType、creativeID等等)其实是可以删掉的;

3. 我们提取的特征全部使用scipy的csr_matrix来存储,它转化成pandas的DataFrame也是非常快速的,提取完的特征通过numpy.savez保存至硬盘,这样读取时的效率非常高。

最后提一下,我们复赛目前的模型和初赛一样,都还只是XGB单模型,期间也粗略尝试了FM等模型,但是效果并不好,还没找到正确的打开方式,但从以往CTR比赛的经验来看FFM等模型的效果被证明是很好的,因此这块还需要继续探索。XGB对于不同的训练集,效果有所不同,我们目前线上提交的是用28、29两天的数据作为训练样本。后面也会尝试多种模型进行stacking,希望能带来一些提升吧。

复赛慢慢变得激烈起来,两天没有提升就遭遇了滑铁卢,路漫漫其修远兮,还需探索其他不同的模型,第一次在做比赛中感觉idea远大于时间,也许这就是这次这个赛题给我们的一个很棒的用户体验,接下来就是大家与时间赛跑,实现和测试自己的idea了。

最后,祝大家能够探索出一个大提升的好策略,取得好成绩!

【采访】腾讯社交广告高校算法大赛决赛第一周最大进步队伍——SkullGreymon比赛经验及心得分享相关推荐

  1. 【采访】腾讯社交广告高校算法大赛决赛第二周最大进步队伍——拔萝卜比赛经验及心得分享

    腾讯社交广告高校算法大赛决赛第二周 进步最大的一支队伍 她的名字叫拔萝卜 这是一支单人队伍 而且还是少有的女孩子哦 可爱.乖巧.独立的小女孩 祝贺你 话不多说直接上照片 小编对咱们的周进步冠军同学进行 ...

  2. 【采访】腾讯社交广告高校算法大赛 决赛第一周周冠军——ThreeIdiots比赛经验及心得分享 腾讯广告算法大赛

    这是腾讯社交广告高校算法大赛进入决赛阶段 产生的第一个周冠军 他们的名字叫ThreeIdiots 据说ThreeIdiots是谜一般的存在 大家都在猜他们到底是何方神圣 忍不住先提前透露一下关键词 低 ...

  3. 【采访】腾讯社交广告高校算法大赛决赛第二周周冠军——nju_newbiew比赛经验及心得分享

    腾讯社交广告高校算法大赛决赛 第二周周冠军 他们的名字叫nju_newbiew 进入决赛之后他们的成绩是火速提升 直到稳定在第一名 这又是一支谜一般的队伍 今天小编就来给大家揭开神秘大佬的面纱 三个偶 ...

  4. 【采访】腾讯社交广告高校算法大赛第三周周冠军——到底对不队比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第三周周冠军--到底对不队比赛经验及心得分享 经过又一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第三周周冠军 他们的名字叫"到底对不队" 这 ...

  5. 【采访】腾讯社交广告高校算法大赛第二周周冠军——Groot 比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第二周周冠军--Groot 比赛经验及心得分享 经过又一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第二周周冠军 他们的名字叫Groot 三个冷静沉着的大男孩 低 ...

  6. 【采访】腾讯社交广告高校算法大赛第一周周冠军——郭达雅 比赛经验及心得分享

    [采访]腾讯社交广告高校算法大赛第一周周冠军--郭达雅 比赛经验及心得分享 经过一周紧张又激烈的角逐 腾讯社交广告高校算法大赛产生了第一位周冠军 他的名字叫郭达雅 一个腼腆沉静的小男孩 低调的实力派, ...

  7. 【专访】首届腾讯社交广告“高校算法大赛”落幕 冠亚季军团队参赛心得精彩分享

    导言: 7月6日,首届腾讯社交广告"高校算法大赛"正式落幕.在众多参赛团队中,来自南京大学的三人组合"nju_newbie"一举夺得决赛冠军,将30万元奖金收入 ...

  8. 腾讯社交广告高校算法大赛——总结

    #腾讯社交广告高校算法大赛--总结 Another url: https://bulihanjie.github.io/2017/07/08/腾讯社交广告高校算法大赛总结/ 题目描述 http://a ...

  9. 腾讯广告算法大赛 | 复赛第一周周冠军心得分享

    腾讯广告算法大赛 | 复赛第一周周冠军心得分享 腾讯广告算法大赛复赛第一周周冠军揭晓, 熟悉的队伍,熟悉的配方! 没错,依然是你们熟悉的葛文强团队! 今天,他们将对FFM方法进行详细介绍. 小板凳儿排 ...

最新文章

  1. Vue学习小札——2.6 组件参数校验与非props特性
  2. 我的博客今天0岁346天了,我领取了…
  3. iOS:通信录(完成)(18-01-18更)
  4. Go-如何读取yaml,json,ini等配置文件
  5. SQL Server的导出导入方式有
  6. linux下追查线上问题常用命令
  7. 华为Mate 40这下稳了:全新5nm麒麟芯片将于9月全部交付
  8. 图标插件java_java – Eclipse插件:标记的自定义图标
  9. cus系统前台改版 beta1.1发布
  10. 【毕业设计】基于SSM图书信息管理系统
  11. Unity3D自动寻路之Nav Mesh Agent(导航网格代理)
  12. MIPI DSI CLK计算
  13. Mariadb数据库
  14. 华为什么型号支持鸿蒙,哪些华为手机支持鸿蒙系统?华为支持鸿蒙OS手机型号清单...
  15. C++的友元函数,友元类及#pragma once的作用
  16. hdu 5454 Excited Database(线段树)
  17. linux中文麻酱字_在家自制芝麻酱、芝麻香油,味道纯正无添加,原来做法这么简单...
  18. 平板win10 android哪个耗电,您会为平板电脑选择win10还是Android?
  19. 【动手学深度学习v2李沐】学习笔记07:权重衰退、正则化
  20. 七龙珠火影海贼王妖精的尾巴精典语录与各地所看语录

热门文章

  1. SAP License:ERP财务软件简介
  2. SAP License:未分配差异的另类查询办法
  3. 互联网金融监管平台、舆情监测、数据统计、预警、违规、企业中心、舆情概况、舆情报告、新增企业、栏目管理、年审企业、企业走势、推价位管理、新闻管理、账户管理、监管平台、金融监管、Axure原型、rp原型
  4. C++ const常量和指针
  5. 连载:面向对象葵花宝典:思想、技巧与实践(34) - DIP原则
  6. CSS 框模型( Box module )
  7. 配置VS2008本地调试.NETFRAMEWORK源代码
  8. 到今天上了一个月班了,功能基本实现了.
  9. Android 微光闪烁效果之更强Shimmer-android
  10. 【POJ Challenge】生日礼物 加强m子段和