2019腾讯广告算法大赛
参赛规模
第三届腾讯广告算法大赛复赛于5月24日正式鸣锣开赛。本赛季共有来自1,000+所国内外院校和2,200+家企业事业单位的10,571人报名,学生占比70%;6,011人实名认证,认证率57%;初赛参与人数1,851,队伍数1,361。经过初赛阶段的较量,200支表现优异的队伍从1362支参赛团队中脱颖而出,参与到复赛阶段的PK。
腾讯广告算法大赛
心路历程
第一次参加机器学习数据分析算法大赛,完全没有任何经验,从初赛到复赛一路摸索过来,这个比赛对新手还是很不友好的,初赛baseline都是自己构建,完全没有人share,相比Kaggle开源共享的思想,新手可以很快上手,建议新手直接参加kaggle,本次比赛共分为初赛和复赛,初赛分为A、B榜,2019年4月18日 ~ 5月23日,大概一个多月,时间挺长的,AB阶段的训练集相同,测试集不同,结束时,最终成绩排行榜将以初赛B阶段各参赛队伍的历史最好成绩进行排名,成绩排名前20%(最多不超过200支,以大赛官网解释为准)的队伍进入复赛。我们初赛成绩为Rank 189, 刚好苟进复赛,实为不易,以为进了复赛,只需换一下测试集,没想到题目都换了,数据集也换了,又要重新构建训练集,复赛 2019年5月24日 ~ 6月14日,大约20天左右,时间紧迫,我们大概花了一周时间左右,重新构建了训练集,勉强可以跑一个结果,提交上去了,接下来就是特征工程以及模型融合了,时间比较紧迫,特征工程做的很粗糙,模型参数也没有来得及细调,更没有时间去尝试更多的model,不过最终成绩也不赖,复赛Rank 77 、Score:85.2559 和冠军 87.9683,差距也就2.71,作为一个比赛新手,成绩已经很满意了。
下面进入正题,分享一下我的历时两个月的竞赛心得:
大赛介绍
作为国内领先的大数据营销平台,全新升级的腾讯广告,以更强大的全景连接、更全链的数字智慧、更友好的人本体验等三大核心能力,构建品牌与用户的智慧连接,助力广告主高效实现商业增长。而复杂的社交场景,多样的广告形态,以及庞大的人群数据,给实现这一目标带来了不小的挑战。为攻克这些挑战,腾讯广告也在不断地寻找更为优秀的数据挖掘方式和机器学习算法。
本次算法大赛的题目是源于腾讯广告业务中一个面向广告主服务的真实业务产品 ——广告曝光预估。广告曝光预估的目的是在广告主创建新广告和修改广告设置时,为广告主提供未来的广告曝光效果参考。通过这个预估参考,广告主能避免盲目的优化尝试,有效缩短广告的优化周期,降低试错成本, 使广告效果尽快达到广告主的预期范围。比赛中使用的数据经过脱敏处理,通过本次大赛,我们旨在挑选出更为优秀的曝光预估算法以及遴选出杰出的社交广告算法达人。
赛题说明:
腾讯效果广告采用的是GSP(Generalized Second-Price)竞价机制,广告的实际曝光取决于广告的流量覆盖大小和在竞争广告中的相对竞争力水平。其中广告的流量覆盖取决于广告的人群定向(匹配对应特征的用户数量)、广告素材尺寸(匹配的广告位)以及投放时段、预算等设置项。而影响广告竞争力的主要有出价、广告质量等因素(如pctr/pcvr等), 以及对用户体验的控制策略。 通常来说, 基本竞争力可以用ecpm = 1000 * cpc_bid * pctr = 1000 * cpa_bid * pctr * pcvr (cpc, cpa分别代表按点击付费模式和按转化付费模式)。综上,前者决定广告能参与竞争的次数以及竞争对象,后者决定在每次竞争中的胜出概率。二者最终决定广告每天的曝光量。
本次竞赛将提供历史n天的曝光广告的数据(特定流量上采样), 包括对应每次曝光的流量特征(用户属性和广告位等时空信息)以及曝光广告的设置和竞争力分数;测试集是新的一批广告设置(有完全新的广告id, 也有老的广告id修改了设置), 要求预估这批广告的日曝光 。(出于业务数据安全保证的考虑,所有数据均为脱敏处理后的数据。)
1 赛题理解
本次赛题
https://github.com/bettenW/Tencent2019_Finals_Rank1st
https://www.cnblogs.com/xianbin7/p/11076009.html
https://www.zhihu.com/people/nie-zhao-chang/posts
https://blog.csdn.net/JayChang27/article/details/96571729
https://www.zhihu.com/people/wang-he-13-93/activities
https://zhuanlan.zhihu.com/p/73062485
https://blog.csdn.net/u012151283/article/details/85250776
https://www.cnblogs.com/pinard/p/9093890.html
未完待续
2019腾讯广告算法大赛相关推荐
- 2019腾讯广告算法大赛-冠军之路
点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 写在前面 历时三个月腾讯广告算法大赛已经告一段落,在前两届成功经验的基础上,今年大赛在 ...
- 2019腾讯广告算法大赛完美收官,算法达人鹅厂“出道”
7月8日,2019腾讯广告算法大赛"终极之战"在深圳腾讯滨海大厦顺利举行.在前两届成功经验的基础上,今年大赛在赛题专业性和赛事体验上都有了更大的提升,进而吸引了更多海内外优秀选手参 ...
- 2019腾讯广告算法大赛 决赛 Rank16解决方案
2019腾讯广告算法大赛 决赛 Rank16解决方案 参考文章: (1)2019腾讯广告算法大赛 决赛 Rank16解决方案 (2)https://www.cnblogs.com/xianbin7/p ...
- 2019腾讯广告算法大赛方案分享(冠军)
写在前面 队伍介绍:哈尔滨工业大学二年级硕士生刘育源.中山大学微软亚洲研究院联合培养博士生郭达雅和京东算法工程师王贺. 本文将给出冠军完整方案,全文内容架构将依托于答辩PPT,具体细节也会结合代码进行 ...
- 2019腾讯广告算法大赛之清洗曝光广告数据集以及构造标签
首先是对清洗曝光广告日志中的脏数据进行清洗,脏数据主要包括三种情况, 第一: 该条广告记录中的广告ID不存在于静态广告数据和操作广告数据中,因为不存的话则该条数据无法构造训练集. 第二: 广告请求时间 ...
- 一文梳理2019年腾讯广告算法大赛冠军方案
点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 作为从本次比赛共157队伍中脱颖而出的冠军方案,评分达到87.9683,从数据清 ...
- 备战2020腾讯广告算法大赛:(2017-2019比赛开源和数据等)
期待与各位在2020腾讯社交广告算法大赛中相遇!!! 写在前面 最近突然之间讨论腾讯广告赛的人多了不少,也有很多人加我微信讨论19年腾讯赛的方案和代码.虽然2020腾讯赛还未开始,不过大家已经提前进入 ...
- 腾讯广告算法大赛2019
大赛地址 https://algo.qq.com/application/home/information/info.html 大赛介绍 作为国内领先的大数据营销平台,全新升级的腾讯广告,以更强大的全 ...
- 2020腾讯广告算法大赛:赛题理解与解题思路
写在前面 期待已久的2020腾讯广告算法大赛终于开始了,本届赛题"广告受众基础属性预估".本文将给出解题思路,以及最完备的竞赛资料,助力各位取得优异成绩!!! 报名链接:https ...
- 百万奖池,鹅厂offer,2020腾讯广告算法大赛等你来战!
允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 2020腾讯广告算法大赛再度起航,即日起至5月31日,赛事正式面向全社会启动线上招募,一场算法之间的"巅峰对决"即将上 ...
最新文章
- 线程对象Android 开发之多线程处理、Handler 详解
- java tag和flt区别,这些年,我爬过的 Android 坑 | 持续更新
- x86_64编译JPEG遇到Invalid configuration `x86_64-unknown-linux-gnu'
- shell自动生成的文件有一个问号的后缀
- Oracle笔记 五、创建表、约束、视图、索引、序列、同义词、表空间
- svg实现loading效果
- 单元测试实践的主要问题与解决(2)
- 数组转ArrayList的正确方式
- 蓝桥杯青少年创意编程大赛题解:STEMA
- layui搭建后台管理页
- Google Play 新增付款功能一览表
- 使用js修改图片像素颜色并保存
- 闲云野鹤:吃鸡(二)之场景制作—雾效的制作
- Android sharesdk 集成Google登陆,报错Success,{isSigin:false}
- linux 用户相关操作
- 电脑控制android 电视,怎么用电脑控制电视 电视应用安装器使用教程
- CE认证机构和CE证书的分类
- Visual Studio 2005 下载地址 V8各种版本官方下载网址
- windows下搭建stpiges转换成gltf格式环境
- E710芯片系列模块的特性
热门文章
- 字体变体font-variation-*
- 面包板的使用-----看板子反面即可
- STM32PCB原理图
- 《念奴娇·赤壁怀古》古词鉴赏
- 鸿蒙大陆v2.8正式版,鸿蒙大陆正式版地图下载-鸿蒙大陆下载 V2.22--pc6下载站
- 武汉坚守第三十二天——鱼菜价格已超高,病死猪肉现武汉
- 关于DEV-c++ 运行窗口闪退的解决办法
- 关于小学计算机论文题目,经典小学计算机课论文选题 小学计算机课论文题目怎样定...
- python输出最大的素数_Python中的最大素数回文
- 数据结构:算法的时间复杂度和空间复杂度