腾讯广告算法大赛高手云集,在围观比赛的过程中你一定也有了不少心得体验!想要分享这份感受却无处诉说?本期我们接受了来自大赛粉丝的投稿,让我们来一起看看萌新们都有什么收获吧!

作为一个数据竞赛经验很少的小萌新,我想谈一谈我的感受。在上一届腾讯广告算法大赛期间,我还没有开始尝试参加数据竞赛,对于各类算法的了解只停留在理论上。竞赛落下帷幕后,我才开始参加数据竞赛,逐渐尝试特征工程,熟悉xgboost、lightgbm等各个框架。从代码到原理,各个竞赛给了我很大的帮助。这里我想谈一谈在学习上一届腾讯广告算法大赛开源资料时我的感受。

数据方面

以往参加过的比赛数据量都不大,笔记本的内存就可以驾驭。但是也存在一些问题,一方面,企业采集到的数据往往质量不是很好;另一方面,主办方数据预处理的不当,也会对特征提取、模型建立造成一些干扰。有时还会遇到全匿名的数据,企业对于数据含义的隐瞒会对特征工程造成很大的阻碍。

腾讯广告算法大赛的数据,主要的特点体现在数据量大数据质量很好上。虽然数据量会让我们这些没有机器的小萌新望而却步,但是数据来源于真实场景,数据质量的优异使得选手对于模型和算法的测试更加顺利。数据质量原因造成的抖动干扰较小。

通过开源,也可以学习到处理大数据时节约内存的Trick,运用流式和分块的方式处理数据,在代码优化方面很有帮助

模型方面

以往参加过的比赛几乎是lgb和xgb的天下。拿到数据后,几乎只要按着EDA->特征工程(业务特征和统计特征)->建立模型->调参->模型融合的步骤逐步尝试,就可以得到不错的结果。但是对于腾讯广告大赛的赛题,需要更多专业知识来支撑。排名较前的开源中不再会出现大部分都是lgb的状况了。

令我感悟较深的是,腾讯广告算法大赛并不是一个树模型独领风骚的普通比赛。通过参加腾讯广告大赛,可以学到很多知识,比如CTR相关的xdeepfm、nfm等较新的模型。在参与大赛的过程中,可以重读论文,再构建论文的框架并结合数据本身进行修改。我认为,不支持在lgb和xgb的基础上无脑堆特征,使得参赛者以更加积极的方式参与其中,正是这场比赛的魅力所在。

其他想说的

竞赛主题方面,国内举办的CTR比赛可谓是数不胜数,腾讯广告大赛无疑是质量最高的比赛之一。深入思考业务场景的时所得到的特征构建方法,在以后的同类型比赛中依然适用,诸多大佬优秀的思路在以后的比赛中仍然值得回顾。在一系列算法比赛中,积攒trick和规则的珍贵经验是十分有益的。

另外,腾讯广告算法大赛这个平台给了在校学生交流的渠道。还没开赛就认识了许多大佬,可以说是非常开心了。看群里各位大神的算法思路,收获颇丰。腾讯广告大赛即将开始,作为一个小萌新,希望在参赛过程中,能学(拿)到更多知(Q)识(币)

腾讯广告算法大赛 | 萌新粉丝投稿讲述数据竞赛小白观赛心得相关推荐

  1. 往届选手心得分享:腾讯广告算法大赛萌新指南

    第一届腾讯社交广告高校算法大赛以"移动App广告转化率预估"为主题,首次开放腾讯在社交和数字广告领域的"实战类"数据,以高度模拟真实业务的赛题方式呈现,并直指数 ...

  2. 【赠书】腾讯广告算法大赛冠军、Kaggle Grandmaster倾力打造,涵盖Kaggle、阿里天池等赛题...

    随着互联网时代的到来,以及计算机硬件性能的提升,人工智能在近几年可以说是得到了爆发式的增长.互联网时代带来了大量的信息,这些信息是名副其实的大数据.另外,性能极佳的硬件也使得计算机的计算能力大大增强, ...

  3. 腾讯广告算法大赛冠军、Kaggle Grandmaster倾力打造,涵盖Kaggle、阿里天池等赛题...

    随着互联网时代的到来,以及计算机硬件性能的提升,人工智能在近几年可以说是得到了爆发式的增长.互联网时代带来了大量的信息,这些信息是名副其实的大数据.另外,性能极佳的硬件也使得计算机的计算能力大大增强, ...

  4. 官宣,重量级评委团强势加持腾讯广告算法大赛

    ​ 自2017年开展首届以来,腾讯广告算法大赛已成功举办四届,随着赛事影响力的不断扩大,腾讯广告算法大赛已然成为全球最受瞩目的算法竞技赛事之一.2021年腾讯广告算法大赛更是与国际顶会ACM Mult ...

  5. 【国庆赠书】腾讯广告算法大赛冠军、Kaggle Grandmaster倾力打造,涵盖Kaggle、阿里天池等赛题...

    值此国庆佳节,给大家赠书啦!祝大家假期快乐!(可在文末参与活动) 随着互联网时代的到来,以及计算机硬件性能的提升,人工智能在近几年可以说是得到了爆发式的增长.互联网时代带来了大量的信息,这些信息是名副 ...

  6. 大神备赛干货:腾讯广告算法大赛冠军教你玩出大赛新高度

    2019年腾讯广告算法大赛的战鼓已然敲响.今年的大赛将广告曝光预估作为选题,紧紧贴合了最in的数字营销趋势,将理论模型应用于实践. 为了更好的帮助大家准备今年的赛事,本期我们特地邀请了李强同学为大家分 ...

  7. 腾讯广告算法大赛 | 专家开小灶,独家解析Lookalike那些事儿

    相似人群拓展(Lookalike)技术作为2018腾讯广告算法大赛赛题,考察选手的算法能否在大量备选人群中准确标定与种子人群包特征相符的人群.本次大赛联动腾讯各方资源,携手知名学术专家为行业带来一场广 ...

  8. 一文梳理2019年腾讯广告算法大赛冠军方案

    ‍‍ 点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 作为从本次比赛共157队伍中脱颖而出的冠军方案,评分达到87.9683,从数据清 ...

  9. 百万奖池,鹅厂offer,2020腾讯广告算法大赛等你来战!

    允中 发自 凹非寺  量子位 编辑 | 公众号 QbitAI 2020腾讯广告算法大赛再度起航,即日起至5月31日,赛事正式面向全社会启动线上招募,一场算法之间的"巅峰对决"即将上 ...

最新文章

  1. HttpMessageConverter转换类型
  2. .NET开发Windows服务
  3. 绝对路径VS相对路径
  4. 消费者服务消费延时分析
  5. oracle 设置忽略关键字,记oracle里continue关键字的陷阱
  6. ModuleNotFoundError: No module named ‘distutils.util‘
  7. 光复用技术中三种重要技术_【技术文章】X射线无损检测仪在锂电池行业中的重要应用...
  8. The Bayes Risk选择的问题
  9. 2021-09-14 if__name__ == ‘__main__‘的用法
  10. linux删除蓝色文件夹,linux删除文件报错
  11. MDK Keil 使用STLink仿真,LOAD按钮为灰色解决方法
  12. 供应商太多,怎么才能高效比价?
  13. InputStream 、FileInputStream、InputStreamReader 、BufferedReader的区别
  14. Python3 利用阿里接口,根据银行卡号获取银行名称和logo
  15. [VBA学习]关于Formula以及数字格式的问题
  16. KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架
  17. oracle小麦苗博客,《Oracle DBA工作笔记》第一章
  18. 如何发现「将死」的ReLu?可视化工具TensorBoard助你一臂之力
  19. 韩商言喊你来使用模切ERP系统
  20. 如何学习编程?怎样学好编程?

热门文章

  1. 数据:BTC全网算力为134.17 EH/s,新增地址数51.05万
  2. Axure高保真智慧校园管理系统/校园管理/人事管理/学籍管理/教学管理/流程审批/备课管理/考务管理/成绩管理/排课管理/选课管理/选课系统/调课申请/教师考评管理/web端管理系统
  3. Object C学习笔记15-协议(protocol)
  4. Jmeter(二)目录介绍
  5. 奇异值分解(SVD)原理详解及推导(转载)
  6. c#进阶之lambda表达式
  7. bzoj2661: [BeiJing wc2012]连连看
  8. [Nginx] – 性能优化 – 配置文件优化
  9. jira7.3.6的安装步骤
  10. Unix Vi 命令详解