Datawhale干货

作者:阿水,Datawhale成员

如何更好的参与竞赛实践呢?当然是阅读论文了本文整理了竞赛常见库和模型的论文,涵盖树模型和深度学习模型。

Gradient Boosting

  • J. Friedman, Greedy Function Approximation: A Gradient Boosting Machine, The Annals of Statistics, Vol. 29, No. 5, 2001.

  • Friedman, Stochastic Gradient Boosting, 1999

  • T. Hastie, R. Tibshirani and J. Friedman. Elements of Statistical Learning Ed. 2, Springer, 2009.

Random Forests

  • Breiman, Random Forests, Machine Learning, 45(1), 5-32, 2001.

  • P. Geurts, D. Ernst., and L. Wehenkel, Extremely randomized trees, Machine Learning, 63(1), 3-42, 2006.

Regularized Greedy Forest

  • Rie Johnson and Tong Zhang. Learning Nonlinear Functions Using Regularized Greedy Forest. IEEE Transactions on Pattern Analysis and Machine Intelligence, 36(5):942-954, May 2014.

XGBoost

  • Tianqi Chen and Carlos Guestrin. XGBoost: A Scalable Tree Boosting System. In 22nd SIGKDD Conference on Knowledge Discovery and Data Mining, 2016

LightGBM

  • Guolin Ke, Qi Meng, Thomas Finley, Taifeng Wang, Wei Chen, Weidong Ma, Qiwei Ye, Tie-Yan Liu. "LightGBM: A Highly Efficient Gradient Boosting Decision Tree". Advances in Neural Information Processing Systems 30 (NIPS 2017), pp. 3149-3157.

  • Qi Meng, Guolin Ke, Taifeng Wang, Wei Chen, Qiwei Ye, Zhi-Ming Ma, Tie-Yan Liu. "A Communication-Efficient Parallel Algorithm for Decision Tree". Advances in Neural Information Processing Systems 29 (NIPS 2016), pp. 1279-1287.

  • Huan Zhang, Si Si and Cho-Jui Hsieh. "GPU Acceleration for Large-scale Tree Boosting". SysML Conference, 2018.

CatBoost

  • Anna Veronika Dorogush, Andrey Gulin, Gleb Gusev, Nikita Kazeev, Liudmila Ostroumova Prokhorenkova, Aleksandr Vorobev "Fighting biases with dynamic boosting". arXiv:1706.09516, 2017.

  • Anna Veronika Dorogush, Vasily Ershov, Andrey Gulin "CatBoost: gradient boosting with categorical features support". Workshop on ML Systems at NIPS 2017.

Deep Forest

  • Zhou, Z. H., & Feng, J. (2017). Deep forest. arXiv preprint arXiv:1702.08835.

TabNet

  • TabNet: Attentive Interpretable Tabular Learning

Transformer

  • Vaswani A , Shazeer N , Parmar N , et al. Attention Is All You Need. arXiv, 2017.

Bert

  • Devlin J , Chang M W , Lee K , et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. 2018.

prophet

  • Sean J. Taylor, Benjamin Letham (2018) Forecasting at scale. The American Statistician 72(1):37-45 (https://peerj.com/preprints/3190.pdf).

FTLR

  • McMahan, H. Brendan, et al. "Ad click prediction: a view from the trenches." ACM SIGKDD g. 2013.

Factorization Machines

  • Rendle, Steffen. Factorization machines. 2010 IEEE International Conference on Data Mining. IEEE, 2010.

FFM

  • Juan, Yuchin, et al. Field-aware factorization machines for CTR prediction. Proceedings of the 10th ACM conference on recommender systems. 2016.

DeepFM

  • Guo, Huifeng, et al. DeepFM: A Factorization-Machine based Neural Network for CTR Prediction. IJCAI. 2017.

“整理不易,三连

竞赛提升:必知必会的21篇论文!相关推荐

  1. [转载]企业网站建设必知必会

    原文地址:企业网站建设必知必会作者:刘红杰 慧桥研发中心的同事常跟我提及我们有不少客户对网站建设和网站推广的基本概念还不是很清楚.三言两语一时又无法给客户解释清楚,经常造成沟通障碍.于是萌生写一些企业 ...

  2. mysql日期维表sql文件_《MySQL必知必会》笔记(SQL练习+建表语句)

    站在巨人的肩上 Standing On Shoulders Of Giants 部分转自:https://www.jianshu.com/p/294502893128 https://blog.csd ...

  3. 猿创征文|计算机类学生必知必会的开发工具

    计算机类学生必知必会的开发工具目录 前言 一.浏览器工具 1.在线工具 2.插件扩展 二.优化电脑使用工具 1.notpad++ 2.plotplayer 3.Office Tool Plus--强大 ...

  4. 《渗透测试实践指南 必知必会的工具与方法 (原书第2版)》读书摘录

    ----------------------------------------------------------------------------分割线--------------------- ...

  5. SQL必知必会-进阶篇[SQL学习笔记]

    本篇博客是对于陈旸老师极客专栏"SQL 必知必会"进阶篇的笔记总结.需要学习资料可私信. 文章目录 第20课 数据库优化 第21课 数据库的设计范式都有哪些? 数据表的键都有哪些? ...

  6. 脑残式网络编程入门(三):HTTP协议必知必会的一些知识

    为什么80%的码农都做不了架构师?>>>    本文原作者:"竹千代",原文由"玉刚说"写作平台提供写作赞助,原文版权归"玉刚说&q ...

  7. 【web必知必会】—— 图解HTTP(下)

    [web必知必会]-- 图解HTTP(下) 原文:[web必知必会]-- 图解HTTP(下) 上一篇<图解HTTP 上>总结了HTTP的报文格式,发送方式,以及HTTP的一些使用. 本文再 ...

  8. asp sql ip地址排序_SQL必知必会读书笔记,30分钟入门SQL!

    点击上方SQL数据库开发,关注获取SQL视频教程 SQL专栏 SQL数据库基础知识汇总 SQL数据库高级知识汇总 来源:https://segmentfault.com/p/1210000011760 ...

  9. 风控人必知必会的征信知识

    二代征信相比一代征信,报告内容更为翔实,我们梳理了下,主要在以下方面有所不同: 一:逾期情况包括信用卡逾期.贷款逾期等所有的逾期记录都会保留5年,逾期.呆账,过期销户的内容也会保留: 二:个人信息的完 ...

  10. 风控成长之路---必知必会工具与业务

    关注 "番茄风控大数据",获取更多数据分析与风控大数据的实用干货. 偶然翻开多年前的笔记,当时踏入数据行业就是从人生的第一条select的代码开始.还好多年前做的笔记,网络云盘还为 ...

最新文章

  1. android+单利模式中传递context,Android的Context详解
  2. C和C++编程中static关键字的含义-修饰函数和变量
  3. mysql5.7查询多层json写法
  4. 不行!不能这样下去!
  5. Flutter中ListView动画OpenContainer动画Flutter径向过渡OpenContainer
  6. java 执行代码超时,如何在Java中使用超时调用一些阻塞方法?
  7. html5 音乐转盘,HTML5 幸运大转盘
  8. 第三章 Goroutine调度策略(16)
  9. 中国网络安全行业发展前景及投资战略研究报告(2022-2027年)
  10. 信息系统项目管理师 pdf_如何备考信息系统项目管理师?
  11. 重置win10 恢复原厂设置
  12. 带壳破解SMC补丁技术
  13. 艾永亮:新能源汽车补贴退潮后,谁在裸奔,各大车企该如何应对
  14. 分布式的坑(队列、缓存、分库分表、事务)
  15. 5. 穿过拥挤的人潮,Spring已为你制作好高级赛道
  16. “易+”开源 | 简单可信赖,GameSentry 正式开源
  17. SPSS数据分析中出现的常见问题总结
  18. SQLyog数据库导出数据 避免科学记数法
  19. Linux命令总结-cd
  20. chrome firefox 获取模拟微信浏览器

热门文章

  1. 杭电1175简单搜索 连连看
  2. 将Eclipse代码导入到AndroidStudio的两种方式
  3. Android通过ksoap2调用.net(c#)的webservice
  4. iOS 数字滚动 类似于老 - 虎- 机的效果
  5. WordPress qTranslate插件跨站请求伪造漏洞
  6. freebsd command
  7. 教育部办公厅关于2020-2021学年面向中小学生的全国性竞赛活动名单的公示
  8. DeepMind 打造 AI 游戏系统,可以玩扑克、国际象棋、围棋等,战斗力爆表
  9. 2021 IDEA大会圆满落幕,一文回顾大会精彩看点
  10. 持续推进预估时间问题研究,滴滴盖亚计划开放ETA数据集