Datawhale干货

作者:YueTan,数据竞赛TOP选手

扉页故事:落地的模型才是好模型,但不一定是评委眼里的好模型

前情回顾

上回我们讲述了:故事讲不好,名次降到老,主题是黑化后,菜鸡如何立人设。在开口介绍模型之前,先声夺人,让评委觉得这人能处。本文我们将主题再次升华: 平凡模型如何包装。

我只示范一次,看好了世界

距离我上次答辩已经很久了,当时我介绍的模型是这样的:

用的是“规则模型和LGB模型串并联融合”模型。案发那天,如果看了开源代码,真实情况其实是这样的:

一个简单的规则,包装成了评委喜闻乐见的创新模样。良心还未完全泯灭,给的权重是0.95和0.05,懂得都懂。

趁黑化没有完全黑化,我先主动坦白了。突破了道德的牢笼,很爽;做一个反面人物,很舒服!但是嘴上记得大声说:

以上只是个例示范,接下来我们从更系统的方法论介绍,如何吹嘘自己的模型。

中国古拳法-三板斧

这里介绍的是江湖上失传已久的中国古拳法秘诀,知名答辩专家YueTan总结的“模型三板斧”,普通的评委根本挨不过三斧。(当然,现实生活里,我被评委杀疯了)

这三斧就是“漂亮衣服”“好歌” + “丰富早餐”

第一斧:漂亮衣服

漂亮衣服,顾名思义,指的是一张好看的模型图。利好深度学习,比如论文里各种各样的图:

多看论文,随手就是案例。可以借助这个repo里的素材进行创作:https://github.com/dair-ai/ml-visuals

如果用的是树模型,是不是比较尴尬?早让你们少用了。这样吧,没有漂亮模型图,就画一张漂亮的pipeline图:

业内一流PR高手阿里的选手是怎么做的呢?来自kdd比赛队伍88VIP。一开始觉得这只队伍名字略显低俗,看论文才知道是达摩院大佬,名字也就解释的通了。方案很优秀,但看到报告的时候,更让我惊艳的是这张图

这要是我画的就好了。整体流程不仅清晰,关键是一看就知道:

毕竟连顶会都需要一张好看的poster,做一张漂亮的图不过分吧

第二斧:好歌

好歌,顾名思义,指的是模型里让人眼前一亮的优化,代表了上分路径的优秀故事。这个亮点,再像一首好歌一样徐徐展开,详细阐述我们如何用创新的方法解决了一个业内困扰的问题。

想归想,哪来那么多创新和问题,很多时候明明LGB梭一下就好了嘛。

有困难就客服困难上,没有困难创造困难也要上。正所谓:只要思想不滑坡,办法总比困难多。既然办法比困难多,那我们虚拟几个困难然后介绍一下方法也很合逻辑吧,我称之为:灵活创新。

创新不是可口可乐,全世界一个味,也不是信口开河,而是和数据挖掘一样,本身也是一种技术。克林,小时候在少林寺习武,本来就和几个师兄一样全都是光头。但他在评委老师面前是这样讲的:

再配上一句你看武天老师也是光头。这就是既讲了真话,也拍了马屁,值得学习。

这里介绍灵活创新的两个基本套路:bottom-up和top-down方法。bottom-up自底向上,先发现问题然后找解决方法。例如推荐比赛里,发现冷启动或序列信息是关键点,做实验找到一种好的提取思路,答辩时就对此大书特书,作为亮点。

top-down自顶向下的方法则是,先找到某种优化最好,然后往回推问题,再从问题开始介绍。实践中尝试了若干种方法,发现模型A最好。去查模型A的论文,论文里介绍了模型主要解决的是B问题。答辩时,我们就开始强调B问题,然后讲模型如何解决,并且在模型A基础上进一步优化,作为亮点。

表现形式可以画出不同操作的消融实验图,这个图一定要多强调“眼前一亮的优化”。当然,如果本身用的就是跨领域模型,那已经足够了。

第三斧:丰富早餐

丰富早餐,顾名思义,代表的是整齐而完备的对比实验,丰富的模型对比既可以突出第二斧中的独具匠心,也隐晦的表达了自己没有功劳也有苦劳,是有很多实验和思考的正经人,和坐在角落靠运气来答辩的YueTan不是一路货。

很多比赛,并没有大杀器。就和工作中的许多项目一样,其实没什么值得一提。如果用做比赛如治大国里的例子讲述,那就是

繁文缛节是立国之本,大婴自有国情在此。即使是一个普通模型,也是做了很多实验精心选出来的,是值得肯定的。

总结

以上的三斧都是为了向评委售卖我们的故事,再简要回顾一下:

- 第一斧:漂亮衣服。清晰地给听众展示整体和全局思路

- 第二斧:好歌。针对具体问题,眼前一亮的创意。有效的方法背后一定能挖掘出一个好的故事。

- 第三斧:丰富早餐。针对模型选型对比,做了丰富而可信的实验才科学地选出了最终方案。

三斧下来,有漂亮的模型图,有眼前一亮的优化,有丰富实验对比。再加上第一讲里我们塑造的大佬人设,稳了。这就是中国古拳法秘诀了,其实也是一个自然而然、水到渠成的过程。欢迎大家试用,只有一个要求:

干货学习,三连

模型包装,答辩吹牛方法论!相关推荐

  1. 新媒体运营教程:AARRR模型之留存有关方法论

    关于用户增长的留存环节AARRR模型之留存有关的概念. 1.留存指,用户持续完成关键行为:1)用户的留存要与关键行为挂钩:2)如果留存用户并没有完成关键行为,很有可能在免费试用期结束后离开产品 2.留 ...

  2. 提升Kaggle模型的实用小技巧!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 译者:张峰,Datawhale成员 如果你最近刚入手Kaggle,或者你 ...

  3. gpu处理信号_在PyTorch中使用DistributedDataParallel进行多GPU分布式模型训练

    先进的深度学习模型参数正以指数级速度增长:去年的GPT-2有大约7.5亿个参数,今年的GPT-3有1750亿个参数.虽然GPT是一个比较极端的例子但是各种SOTA模型正在推动越来越大的模型进入生产应用 ...

  4. 看EyeEm如何在产品开发中整合、运用深度学习模型

    原文:One Model At A Time: Integrating And Running Deep Learning Models In Production At EyeEm 作者:Miche ...

  5. 两种最为常用的数据挖掘方法论

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 鸣筝金粟柱,素手玉房前. 「数仓宝 ...

  6. 手把手带你玩转Spark机器学习-使用Spark构建回归模型

    系列文章目录 手把手带你玩转Spark机器学习-专栏介绍 手把手带你玩转Spark机器学习-问题汇总 手把手带你玩转Spark机器学习-Spark的安装及使用 手把手带你玩转Spark机器学习-使用S ...

  7. 职业能力提升方法论——4W1H

    作为一名程序员,也是一名资深职业工作人,对于在企业内做事总结出了自己的一套方法论.我这方法的目标是为了把产品做好.按照我的方法论去形成一套适用于自己思考的思维,就可以一劳永逸,所有的事情都可以按照这个 ...

  8. detectron2模型使用、读写、训练及测试

    1.使用模型 在detectron2模型(及其子模型)是由功能,如内置build_model,build_backbone,build_roi_heads: from detectron2.model ...

  9. 用对比学习训练说话人初步验证模型

    作者|OngKoonHan 编译|Flin 来源|towardsdatascience 在我大学的Android开发课程的组项目部分中,我们的团队构建并部署了一个认证系统,通过说话人的语音配置文件进行 ...

最新文章

  1. Tomcat的系统架构(以Tomcat5为基础)
  2. PMCAFF微分享 | 阿檬:如何设计好工具型软件?产品经理必备技能
  3. ff14拆区后哪个服务器人最多,FF14拆区可以转服吗 拆区期间转服教程
  4. 自定义曲线_Qt编写的项目作品17-自定义曲线图柱状图
  5. POJ1149 最大流(Isap)
  6. 曹则贤:从一元二次方程到规范场论 | 中国科学院2022跨年科学演讲
  7. 任务宿主阻止关机解决方案
  8. 云会议是什么?如何提升云会议的协同能力?
  9. Fisher information解释和数学意义
  10. 小米的抢购骗局+小米的抢购页面的源代码分析(二)文本数组的分析
  11. 如何调试微信内置浏览器应用(企业号、公众号、订阅号)
  12. uIP resolv_found的实现
  13. python判断素数程序_python素数判断
  14. 将服务器文件夹映射到windows本地(映射网络驱动器)
  15. nand flash制备
  16. 硕士论文参考文献编号排版
  17. 计算机网络管理员工作周记,计算机java开发实习周记20篇
  18. 【项目精选】户籍管理系统(视频+论文+源码)
  19. 猎豹移动Q3手游业务环比增106% 《砖块消消消》表现优异
  20. Linux性能优化大师-系统优化漫谈

热门文章

  1. 在Android的 设置-显示 中增加控制屏幕旋转方向的选项
  2. 5年Java面试阿里P6经验总结
  3. [DAX] 日期时间函数
  4. 小技巧(2):谷歌网盘容量15G不够用?不科学上网谷歌网盘下载速度太慢?试一下这个“Google teamdrive开通”+“GDIndex链接Google Drive”
  5. Excel - 自动填充
  6. win7中如何设置默认打印机
  7. 海思3559万能平台:VGS的画线处理
  8. 择时 配置 选股0909
  9. Unity+Vuforia实现AR图片识别应用
  10. 大掌门2显示服务器繁忙,大掌门2新手攻略_游戏功能详细攻略(新手攻略二)_软吧...