乾明 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

在没有改变计算复杂度的情况下,只是使用“调整学习率”和“修改特定卷积层的步幅大小”等方法,就将ResNet- 50在ImageNet上的top-1验证准确率从75.3%提高到79.29%。

这个成果来自于亚马逊近期发表的一篇论文《Bag of Tricks for Image Classification with Convolutional Neural Networks》,作者为李沐带领的AWS研究团队。

论文摘要中表示,这篇论文的中的方法和结论也能适用于其他任务,比如目标检测、语义分割等等。

最近,Reddit机器学习版块有人发帖称,自己也整理了各种各样调整改善深度学习模型的方法,比亚马逊的论文中提到的方法还要多。

他将这些内容做成了PPT,一共70多页,涵盖了16篇经典论文和两篇博客文章。

目前,这个帖子在Reddit上的分数已经超过了150,GitHub上的Star也超过了400。

PPT里面讲的是啥?

这份PPT,主要有7个主题,分别是:

  • 调整学习率

  • 调整小批量的规模

  • 调整优化器和权值衰减

  • 调整特征和标签

  • 调整特征和标签(mixup)

  • 调整初始条件

  • Shake-shake正则化

每一个主题,都基于相对前沿以及效果较好的论文来进行分析。比如调整学习率这一主题,作者就选择了《Cyclical Learning Rates for Training Neural Networks》等3篇论文。

这篇论文最后的修订日期为2017年4月4日,这篇论文的主要就是从学习率的角度来谈怎么训练深度学习网络,并提出了一种名为循环学习率(cyclical learning rates)的新方法。

PPT中,作者对论文中的方法与思路进行了梳理,并给出了注释。

最后,作者也对亚马逊的论文《Bag of Tricks for Image Classification with Convolutional Neural Networks》进行了梳理与总结。

写这份资源的是谁?

PPT上的信息显示,这个PPT的作者是Krzysztof Kolasiński,来自一家名为FORNAX.ai的公司。

Linkedin上的介绍称,Krzysztof Kolasiński是这家公司的机器学习工程师,波兰人。他是一位物理学博士,专门研究计算物理学中的量子传输问题。

传送门:

PPT传送门:

https://github.com/kmkolasinski/deep-learning-notes/blob/master/seminars/2018-12-Improving-DL-with-tricks/Improving_deep_learning_models_with_bag_of_tricks.pptx

在量子位公众号(QbitAI)对话界面回复“70页报告”,也可直接下载PPT~

活动报名

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

16篇论文、70多页PPT帮你优化深度学习模型,免费下载 | 资源相关推荐

  1. 和免疫荧光标记说拜拜 | 谷歌Cell论文:深度学习模型预测荧光位置

    Root 发自 凹非寺 量子位 出品 | 公众号 QbitAI 在生物医学的研究里,显微镜可以帮助科学家们观察定位细胞水平或分子水平的物质. 常用的相差显微镜观察法,是从生物组织的一侧给光,对细胞损伤 ...

  2. 16篇论文入选AAAI 2021,京东数科AI都在关注什么?(附论文下载)

    近日,国际人工智能领域顶级学术会议AAAI2021(第35届AAAI)论文收录结果出炉.在国内AI阵营前列的京东数科以高达16篇论文的入选量成为本届AAAI的一大黑马.其研究方向包含了联邦学习.对抗学 ...

  3. 想了解推荐系统最新研究进展?请收好这16篇论文

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  4. AAAI 2023 | 腾讯优图实验室16篇论文入选,含多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向...

    关注并星标 从此不迷路 计算机视觉研究院 转自腾讯优图 近日,AAAI 2023(Association for the Advancement of Artificial Intelligence) ...

  5. 论文速递:AAAI 2023 | 优图16篇论文速览,含多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向

    近日,AAAI 2023(Association for the Advancement of Artificial Intelligence)国际先进人工智能协会公布了录用结果,本届会议共有8777 ...

  6. ICCV 2023 | 腾讯优图实验室16篇论文入选,含掌纹生成,人脸隐私保护,图像和谐化等研究方向...

    关注公众号,发现CV技术之美 本文转自腾讯优图实验室. 作为全球计算机领域顶级的学术会议之一,ICCV2023(International Conference on Computer Vision) ...

  7. 超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 1

    文章简介 本文从视觉问答(VQA)任务出发,讲述了 2015 年任务的定义开始,接踵出现的各种多模态技术.从无注意力机制的深度学习模型,发展到天然适合注意力机制的多模态场景的模型,再到基于 Trans ...

  8. 复现计算机论文模型,深度学习模型复现难?看看这篇句子对模型的复现论文

    原标题:深度学习模型复现难?看看这篇句子对模型的复现论文 在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 ...

  9. 【完结】你对深度学习模型的理解是否足够深刻,这12篇文章可以作为一个参考...

    文/编辑 | 言有三 好的模型结构是深度学习成功的关键因素之一,不仅是非常重要的学术研究方向,在工业界实践中也是模型是否能上线的关键.对各类底层深度学习模型设计和优化技术理解的深度是决定我们能否在深度 ...

最新文章

  1. opencv线结构光三维重建
  2. 下边框_OPPO Find X2颜值有多高?超窄下边框+瀑布屏,看完大写的服气
  3. Scala学习笔记(7)-函数式对象
  4. 分享Spring中Bean的4种依赖检查模式
  5. mysql的命令行安装,忘记密码,密码重置问题
  6. C++中virtual关键字的用法
  7. Mac idea中git igenore设置
  8. python表示当前对象_对象操作
  9. 实现一个简易版的微博,包含 client 和 server 两部分,并实现四个基础功能:关注、取关、发微博、获取用户微博列表
  10. iOS/Android自动化云测试工具iTestin 1.0发布
  11. 百度入股汽车照明模组晶合光电
  12. activiti中的查询sql
  13. RED-Net神经网络
  14. Xcode6 app沙盒目录
  15. datatables分页,排序,ajax请求等参数设置
  16. Android图像处理(五)镜像、倒影、drawBitmapMesh实现旗帜飘扬效果
  17. 区块链MMO游戏该如何设计Token经济?
  18. php商城伪静态,友价商城nginx伪静态源码规则
  19. awk以空格为分隔符的问题
  20. UE4 的 VR 视野破碎或右眼错误的解决方案 —— 从 Ocean Floor Environment 项目

热门文章

  1. 一文看懂 BDTC 2018:探秘大数据新应用(附 PPT 下载)
  2. 腾讯回应封杀区块链公号;红芯服务国企非因浏览器;苹果弃用高通芯片 | 极客头条...
  3. 金三银四我带你去BAT面试现场,干货整理
  4. html5触摸指定区域,HTML5/CSS3系列教程:HTML5 区域(Sectioning)的重要性
  5. android8修改默认壁纸,给surfaceview设置默认背景
  6. java怎么实现tab切换_[Java教程]用javascript实现tab切换
  7. python 计算数字位数_Python 统计位数为偶数的数字的代码
  8. python123蟒蛇代码_[蟒蛇菜谱] Python封装shell命令
  9. java中数组的返回值是什么类型_面试必问:Java中String类型为什么设计成不可变的?...
  10. 计算机科学与技术的应用图,安徽农业大学计算机科学与技术视图及其应用.ppt...