点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗?

CVPR 2022的一篇研究通过将决策边界 (Decision Boundary)可视化的方法,给出了答案——

有的容易,有的很难。

例如,从下面这张图来看,研究人员就发现,ViT比ResNet要更难复现(两次训练过后,显然ViT决策边界的差异更大):

研究人员还发现,模型的可复现性和模型本身的宽度也有很大关联。

同样,他们利用这种方法,对2019年机器学习最重要的理论之一——双下降 (Double Descent)现象进行了可视化,最终也发现了一些很有意思的现象。

来看看他们具体是怎么做的。

更宽的CNN模型,可复现性更高

深度学习中的决策边界,可以用来最小化误差。

简单来说,分类器会通过决策边界,把线内线外的点归为不同类。

在这项研究中,作者从CIFAR-10训练集中选择了三幅随机图像,然后使用三次不同的随机初始化配置在7种不同架构上训练,绘制出各自的决策区域。

从中我们可以发现:

左边三个和右边四个差异很大,也就是说不同架构之间的相似性很低。

再进一步观察,左边的全连接网络、ViT和MLP Mixer之间的决策边界图又不太一样,而右边CNN模型的则很相似。

在CNN模型中,我们还可以观察到不同随机数种子之间明显的的重复性趋势,这说明不同初始化配置的模型可以产生一样的结果。

作者设计了一种更直观的度量方法来衡量各架构的可复现性得分,结果确实验证了我们的直观感受:

并发现更宽的CNN模型似乎在其决策区域具有更高的可复现性,比如WideRN30。

以及采用残差连接结构的CNN模型(ResNet和DenseNet )的可复现性得分比无此连接的模型要略高(VGG)。

此外,优化器的选择也会带来影响。

在下表中,我们可以看到SAM比标准优化器(如SGD和Adam)产生了更多可重复的决策边界。

不过对于MLP Mixer和ViT,SAM的使用不能总是保证模型达到最高的测试精度。

有网友表示好奇,如果通过改善模型本身的设计,能改变这种现象吗?

对此作者回应称,他们已经试着调整过ViT的学习率,但得到的结果仍然比ResNet差

可视化ResNet-18的双下降现象

双下降(Double Descent)是一个有趣的概念,描述是测试/训练误差与模型大小的关系。

在此之前,大家普遍认为参数太少的模型泛化能力差——因为欠拟合;参数太多的模型泛化能力也差——因为过拟合。

而它证明,两者的关系没有那么简单。具体来说:

误差会随着模型的增大而减小,然后经过模型过拟合,误差又增大,但随着模型大小或训练时间的进一步增加,误差又会再次减小

作者则继续使用决策边界方法,可视化了ResNet-18的双下降现象。

他们通过宽度参数(k:1-64)的改变来增加模型容量。

训练出的两组模型,其中一组使用无噪声标签(label noise)的训练集,另一组则带有20%的噪声标签

最终,在第二组模型中观察到了明显的双下降现象。

对此作者表示:

线性模型预测的模型不稳定性也适用于神经网络,不过这种不稳定性表现为决策区域的大量碎片。

也就说,双下降现象是由噪声标签情况下决策区域的过度碎片引起的。

具体来说,当k接近/达到10 (也就是插值阈值)时,由于模型此时拟合了大部分训练数据,决策区域被分割成很多小块,变得“混乱和破碎”,并不具备可重复性;此时模型的分类功能存在明显的不稳定性。

而在模型宽度很窄(k=4)和很宽(k=64)时,决策区域碎片较少,有高水平的可重复性。

为了进一步证明该结果,作者又设计了一个碎片分数计算方法,最终再次验证上图的观察结果。

模型的可复现性得分如下:

同样可以看到,在参数化不足和过参数化的情况下,整个训练过程的可复现性很高,但在插值阈值处会出现“故障”。

有趣的是,即使没有噪声标签,研究人员发现他们设计的量化方法也足够敏感,可以检测到可复现性的细微下降(上图蓝线部分)。

目前代码已经开源,要不要来试试你的模型是否容易复现?

论文地址:

https://arxiv.org/abs/2203.08124

GitHub链接:

https://github.com/somepago/dbVi

点个在看 paper不断!

CVPR 2022 | 模型难复现不一定是作者的错,最新研究发现模型架构要背锅相关推荐

  1. (附链接)CVPR 2022 | 模型难复现不一定是作者的错,最新研究发现模型架构要背锅...

    编者荐语 在不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗? 转载自丨量子位 CVPR 2022的一篇研究通过将决策边界 (Decision Boundary)可视化的方法,给出了答案 ...

  2. 模型难复现不一定是作者的错,最新研究发现模型架构要背锅丨CVPR 2022

    丰色 发自 凹非寺 量子位 | 公众号 QbitAI 在不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗? CVPR 2022的一篇研究通过将决策边界 (Decision Boundar ...

  3. 不要再「外包」AI 模型了!最新研究发现:有些破坏机器学习模型安全的「后门」无法被检测到...

    来源:AI科技评论 作者:王玥.刘冰一.黄楠 编辑:陈彩娴 一个不可检测的「后门」,随之涌现诸多潜伏问题,我们距离「真正的」机器安全还有多远? 试想一下,一个植入恶意「后门」的模型,别有用心的人将它隐 ...

  4. 精准高效估计多人3D姿态,美图北航分布感知式单阶段模型(CVPR 2022)

    关注公众号,发现CV技术之美 本文转自机器之心 近日,计算机视觉顶会 CVPR 2022 公布了会议录取结果,美图影像研究院(MT Lab)与北京航空航天大学可乐实验室(CoLab)联合发表的论文被接 ...

  5. CVPR 2022|精准高效估计多人3D姿态,美图北航联合提出分布感知式单阶段模型...

    来源丨AI科技评论 编辑丨极市平台 近日,计算机视觉顶会CVPR 2022公布了会议录取结果,美图影像研究院(MT Lab)与北京航空航天大学可乐实验室(CoLab)联合发表的论文被接收. 该论文突破 ...

  6. 打打字就能指挥算法视频抠图,Transformer掌握跨模态新技能,精度优于现有模型丨CVPR 2022...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 都说Trans ...

  7. 中国小伙CVPR 18论文遭质疑:同行难复现,要求评议组撤稿

    安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 国庆前的这场学术风波,比以往时候来得都猛一些. 昨天,ID为p1esk的网友在Reddit论坛提出,国际顶会CVPR 18的接收论文Pert ...

  8. 何恺明时隔2年再发一作论文:为视觉大模型开路,“CVPR 2022最佳论文候选预定”...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 杨净 明敏 雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitA ...

  9. 入选CVPR 2022!一举打败16个同类模型,视频超分比赛冠军算法!

    来源:量子位 如何让模糊的老片变高清? AI的答案是超分辨率算法: 现在,在视频超分领域,有一个强大的算法拿下了超分比赛NTIRE 2021三冠一亚的优异成绩,登上了CVPR 2022. 它的名字叫做 ...

最新文章

  1. Tensorrt一些优化技术介绍
  2. luogu P1231 教辅的组成(建图、拆点、最大流)
  3. 数据中心级交换机考核方法
  4. 玛塔留言板无刷新留言板程序
  5. 洛谷OJ上的A+B花(zhuang)式(bi)解法
  6. ​苹果WWDC20确定6月22日线上举办;任天堂遭史上最大规模黑客攻击 ;Inkscape 1.0 发布 | 极客头条...
  7. 星际二 地图制作过程
  8. vb还是python强大-vb和python哪个速度快
  9. 最新软件设计师考试大纲
  10. 罚函数——内点罚函数算法
  11. Java JSP技术详解:(一)JSP 简介
  12. 抖音开展大规模打击刷粉、刷量,账号广告导流行动
  13. 读《弗洛伊德:作家与白日梦》
  14. 如何查找视频文件 android,如何扫描出android手机中所有的视频文件
  15. 遇到问题---CDH重启namenode--Command timed-out after 150 seconds--角色正在启动
  16. 判断三条边是否构成三角形
  17. 【数据库系统工程师】第13章 云计算与大数据处理
  18. 招聘网站 php mysql,求职招聘网站的设计与实现(PHP,MySQL)(含录像)
  19. 如何导出或删除Outlook.com搜索历史记录
  20. 2021-08-05

热门文章

  1. 《代码大全2》读后感czz
  2. 八种简易健康减肥瘦身法
  3. Matlab与线性代数 -- 数组的表示,冒号的用法
  4. 【数据结构】循环单链表的实现(C语言)
  5. 有的放矢,远程操控中实时音视频的优化之道
  6. 改名 Meta,打元宇宙牌,老龄化的 Facebook 能否再换新颜
  7. 用 Python 动态可视化,看看比特币这几年
  8. 赠书 | 图像分类问题建模方案探索实践
  9. XGBoost缺失值引发的问题及其深度分析 | CSDN博文精选
  10. 从原理到实现,详解基于朴素ML思想的协同过滤推荐算法