要点1

本文定义了一个新的任务:随机掩码图像重建任务。即随机的掩盖图像中的某些部分,然后重建出图像。

要点2

本文提出了一个掩码自编码器,用来解决随机掩码图像重建任务。该编码器是一个不对称的编码-解码器结构,将没有被掩盖的部分传入编码器进行编码,然后经过一个比较轻量级的解码器进行解码,从而实现重建任务。

要点3

作者总结说现在深度学习的方法大多数依靠不断加深模型来提高性能。在作者的研究中,在ImageNet上利用一个类似于NLP的简单方法就学到了一个强大的自编码器,这具有很强大的扩展性,让计算机视觉可能走上与NLP类似的道路。

要点4

图像和语言是不同的信号,这一点值得关注。图像仅仅记录了光的信号而不像单词能够分解成不同的语义信息。同样地,MAE重建出的像素也不是语义实体,因为作者是随机抽取的块而不是把目标抽取出来,所以与语义分割任务不同。

要点5

不同mask数量的结果展示

【自监督】何凯明新作MAE略读相关推荐

  1. 北大美女学霸力压大神何恺明新作MAE!怒摘12个SOTA,灵感竟来自16年前CVPR论文...

      视学算法报道   编辑:小咸鱼 好困 [新智元导读]近日,北大校友.约翰·霍普金斯大学博士生提出了一种新的方法:MaskFeat,力压大神何恺明的新作MAE,摘下12个SOTA! 什么叫卷? CV ...

  2. 深度了解自监督学习,就看这篇解读 !何恺明新作MAE:通向CV大模型

    点击上方"计算机视觉工坊",选择"星标" 干货第一时间送达 作者丨科技猛兽 编辑丨极市平台 导读 本文对何恺明的新作MAE进行了深度的解析,他提出一种用于计算机 ...

  3. 北大美女学霸力压何恺明新作MAE 怒摘12个SOTA,灵感竟来自16年前CVPR论文

    对白的算法屋分享 来源 | 新智元 编辑 | 小咸鱼 好困 **[导读]**近日,北大校友.约翰·霍普金斯大学博士生提出了一种新的方法:MaskFeat,力压大神何恺明的新作MAE,摘下12个SOTA ...

  4. GreenMiM:接地气的MiM,强强联合Swin Transformer和何凯明的MAE,没有大显卡也能跑起来

    ArXiv: https://arxiv.org/abs/2205.13515 Open Code: https://github.com/layneh/greenmim 摘要 这篇文章提出了一种针对 ...

  5. 紧跟大佬的步伐:关于我亲自动手复现了恺明新作MAE这件事

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨CW不要無聊的風格@知乎(已授权) 来源丨https://zh ...

  6. 较真的来了!这篇【硬核论文】为何恺明新作MAE提供了一种理论解释和数学证明...

    关注公众号,发现CV技术之美 昨天,arXiv上出现了一篇非常硬核的论文"How to Understand Masked Autoencoder".该论文为何恺明的最新一作论文& ...

  7. 何凯明团队又出新论文!北大、上交校友教你用ViT做迁移学习

    视学算法报道   编辑:LRS 好困 小咸鱼 [新智元导读]何凯明团队又发新论文了!这次他们研究的是如何将预训练好的ViT迁移到检测模型上,使标准ViT模型能够作为Mask R-CNN的骨干使用.结果 ...

  8. 何凯明团队又出新论文!联合北大、上交用ViT做迁移学习,效果惊人!

    ‍ 转自:新智元 [导读]何凯明团队又发新论文了!这次他们研究的是如何将预训练好的ViT迁移到检测模型上,使标准ViT模型能够作为Mask R-CNN的骨干使用.结果表明,与有监督和先前的自我监督的预 ...

  9. 基于tensorflow keras实现何凯明大神的Mask R-CNN的介绍

    基于tensorflow keras实现何凯明大神的Mask R-CNN的介绍 . 其英文的介绍说明,见如下网址. https://github.com/matterport/Mask_RCNN 中文 ...

  10. 人工智能大神何凯明往事与风华岁月

    文章目录 快速认识大牛 少年英才 CVPR最佳论文展露头角,去雾算法扬名天下 残差网络轰动业界 何凯明和贾扬清 机器视觉三剑客:何凯明.孙剑与汤晓鸥 何凯明治学方法 研究成果与代表作 参考 快速认识大 ...

最新文章

  1. 【网络协议】TCP分段与IP分片
  2. 2017辽宁冬令营-4.蚂蚁
  3. python 16进制加法_在python中追加2个十六进制值
  4. mutt的实现, mutt+msmtp+getmail配置
  5. Harris角点检测原理详解(转载)
  6. 贝叶斯思维 统计建模的python_贝叶斯思维统计建模的Python学习法
  7. 瑞幸咖啡公布对董事长兼CEO郭谨一调查结果:未发现不当行为
  8. Matlab和Fluent联合仿真实现涡激振动
  9. 3、查询省会(Python实现多行输入,以回车结束输入)
  10. 【书影观后感 十三】甲申三百七十八年祭
  11. Mac有些网址打不开问题解决办法
  12. python计算贷款购房月供、利息
  13. win10计算机控制面板在哪里,Win10控制面板在哪里?Win10怎么打开控制面板?
  14. win10 win11 创建共享文件夹 mac 苹果电脑共享 无internet 安全,你的电脑只能访问本地网络中的其它设备 共享文件夹会导致本地电脑无法上网,
  15. 高仿优酷Android客户端图片左右滑动(自动切换)
  16. 世界 5G 通信频段和运行模式
  17. 大数据挖掘永恒的定律?符号回归(Symbolic Regressor)
  18. 广东药科大学计算机专业分数线,2016广东药科大学录取分数线_省内分数线
  19. PAT 1130 Infix Expression——什么才是DFS?由“柳神遍历”写法引发的思考
  20. 盘点天才少年稚晖君彭志辉的知识体系

热门文章

  1. 定义控制台应用程序的入口点 ConsoleApplication
  2. 协程学习一:nty协程的设计原理及效率分析
  3. Umap高维数据可视化与降维
  4. javasript |仿百度换肤效果
  5. Axure RP 7.0 注册码
  6. linux系统usb触摸驱动,Linux ——usb触摸屏驱动 - usbtouchscreen
  7. Wpf初学 ---03设计一个优美的注册登录界面(连接数据库)
  8. Android个人日常消费理财_财务软件
  9. excel打开超链接不使用浏览器,使用默认图片浏览软件
  10. 820操作系统(2)进程管理