来源 | AI算法与图像处理

仅作学术分享,不代表本公众号立场,侵权联系删除

CV大神何恺明又出力作!论文「Masked Autoencoders Are Scalable Vision Learners」

Arxiv链接:

https://arxiv.org/pdf/2111.06377.pdf

现在,有人复现了这篇文章,而且是PyTorch的版本!

复现代码:

https://github.com/pengzhiliang/MAE-pytorch

何恺明大佬新作一发出来,知乎上就有众多大佬在讨论

具体链接:https://www.zhihu.com/question/498364155

除了大家对何恺明大佬的工作的肯定外(当然部分认为novelty不足),也引发对未来CV工作的思考,是否会引领类似去年 transformer那样子的热潮?亦或是证明ViT的各种改变可能都是没有意义的。

这次何恺明大佬又把握了技术发展的趋势,NLP和CV互相融合的工作看来会是大势所趋。

论文链接:https://arxiv.org/pdf/2111.06377.pdf

复现代码:

https://github.com/pengzhiliang/MAE-pytorch

项目结构:

详情:


版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!

公众号:AI蜗牛车保持谦逊、保持自律、保持进步发送【蜗牛】获取一份《手把手AI项目》(AI蜗牛车著)
发送【1222】获取一份不错的leetcode刷题笔记
发送【wx】加好友空闲时唠唠嗑~

何恺明一作论文 MAE 已有人复现!PyTorch 版!相关推荐

  1. 何恺明一作论文 MAE 已有人复现!PyTorch 版!(附链接)

    来源:AI算法与图像处理 本文多图,建议阅读5分钟 CV大神何恺明论文复现. 大家好,我是红色石头.之前介绍过CV大神何恺明又出力作!论文「Masked Autoencoders Are Scalab ...

  2. NeurIPS 2022 | 何恺明团队新作:MAE扩展到视频!学习时空表示,最优Mask比例高达90%!...

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 转载自:AIWalker 2021年末,何恺明团队提出MAE在CV届引起极大轰动,自上传到arxiv之后,各 ...

  3. ICCV 2017奖项公布:最大赢家何恺明获最佳论文,参与最佳学生论文

    当地时间 10 月 22 日,两年一度的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)在意大利威尼斯开幕.今日,大 ...

  4. 完整复现何恺明ICCV获奖论文结果并开源 !(附论文开源代码)

    ICCV 作为计算机视觉的顶级会议,2017年共收到2143篇论文投稿,比上一届ICCV2015的1698篇增加了26.2%.共621篇被选为大会论文,录用比例28.9%:poster.spotlig ...

  5. 再发力!Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版,超越Hinton的SimCLR,刷新SOTA准确率...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]无监督学习再发力!Facebook AI 研究团队的陈鑫磊.樊昊棋.Ros ...

  6. 何恺明一作MAE收录CVPR 2022 Oral!高达87.8%准确率!自监督领域新代表作

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:happy   |  转载自:极市平台 导读 何恺明提出一种用于计算机视觉的可扩展自监督学习方案Mas ...

  7. 如何从数学角度解释何恺明新作Masked Autoencoders (MAE)?

    何恺明最新一作论文 Masked Autoencoders(MAE)为自监督学习方法带来了一场革命,自提出以来,在 AI 领域内得到了极大的关注.MAE 不仅在图像预训练上达到了 SOTA 性能,更是 ...

  8. CVPR 2021大奖出炉!何恺明获最佳论文提名,第一届Thomas S. Huang 纪念奖颁发

    作者 | 陈大鑫.琰琰.青暮 就在刚刚,CVPR 2021最佳论文.最佳学生论文等奖项出炉了! 其实在前不久,CVPR 2021官方推特上就公布了本次CVPR 2021最佳论文奖的32篇候选论文,按照 ...

  9. 何恺明组新论文:只用ViT做主干也可以做好目标检测

    来源:机器之心 本文约3100字,建议阅读5分钟 arXiv上上传了一篇新论文,证明了将普通的.非分层的视觉 Transformer 作为主干网络进行目标检测的可行性. 做目标检测就一定需要 FPN ...

最新文章

  1. 华宇输入法linux,华宇拼音输入法DEB版能切换为五笔输入法,附操作方法
  2. FastDFS 集群配置(转载)
  3. fms3 NetConnection.Connect.Rejected 问题
  4. java中interrupt,interrupted和isInterrupted的区别
  5. docker 进入容器 开启一个新的bash窗口
  6. 如何给容器服务的Docker增加数据盘
  7. Mac中Finder是什么?怎么打开?
  8. mysql 113_Centos 下 can't connect mysql server 113
  9. 啥是符号式API,命令式API:TF 2.0两种搭建都支持,该怎么选?
  10. SHA256算法详解及python实现
  11. 新手支付对接流程重点
  12. 我们真的会去吃3D打印食品吗?
  13. Unity3d 利用 AvproVideo 播放带透明通道mov视频在部分电脑无法播放的解决方案
  14. 「津津乐道播客」#397 厂长来了:怎样用科技给法律赋能?
  15. VUE+element 上传视频
  16. Beeline 的进阶使用
  17. PDF转换成Word
  18. wiredtiger java_mongodb数据库损坏,丢失WiredTIger.wt等meta文件,通过collection*.wt恢复数据...
  19. 【十年磨一剑】我们能从阿里架构师的身上学到什么?
  20. 通常把计算机网络定义为什么?,通常把计算机网络定义为什么

热门文章

  1. wps表格保存html,网页中的数据怎么导入excel表格数据-怎么把网页数据导入到wps表格中...
  2. 详解时间与空间复杂度
  3. 程序员这条路,选择深耕技术,还是全面学习比较好?
  4. 朋友圈大数据:你的朋友圈出卖了你,大数据就是这么给力!!!
  5. 最全大数据就业前景分析!此篇文章给你答案
  6. 这5个免费音效素材网站,你一定要收藏好~
  7. C语言 模拟键盘、鼠标事例
  8. 毕业论文开题报告怎么写
  9. 开源Api后台服务/管理系统 HoServer
  10. kodi linux版本,Linux下安装多媒体中心 Kodi 18.8 新版本并设置中文界面