接上一篇

P31P32

CV大神——何恺明

n 2003 年 5 月,何恺明拿到保送清华的资格,高考获得满分 900 分的成绩,成为当年广东省 9 位满分状元之一。
n 本科就读于清华大学,博士毕业于香港中文大学多媒体实验室。
n 2011 年加入微软亚洲研究院( MSRA )工作,主要研究计算机视觉和深度学习。
n 2016 年,加入 Facebook AI Research ( FAIR )担任研究科学家。
n 2020 年 1 月 11 日,荣登 AI 全球最具影响力学者榜单。

故事还没完……

n 2021 年 12 月中旬, Facebook AI Research 和约翰霍普金斯大学的研究人员提出了 MaskFeat ,也是采用「 Mask-and-Predict 」的方法,性能却比 MAE 上更进一步。
n MaskFeat 最核心的改变就是将 MAE 对图像像素( pixel )的直接预测,替换成对图像的方向梯度直方图( HOG )的预测。


以上为叶梓老师上课讲义,供有基础的朋友或者同行使用,未完,下一篇继续……

ai讲师人工智能讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-14相关推荐

  1. 人工智能培训老师讲师叶梓:计算机视觉领域的自监督学习模型——MAE目录

    免费直播分享最新人工智能前沿技术,直播即将开讲 P1 目录 n背景知识介绍 l AE ( AutoEncoder )与 DAE ( Denoising AutoEncoder ) l Transfor ...

  2. 人工智能培训老师讲师叶梓:计算机视觉领域的自监督学习模型——MAE-1

    计算机视觉领域的自监督学习模型--MAE 主讲:   叶梓 P1-P2 AutoEncoder n 自动编码器是一种无监督的神经网络模型,它可以学习到输入数据的隐含特征,这称为编码 (coding) ...

  3. ai讲师人工智能讲师计算机视觉老师叶梓:计算机视觉领域的自监督学习模型——MAE-13

    接上一篇 P28P30 实验效果-ViT模型的影响 n 性能惊艳: ImageNet-1K 最高 87.8% .与当前 SOTA 自监督预训练方法相比,对于 ViT -B 的表现结果都很接近.对于 V ...

  4. ai讲师人工智能讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-15

    接上一篇 P32P33 故事还没完-- n2021年12月中旬,Facebook AI Research和约翰霍普金斯大学的研究人员提出了MaskFeat,也是采用「Mask-and-Predict」 ...

  5. ai人工智能培训讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-8

    接上一篇 P17-P18 BEiT n 让 BEIT 看很多的图片,随机遮住一些 patches ,让 BEIT 模型预测遮住的 patches 是什么 n 不断计算预测的 patches 与真实的 ...

  6. ai人工智能培训讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-7

    接上一篇 P14-P16 VAE n 按苏剑林的说法: VAE 本质上就是在常规自编码器的基础上,对 encoder 的结果(对应计算均值的网络)加上了"高斯噪声",使得结果 de ...

  7. ai人工智能培训讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-6

    接上一篇 P12-P13 BEiT n 在 BE i T 的论文中,作者 提出了一种名为遮盖图像建模( MIM )的预训练任务 : 图 像 有 2 两 种表示的形式:image patches 和 v ...

  8. ai培训师讲师叶梓:计算机视觉领域的自监督学习模型——MAE-5

    接上一篇 P9 P11 ViT中的Tranformer编码器 n Tranformer 编码器由 multi-head self-attention ( MSA )和 MLP 块的层组成. n 在每个 ...

  9. 人工智能培训老师讲师叶梓:计算机视觉领域的自监督学习模型——MAE-3

    接上一篇 P5 P6 iGPT n OpenAI 是一个想把一切 GPT 化,但是图像是个三维的数据(长 x 宽 x 通道),不像文字一样可以变成一维向量的序列.如果直接把图像的三维矩阵拼成二维也可以 ...

最新文章

  1. DateReader,DateAdapter,DateSet和SqlCommand的基本使用方法
  2. iOS开发 关于启动页和停留时间的设置
  3. 如何生成动态库 .dll 的符号 .lib 文件?
  4. 长沙理工大学第十二届ACM大赛-重现赛C 安卓图案解锁 (模拟)
  5. Representation Flow for Action Recognition论文解读
  6. CAD转换图片的小窍门
  7. Asp.net 邮件传输
  8. zsh: command not found: 解决方法
  9. java毕业设计古典舞在线交流平台mybatis+源码+调试部署+系统+数据库+lw
  10. 【opencv4】——fatal error: opencv2/opencv.hpp: No such file or directory #include <opencv2/opencv.hpp>
  11. JS仿写刮刮乐小例子
  12. AR unity制作阴影
  13. Golang之Shadowed Variables(幽灵变量)
  14. 新浪微博开发(五)AppList界面
  15. Ajax实现跨域请求
  16. 重学 Java 设计模式:实战组合模式(营销差异化人群发券,决策树引擎搭建场景)
  17. C++的成员函数声明与定义 —— 类外定义成员函数以及inline函数
  18. VB程序设计教程(第四版)龚沛曾-实验8-2
  19. 专访罗升阳:老罗的Android之旅(转载)
  20. 78、在建工程的临时室外消防用水量

热门文章

  1. 【大咖说】系列之《与数字化先锋共绘创新蓝图》
  2. 基于 python的猫、狗、鼠、兔宠物识别系统
  3. EOS调用Json-RPC接口
  4. mysql数据库2503_mysql安装出错2503
  5. 策略研究合竞价选股(源)
  6. php 中如何设置单元格跨行,HTML表格中单元格跨行跨列
  7. 手机打开网页显示500服务器错误怎么办,访问网站时出现500错误该如何解决
  8. 瞄准营销痛点,打造品牌精神的内在驱动力
  9. linux系统fuser命令,linux之fuser命令
  10. 启动SALOME时出现SyntaxError: (unicode error) utf-8 codec can‘t decode byte的解决办法