D. Marr

计算机视觉领域的开山鼻祖。
”David Marr生于1945年1月19日,早年就读于剑桥大学,获得数学硕士、神经生理学博士学位,同时还受过神经解剖学、心理学、生物化学等方面的严格训练。他在英国曾从事新皮层、海马,特别是小脑方面的理论研究。1974年访问美国,并应M.Minsky教授之请,留在麻省理工学院开展知觉和记忆方面的研究工作。他从计算机科学的观点出发,熔数学、心理物理学、神经生理学于一炉,首创人的视觉计算理论,从而使视觉研究的面貌为之一新。Marr于1980年11月17日在波士顿病死,享年35岁。”
人类历史上一颗闪耀的星!


核心思想

如果想要让计算机视觉达到人类视觉的效果,即能够像人一样理解这个世界,其算法设计就需要依赖于人类的视觉原理(是否能够独创一种计算机自己的视觉原理?)。所以计算机视觉应当被看作一个多层次的信息处理过程(因为人类视觉就是一种信息处理的过程)。


重要概念

  • 表象(Representation)与描述(description)
    表象指一个把一类信息表达清楚(在某个方面)的系统,而一个实体在这个系统下得到的表达结果,称为一个描述。表象可以理解为一个变换,或是一种算法,从一个人难以理解的集合(比如数量本身)映射到另一个容易理解的集合(比如10进制下的表达)。
  • 层次
    对一切事物的描述,都应处于一定的层次之下。(比如在宏观和微观下的物理规则)

计算机视觉的三个层次

类似于任何一个信息处理装置,计算机视觉也具备多个(三个)层次。

  • 计算理论
    计算的目的是什么?为什么?计算的逻辑是什么?
  • 表象和算法
    如何实现计算理论?输入输出的表象是什么?如何实现表象间的变换?
  • 硬件实现
    在物理上如何实现这种算法?

这三个层次,历久弥新,非常精彩。
其中,第一个层次最为重要,它关于本质。
这也是《视觉计算理论》这本书的由来。


抛砖引玉 – 从Gibson的生态视觉出发

Gibson是Marr认为在知觉研究方面最接近计算理论(第一个层次)的科学家。他的一个重要贡献在于提出了一个基本的问题:“人如何在不断变化着的感觉的基础上获得恒定的知觉的呢?”不过他所犯的错误也在于这个问题,即他将问题想得过于难了,他认为知觉是神经系统与环境不变量之间的一种谐振,而不是一个信息处理过程。终其一生,他在寻找这种谐振,并将环境不变量作为一种永恒的本质,导致整个问题看起来难以解决甚至无解。
Marr则认为这个问题是有解的,重点是要站在一定的层次上。


Marr对视觉计算理论的定义 – 视觉的目的

视觉是一种处理过程,能从外部世界中得到一个对于观察者来说有用又不受无关信息干扰的描述。而人类视觉的精华则在于:从图像中建立物体的形状和位置的一个描述。
这种描述有以下四个层次:

  • 图像
    以像素为基础,描述光的强度。
  • 要素图
    从原属图像中提取出的关键的信息。
  • 2.5维图
    以观察者为中心的图像,描述物体在三维上的朝向、深度和轮廓。
  • 3维模型表象
    以物体为中心,类似于图形学建立的三维模型,达到真正的三维化。

总结

Marr的整体思想在于模拟人类视觉,从原理上实现计算机视觉,给出了三个层次说,以及他所期望的,计算机视觉表象的四个层次。
计算机视觉近年来的发展,其实都离不开他提出的框架,是从业者应该好好体会的思想。

David Marr-《视觉计算理论》-思想总结相关推荐

  1. 人脑是怎样认知图像的?——视觉计算理论(最新模式识别之一,Marr)

    从七十年代以来,随着认知心理学自身的发展,认知心理学关于模式识别的研究在取向上出现了某些重要的变化.一些认知心理学家继续在物理符号系统假设的基础上进行研究,探讨计算机和人的识别模式的特点:而另一些认知 ...

  2. Marr的视觉计算理论

    Marr的视觉计算理论立足于计算机科学,系统地概括了心理物理学.神经生理学.临床神经病理学等方面已取得的所有重要成果,是迄今为止最为系统的视觉理论.Marr 的视觉计算理论虽然在细节甚至在主导思想方面 ...

  3. 视觉计算理论简介【转】

    一:视觉计算理论与算法研究( 由×××自动化研究所马颂德等完成) "视觉计算理论与算法研究"的目标主要是研究计算机视觉,以使计算机具有通过二维图像感知三维环境信息的能力,包括感知. ...

  4. 人类视觉计算理论经典著作,豆瓣评分9.7,中文版惊鸿面世!

    关注公众号,发现CV技术之美 今天给大家介绍一本豆瓣评分高达9.7分.成书于40多年前的神书: Vision:A Computational Investigation into the Human ...

  5. 赠书啦!人类视觉计算理论经典著作,豆瓣评分9.7,中文版惊鸿面世!

    今天给大家介绍一本豆瓣评分高达9.7分.成书于40多年前的神书: Vision:A Computational Investigation into the Human Representation ...

  6. 《视觉计算理论》阅读笔记——第一章

    注:<视觉计算理论>翻译自Marr的<Vision> Vison: A computational investigation into the human represent ...

  7. 视觉计算理论(David Marr)——总导言

    首先,向计算神经科学领域先驱David Marr致敬. 1.总导言 如果视觉确实是一个信息处理任务,那么只要我的计算机具有足够强的功能,具有足够大的存储器,而且有办法把它和家用电视摄像机联起来,我们就 ...

  8. 中国人工智能学会通讯——沿着Marr的道路前进——视觉计算的前世今生

    眼睛是动物和人类感受世界的关键器官之一.通常认为,人类获取的外界信息中视觉要占到70%~80%的部分:同时与视觉相关的部分占据人类大脑皮层功能分区里最大的一块面积.能充分理解眼睛和与之相关的视觉处理机 ...

  9. D.Marr的计算视觉理论

    人机融合智能中输入表征阶段里数据与信息/知识的融合就是能指与所指的切换.事实与价值的转化.形式化与意向性的联结.being与should的过渡.语法与语义的调度.Marr的工作对此可见一斑: 剑桥大学 ...

  10. 让机器“看山是山”:脑启发的视觉计算|VALSE2018之五

    编者按:人生之三境界的第一层,"看山是山,看水是水",本质上展示了人"看见"的过程,以及思绪与理解在这一过程中所起的作用. "看见",对于人 ...

最新文章

  1. 腾讯AI Lab视觉计算中心招聘计算机视觉算法实习生
  2. 【ACL2020】这8份Tutorial不可错过!包括:常识推理、多模态信息抽取、对话、解释性等...
  3. 基于Linux+Nagios+Centreon+Nagvis等构建海量运维监控系统
  4. tcppwebbrower 关闭安全警报_【安全常识】燃气泄漏报警器,您的安全保护神!
  5. 程序员必须关注的技术趋势,内附PDF下载链接
  6. Vue nextTick执行时机分析
  7. python-kafka多线程快速读取consumer消费者数据,同时使用批读取与无限流读取改进
  8. DotNetBar的初步使用
  9. JavaEE实现图书管理系统
  10. 基于javaweb的驾校车辆教练预约系统ssm+Vue
  11. pyecharts(9)-动态可视化-树形图-思维导图
  12. FusionCompute架构详解
  13. 各大互联网企业Java面试题汇总,看我如何成功拿到百度的offer
  14. 第一章 80C51单片机概述
  15. 基于ES7243E ADC芯片I2S接口在BES平台上LINE-IN驱动开发
  16. 消除笔哪个p图软件有?快把这些软件收好
  17. HDU 5944 Fxx and string BestCoder Round #89 1001(细节)
  18. Google Earth Engine(GEE)——可视化动态图
  19. 嵌入式linux pam,PAM介绍(一)
  20. vuejs中html2canvas使用 背景图和二维码海报图片保存到一张图片上 生成一张海报并下载

热门文章

  1. dBm、dBW和W转换
  2. 盘点丨12款数据库建模工具特点,总有一款适合你!
  3. Freeswitch 常用功能命令及配置详解2021-06-06
  4. javaweb基于SSM开发在线问卷调查系统(前台+后台) 课程设计 毕业设计源码
  5. abbyyfinereader文字识别软件编辑Pdf教程序列号教程
  6. Simulink 快速入门(二)--创建简单模型
  7. CSR8675烧录工具-全系列CSR8675/86xx一拖多量产工具csr烧录软件(支持FLASH版本和ROM版本)
  8. Emmagee--APP性能测试工具的基本使用
  9. Tcp滑动窗口协议简介
  10. 测试开发工程师必备软硬能力高级测试开发工程师需要具备什么能力?