人类视觉计算理论经典著作,豆瓣评分9.7,中文版惊鸿面世!
关注公众号,发现CV技术之美
今天给大家介绍一本豆瓣评分高达9.7分、成书于40多年前的神书:
Vision:A Computational Investigation into the Human Representation and Processing of Visual Information!
这是一本影响一代脑、认知、计算机视觉专家的经典著作!
在计算机视觉领域,本书至少做出了两个重大贡献:
1. 提出了视觉研究需要相对独立地考虑包括计算理论、算法和神经实现在内的三个“理解层次”。
2. 提出了视觉计算理论。
两者都对包括计算神经科学和人工智能在内的多个领域产生了深远的影响。其中,“理解层次”这个概念的影响或许更大、也更根本。
在近年深度学习的热潮之中,了解掌握本书介绍的视觉计算理论对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。
如今,这本伴随着众多技术专家“长大”的经典著作有中文版啦!!!
中文版上市后,也在迅速在京东得到大家100%的好评!
有读者评论说这是“名著中的名著”“领域内的人必读”!
跨学科的传奇作者
David Courtnay Marr是一位跨学科的传奇人物!
他是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。
他在1970年代将神经科学、心理学的成果与数学方法相结合,提出了视觉计算的理论框架,并厘清了计算理论、算法、实现三个研究层次,对计算机视觉在1980~1990年代的蓬勃发展提供了指导思想。
这本书为什么影响深远
01. 计算机视觉在过去十年的巨大进展,与书中提出的“理解层次”有本质的关联。
在计算机视觉领域,非常重要却又常常被忽视的就是计算理论的进展:计算机视觉究竟要计算什么?
客观地说,在过去十年中,计算机视觉领域内取得最大进展的是语义上的判别任务。这其中又以语义上的图像识别和分类为代表:图中有一条狗还是一只猫?
计算图像分类这样的任务,在今天看来似乎是天经地义的。
其实不然,探索计算的目的是一个漫长的过程。
Marr关注的低层视觉和三维结构的重建在很长一段时间内主导了计算机视觉的研究,而低层视觉和三维重建确实是人类视觉中不可或缺的部分。
除了计算理论的进展,计算机视觉领域过去十年的爆发式进展还应当归功于(以卷积神经网络和反向传播算法为代表的)算法、(以 GPU 为代表的)硬件实现和(以ImageNet 为代表的)数据这几个层次的进展。其中,计算理论、算法和实现三者与Marr 的三个理解层次完全符合。
02. 书中提出的计算理论指导着对AI和CV领域的深入理解。
书中提出的计算理论似乎与当今部分深度学习领袖所强调的“完全从数据中学习”的概念格格不入。
但这里想指出两点。
其一,现有的深度学习架构有其内在的归纳偏置,如卷积神经网络的空间局部性、循环神经网络的时间局部性、Transformer 的自相似性,等等。而本书中讨论的许多基本元素,恰与这些归纳偏置有内在的关联。
其二,如果我们还试图在人工智能和人类智能之间建立联系(这本身也逐渐成为一个有争议的话题),那么任何的偏置是应该被预先设计,还是应该通过学习得到,就与人类认知科学中的先天与后天的概念,以及神经科学的内在机理,产生了千丝万缕的联系。
而这种联系也正是本书作为计算神经科学的教科书,可以长期对人工智能有深刻启发和深远影响的原因所在。
李飞飞同事翻译
本书译者是来自斯坦福大学计算机科学系的助理教授吴佳俊。
其研究方向是计算机视觉、机器学习和计算认知科学。加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。
他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。
看看专家怎么说
适读人群
心理学、神经科学、计算机科学、人工智能、计算机视觉等相关专业的研究人员、研究生及高年级本科生等学习使用或作为研究参考。
互动赠书在本文下方留言区推荐一篇近期所读论文以及简述推荐理由,如:
论文:TSA-Net: Tube Self-Attention Network for Action Quality Assessment
地址:https://arxiv.org/abs/2201.03746
将由CV君选取5位小伙伴(走心且要对别人有价值),赠送《视觉》一书。
活动截止时间:2022.1.18-12:00
▼点击阅读原文,查看本书详情~
人类视觉计算理论经典著作,豆瓣评分9.7,中文版惊鸿面世!相关推荐
- 赠书啦!人类视觉计算理论经典著作,豆瓣评分9.7,中文版惊鸿面世!
今天给大家介绍一本豆瓣评分高达9.7分.成书于40多年前的神书: Vision:A Computational Investigation into the Human Representation ...
- 视觉计算理论简介【转】
一:视觉计算理论与算法研究( 由×××自动化研究所马颂德等完成) "视觉计算理论与算法研究"的目标主要是研究计算机视觉,以使计算机具有通过二维图像感知三维环境信息的能力,包括感知. ...
- 《视觉计算理论》阅读笔记——第一章
注:<视觉计算理论>翻译自Marr的<Vision> Vison: A computational investigation into the human represent ...
- 人脑是怎样认知图像的?——视觉计算理论(最新模式识别之一,Marr)
从七十年代以来,随着认知心理学自身的发展,认知心理学关于模式识别的研究在取向上出现了某些重要的变化.一些认知心理学家继续在物理符号系统假设的基础上进行研究,探讨计算机和人的识别模式的特点:而另一些认知 ...
- Marr的视觉计算理论
Marr的视觉计算理论立足于计算机科学,系统地概括了心理物理学.神经生理学.临床神经病理学等方面已取得的所有重要成果,是迄今为止最为系统的视觉理论.Marr 的视觉计算理论虽然在细节甚至在主导思想方面 ...
- 视觉计算理论(David Marr)——总导言
首先,向计算神经科学领域先驱David Marr致敬. 1.总导言 如果视觉确实是一个信息处理任务,那么只要我的计算机具有足够强的功能,具有足够大的存储器,而且有办法把它和家用电视摄像机联起来,我们就 ...
- 38 《魅力史:激发欲望与视觉征服的艺术》 -豆瓣评分7.7
border="0" width="330" height="86" src="//music.163.com/outchain/ ...
- 豆瓣评分9.7!CV领域奠基性著作,中文版惊鸿面世 | 内含福利
[美] David Marr 著 吴佳俊 译 电子工业出版社-博文视点 2022-01-01 ISBN: 9787121423703 定价: 119.00 元 新书推荐
- 中国人工智能学会通讯——沿着Marr的道路前进——视觉计算的前世今生
眼睛是动物和人类感受世界的关键器官之一.通常认为,人类获取的外界信息中视觉要占到70%~80%的部分:同时与视觉相关的部分占据人类大脑皮层功能分区里最大的一块面积.能充分理解眼睛和与之相关的视觉处理机 ...
最新文章
- 在.Net程序中使用log4net记录日志(示例)
- IDEA里运行代码时出现Caused by: java.lang.ClassNotFoundException: org.apache.log4j.Logger的解决办法(图文详解)...
- python3.6.3安装-CentOS6.8安装Python3.6.3
- 正则表达式(overall)
- windows优化_windows系统优化教程——C盘清理及优化
- 解决: Vue 项目本地运行 run 与服务器上 build 样式不一致,build 后样式不生效
- 修改打开方式的程序列表中列出程序的名称
- Linux进程间通信[转]
- 拓端tecdat|R语言弹性网络Elastic Net正则化惩罚回归模型交叉验证可视化
- windows和Linux下西部数据C1门解决方法
- 西门子mag6000接线_西门子(SIEMENS)妙声力系列电磁流量计变送器MAGFLO MAG5000 MAG6000中文使用手册.pdf...
- 考研逻辑整理 - 概念和概念的种类
- tezos multisig baker
- html水调歌头实验总结,水调歌头教学课堂总结
- 聊天界面的制作(三)——表情列表发送功能
- 新数据经济的民主化:科技巨头如何窃取我们的数据以及我们如何夺回控制权
- [BZOJ3238][Ahoi2013]差异
- 通信原理 | 滤波器:滤波器的概念、理想滤波器和实际滤波器
- Android kotlin run函数学习
- SQL Sever 远程计算机拒绝网络连接,错误:1225 具体解决步骤。
热门文章
- Zdenek Kalal的TLD Tracker(牛啊,学习!)
- 读《程序员修炼之道——从小工到专家》(The Pragmatic Programmer: From Journeyman to Master)
- 软件工程 - 版本管理 - git 的基本实用方法 - 添加一个完整的项目目录的命令的细微差别
- python代码测试_Python入门学习系列——Python代码测试
- 汇编指令mrs_专题1:电子工程师 之 软件】 之 【8.arm指令】
- c语言编程软件有个a开头的,厦门理工软件c语言程序设计A卷及答案
- 用户自定义属性表结构设计_属性类型定制及其妙用
- 计算机实测声波和拍实验报告,course:platform
- pythonide的作用_Linux程序员宝典:2020年10款出色的Python IDE!
- c语言定义的几种易错的说明