转载于:http://mmdays.com/2008/04/17/aperture_problem/

各位经过理发店的时候,或许都会注意到理发店有一个卷轴,卷轴不停旋转,但是看起来会像是有一圈圈的条纹往上移动。今天要和各位介绍的是另外一个类似的错觉,叫做「孔径问题」 (Aperture Problem)。

图1 理发店卷轴错觉

何谓孔径问题呢?我们可以先看看下面这个动画:

图2 孔径问题(Aperture Problem)

我们可以看到,中间有一个圆圈,我们透过这个圆圈,会看到有斜线,沿者「右下」的方向移动。然而如果要造成这种视觉效果,却有三种可能。第一种可能是一个「横向」的纸条,往「正右方」拉动,但是纸条上面有「斜线条纹」,因此透过孔径来看的时候,会有错觉。第二种可能是一个「直向」的纸条,往「正下方」移动,但是因为纸条上面有「斜线条纹」,因此透过孔径来看的时候,还是感觉往右下方移动。第三种可能是一张纸条,上面有着「直线条纹」,但是往「右下方」移动,因此透过孔径观看的时候,会和前面两个看到的移动方向一样。

因此虽然三张纸条「移动方向」不同,甚至纸条上面「条纹的方向」也不尽相同,但是透过孔径来观察的时候,却都会有条纹移动方向相同的错觉。这就是「区域(local)」和「全域 (global)」视觉处理的差别。我们的视觉系统区域上(locally)可以有孔径问题的错觉,但是当我们观察的范围是全域(globally)的时候,却又分析的出来三张纸条不同的移动方向。我们的视觉系统怎样子达成这样子的功能呢?

视觉讯号传递路径的回顾

首先,让我们先复习一下,之前提过的视觉系统部份。〈灵魂的纱窗:走访人类的视网膜〉介绍了视网膜,〈视觉交响曲第二乐章: LGN〉介绍了视觉讯号传递的中继站:LGN,〈视觉交响曲第三乐章: V1〉则是介绍了视觉皮质的第一站:V1。下面简单的再重新整理一下相关的重点。

图3 视网膜

视网膜位在眼球的底部,其功能有如相机里面的底片一般,接受经过瞳孔进来的光线,把光能转换成细胞里面的化学能,再转换成神经的讯号。视网膜如果细分可以分为10层,从接受光刺激的感光细胞开始,中间有一些细胞来整合区域的资讯,最后透过最后的神经节细胞 (ganglion cell)在眼球盲点的位置(blind spot)形成视神经束 (optic nerve)穿透眼球,往大脑走去。

图4 视觉神经路径图

视觉神经离开眼球之后,会分成几条路径,有些讯息会传送到脑干 (brain stem),提供眨眼、眼球肌肉、瞳孔收缩等反射动作的资讯。其他主要视觉上的资讯,则是往大脑最后方,也就是我们头脑后面的脑室– 枕叶 (occipital lobe)的视觉皮质区传送。上面这张图就是从眼球到大脑皮质中间的神经连接图。两种颜色分别代表视觉里面的视野 (visual field)。视神经离开眼球后,会在大脑前端有一次交叉,这一次交叉,会让左眼的右视野资讯,和右眼的右视野资讯,通通传送到大脑去!同哩,左眼的左视野,和右眼的右视野,交叉之后,通通都会传送到大脑去。从此之后,右视野的资讯就先到左大脑,左视野的资讯就先到右大脑,再更后面的时候,才会经由其他路径左右脑互通资讯。

交叉之后,接着会先有一个中继站,英文缩写为LGN,全名为Lateral Geniculate Nucleus,是一个位在丘脑 (thalamus)下方外侧的一个核区,主要是把视野再做一次分区投射,譬如说上下视野会投射到不同区域。此外也会对不同的视觉讯号做不同的投射,譬如说视网膜可以概分为两种感光细胞,一种比较模糊适合夜间感光,另一种比较清晰适合日间感光,同时也包含了色彩的资讯。这两种讯号在LGN就会分别投射到不同的区域,连带影响之后在视觉皮质的投射。

经过LGN投射整理之后,最后就会走到大脑最后面的视觉皮质区V1。视觉皮质,英文称为Visual Cortex。所谓皮质就是大脑表层的区域,和很多有意识的资讯处理有关系,譬如说视觉、听觉、嗅觉,运动、语言、决策等功能,都各有皮质(cortex)区域来负责处理相关的讯息,形成一个复杂的神经网路。视觉皮质区V1则是视觉讯号最早到达的皮质区,因此称为V1。

V1的特性是处理初步的视觉特征,譬如说视网膜上面的感光细胞,只对视野里面的一个圆点的亮光和色彩有反应。V1接收LGN整理的资讯后,会分析出进一步的初级资讯,主要是「线条」的初级资讯。譬如说某一群V1细胞,会对85度的直线有反应,另一群细胞对水平的直线条有反应等等。这些初级资讯,已经把视网膜传过来的「」的资讯,变成「线」的资讯了。之后会继续传往V2和其他区域,得到更高阶的资讯,让我们可以辨识出一张桌子、一张人脸,作出有意识的认知与判断,进而作出有意识的反应和行为。

孔径问题的和神经讯号处理

经过上面的回顾,我们可以稍微回想起来,光讯号从视网膜,到LGN,到视觉皮质V1的大致过程。然而到V1的时候,因为还是基本的线条资讯,因此在孔径问题中,我们透过孔径看到的移动方向,就是一个V1细胞典型的反应,这个反应是区域的反应 (local),要等到讯号传递到更高层的皮质区,才能看到全域的移动方向,判断纸条真正移动的方向。

图5 Aperture Problem孔径问题解决方法

因此,孔径问题后来提出的解决方法,就是有一颗神经元,负责接收两个以上区域(local)的孔径资讯,就可以判断出全域(global)的移动方向了!譬如说在初级的V1区域,某一群细胞对往右上角移动的45度反斜线有反应,另一群细胞对往右下角移动的45度斜线有反应,(斜线是指右上到左下的斜线,反斜线是指左上到右下的斜线)。这两群细胞,就有如孔径问题里面的圆圈一样,只能观察到区域的移动情形。然而比较高层的细胞,可能接受这两个孔径的细胞,并且作整合,当这两个细胞都反应的时候,就会判断这两个移动方向的向量和方向,作为全域的移动方向,产生反应的时候,也就是我们产生整个物体全域(global)移动方向的感觉的时候。

以上面的这张图左手边的例子来说,高层细胞分别接受「右上移动」和「右下移动」两个孔径细胞的区域反应 (local),产生整个物体往「正右方移动」的全域反应 (global)。

不过这种神奇的高层细胞位在哪边呢?这部分就要等下回再详细介绍了!今天先简单提一下大概。首先,视觉讯号到了V1之后,会继续往V2视觉皮质走,其中会有一些回馈(feedback)讯号作更复杂的处理。V2之后会分成两个主要的传递路径:背部路径腹部路径 (dorsal and ventral pathway)。

图6 视觉讯号传递路径(dorsal and ventral visual pathway)

上面这张图右手边是大脑前面额头的方向,左手边是大脑后面的方向。视觉皮质V1就位于大脑后方,也就是图片里面左手边的部分。讯号到了V1之后,就往两个方向,一上一下,往上的称为「背部路径」 (dorsal pathway),这条路径和「物体移动」相关的资讯有关(motion),往下的称为「腹部路径」 (ventral pathway),和物体的「形状」 (form)和「颜色」(color)的处理有关。因此刚才孔径问题里面的高层细胞,虽然是全域(global)的资讯,但是是和物体移动相关,因此会在背部路径 (dorsal pathway)上面。

背部路径 (dorsal pathway)的终点称作MT,是Middle Temporal lobe的缩写。腹部路径 (ventral pathway)的终点IT,是Inferior Temporal lobe的缩写。就如刚才所说,MT处理移动( motion )相关资讯,IT处理形状( form )相关资讯。当然这两者彼此之间也会有互相的联系(crosstalk)。关于后面这几站视觉处理的详细介绍,就让我们下一篇再继续介绍吧!

图7 孔径问题(Aperture Problem)

孔径问题(aperture problem)相关推荐

  1. 孔径问题 — The Aperture Problem

    孔径问题指在运动估计(Motion Estimation)中无法通过单个算子[计算某个像素值变化的操作,例如:梯度]准确无误地评估物体的运行轨迹.原因是每一个算子只能处理它所负责局部区域的像素值变化, ...

  2. 谷歌AI用“深度”学习来虚化背景,单摄手机可用,Jeff Dean表示优秀

    虚栗子 发自 凹非寺  量子位 出品 | 公众号 QbitAI 真 · 深度学习↓↓↓ Jeff Dean说的. 因为,谷歌又给Pixel的相机注入了机器学习的灵魂:在背景虚化的任务上,学习了一下深度 ...

  3. (转载)计算机视觉当中的专业英语

    转载自: 1.https://blog.csdn.net/vsooda/article/details/7365776 2.https://wenku.baidu.com/view/7cd9528aa ...

  4. 计算机视觉 专业术语,计算机视觉常用术语中英文对照.doc

    计算机视觉常用术语中英文对照.doc 计算机视觉常用术语中英文对照(1) 人工智能Artificial Intelligence认知科学与神经科学Cognitive Science and Neuro ...

  5. 流体运动估计光流算法研究

    流体运动估计光流算法研究 大家好!我是苏州程序大白,今天讲讲流体运动估计光流算法研究.请大家多多关注支持我.谢谢!!! 简介: 对流体图像序列进行运动分析一直是流体力学.医学和计算机视觉等领域的重要研 ...

  6. 经典光流算法Lucas-Kanade(有图助理解)

    前言 光流法是计算机视觉领域非常常用的算法,深度学习时代的CV工程师可能会用到光流法,但鲜有对其实现原理做深度地探索的.今天正好趁着复现一个项目把LK光流法的算法进行一个探索和整理. 先看一个LK光流 ...

  7. 综述:光流估计从传统方法到深度学习

    作者丨肖泽东 Shon@知乎 来源丨https://zhuanlan.zhihu.com/p/74460341 编辑丨目标检测与深度学习 编者荐语 光流估计是计算机视觉研究中的一个重要方向,然而,因为 ...

  8. 视频光流估计综述:从算法原理到具体应用

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:肖泽东 | 来源:知乎 https://zhuanlan.zhihu.com/p/7446034 ...

  9. 光流估计:从传统方法到深度学习

    来源:信息网络工程研究中心本文约4200字,建议阅读10+分钟 近年来,深度学习技术,作为一把利剑,广泛地应用于计算机视觉等人工智能领域. 一.摘要 近年来,深度学习技术,作为一把利剑,广泛地应用于计 ...

最新文章

  1. 百度、谷歌理念对对碰
  2. 比较顺序表和链表的优缺点
  3. 评论:苹果APP STORE面临失贞可能?
  4. android.mk 比较字变量,粉丝投稿 | 谈谈Android.mk
  5. Python 中拼音库 PyPinyin 的用法,没错见名知意它就是用来翻译汉字的
  6. python 全局解释器锁_python全局解释器锁(GIL)
  7. 售前十年,两种人生,多重感悟!
  8. 《软件测试》实验一:测试入门
  9. php smarty 模板注释,smarty中的注释
  10. javaweb时间插件
  11. 孙子算经 之 物不知数(韩信点兵)
  12. NiFi 1.16.3 生产使用的更新及BUG。
  13. spring源码解析百度网盘下载
  14. 新玺配资:板块轮动加快 多看少动均衡配置为主
  15. Android 应用程序之间内容分享详解(一)
  16. loadrunner录制脚本时无法打开IE浏览器
  17. 海康威视官方安装包(提供64位安装包)
  18. NLP- 关键词提取 - 综述
  19. 2005至2022历史路网下载及分析
  20. 英国电信日本东芝公开测试英国首个商用量子安全城域网

热门文章

  1. PHP社会管理网格化GIS系统,社会管理网格化平台
  2. 开放式激光振镜运动控制器(五):ZMC408SCAN光纤激光器的能量控制
  3. wifi路由器中的WPS功能
  4. 通过Ajax实现注册登陆的表单验证,一看就会。
  5. 基于AT89C52单工串行通信系统设计
  6. 鹅厂4045天,老总监我毕业了
  7. 【软件工程理论与实践】Homework(一.2,3)
  8. git 生成key并添加key(Windows)
  9. python抓取微信公众号文章及评论(附过程)
  10. 计算机的用户账户打不开怎么办,电脑用户密码忘记了打不开怎么办