曾有研究表明一般人类对世界80%左右的认知都来自于视觉,且视觉更易记忆。现在交叉学科的发展让机器视觉不止满足于算法的提升发明,很多人试图从生物、神经等学科解释或提出CV里的模型。Itti大牛的Saliency模型就是基于神经科学提出的(附其论文网址http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=730558&tag=1)。

但关于人类大脑的研究还远远有待发展,大脑的奥秘我们了解得很少,只能从已有的其他学科知识看能否对特定研究领域有些启发,那今天我们来看一下神经科学中对于视觉的描述解释。

一.引言

1.      视网膜处于眼睛背部,这里有着将光能转化为神经活动的光感受器。眼睛其余部分像照相机一样在视网膜上留下清晰但短暂的图像。眼睛还有自动调节亮度差异并自动聚焦,跟踪等功能。

2.      每只眼睛可以看做有两个重叠的视网膜,一个在高亮度工作,一个在低亮度工作。而视网膜的输出的是其接受图像的不同部位的光强之差,与绝对光强几乎无关。

3.      视网膜神经元轴突汇聚成视神经把视觉信号以电信号的方式从丘脑背侧的LGN(lateral geniculate nucleus)传至大脑。

二.光的特性

1.      光是一种能量波,不同波长的光在大脑里面被解释成不同颜色,引发色觉。

2.      光与物体的相互作用有反射折射和吸收三种。吸收光能则转换能量(晒太阳取暖),我们所见物体是因为物体反射了光,眼睛成像是通过眼中介质折射入视网膜形成。

三.眼睛的结构

在很多脊椎动物和一些软体动物中,眼睛通过把光投射到对光敏感的视网膜成像,在那里,光线被接受并转化成信号并通过视神经传递到脑部。通常眼睛是球状的,当中充满透明的凝胶状的物质,有一个聚焦用的晶状体,通常还有一个可以控制进入眼睛光线多少的虹膜。

四.眼睛中图像的形成

1.   平行光线穿过眼中的角膜、房水等时发身了折射,故而汇聚到眼睛背部的一点(聚焦)。从折射表面到平行光的汇聚点的距离称为焦距,焦距的倒数称为屈光度。由于水与眼睛较接近,折射程度较小,这就导致裸眼在水中看东西很模糊,聚焦力很低。

2.   晶状体可以自动调节对远/近处的光线进行聚焦,瞳孔收缩增加聚焦深度(就像照相机减少光空大小)。

五.视网膜的显微解剖

1.存在两种光感受器:视杆光感受器对光线敏感许多,主导暗视觉,主要分布在视网膜周边;视锥光感受器主导明视觉,主要分布在视网膜中央

六.视觉图像形成与视觉信号处理

1.      与光照相比,黑暗才是对光感受器的合适刺激,当阴影掠过光感受器,他会释放更多的递质;

2.      对比对明暗感知影响

如上图。中间的灰度值是一样的,但左边灰度方块看起来亮一些。因为我们的神经节细胞有着放大边界反差的功能,即记录的是中心-周边感受野范围内刺激的差额。因在感受野中心内看到阴影的细胞会兴奋,看到光照的细胞会被压抑。故视觉系统是对局部空间的变化进行检测,而非全局的进行幅度检测;

3.      感受野是视网膜上给光刺激能改变细胞膜电位的区域。视网膜上1mm对应于3.5°视角,双极细胞感受野直径在视网膜中心不到1°,在周边则大于1°。感受野中心为撤光区域,即对更深阴影产生更高频的电位变化。感受野周边为给光反应区。

4.      M型细胞与P型细胞与非M非P细胞

M细胞对移动刺激的检测具有重要意义,因其对感受野中心刺激为瞬间放电,且对颜色不敏感,占5%;

P细胞对形状及细微处更敏感,因其放电时长与刺激存在时长一致,主要处理黄-蓝信息(Y-B在P细胞中是对立色),占90%;

非M非P,处理颜色信息,占5%。

七.大脑的并行处理

前面已经介绍了M、P、非M-非P三种细胞,在信号传递中这三种细胞有着到大脑皮层的不同通道,如下图所示

M细胞通导称为M通道:LGN可以为一个眼睛激活,对瞬间视觉刺激有反应,对光的波长不敏感;IVCα具有单眼的 方位选择性;IVB层细胞具有 方向选择性的感受野(对双眼刺激都有反应)。左下图为方位选择性(主管形状),右下图为方向选择性(主管运动方向)。

P细胞通道称为P-IB通道:对光的波长不敏感,对刺激的方位具有高度选择性,被认为此通道特化为对物体形状进行分析。

最后一种称为斑块通道:其感受野中心具有红-绿或黄-蓝对立,不具备周边感受野,不具有方位选择性,认为是特化为对物体颜色进行分析。

八.外视皮层

大脑皮层间的视觉通路

V1:接受LGN信息的第一个皮层区域。

V4:具有方位选择性和颜色选择性,负责对形状以及颜色的感知。

IT:一些颜色以及抽象形状对此区是良好刺激,其中小部分神经元对面孔图像有强烈反应。(这是不是说明大脑还有许多被特化为识别某一类物体或形状的区域?)

MT:几乎所有细胞都具有对光的瞬时反应以及方向选择性,对有限运动方向的刺激有反应。有大量方向柱(我的理解是向Gabor机一样)。也许,对空间点运动的感知来源于对360°范围内方向选择柱的活动性比较。(直线的方向柱)

MST:对直线移动(类似MT),辐射状移动,环形移动(顺逆时针)敏感。

机器视觉与脑神经科学相关推荐

  1. 人工智能在脑神经科学的应用创新与热点——脑机接口

    人工智能在脑神经科学的应用创新与热点--脑机接口 摘要 [关键词] 正文 一: 脑机接口应用领域及前景广阔. 1:多种应用领域 2:意念打字 二:脑机接口的畅想. 1:感官与身体增强 2:记忆移植 3 ...

  2. 脑神经科学简单介绍(小白入门)

    脑神经科学 返回论文和资料目录 Part 1:大脑结构 上图展示了人脑脑干上的结构.包括5大功能 思维功能(逻辑推理,语言功能,空间心像,构思凝想) 体觉功能(体觉辨识,操作理解,体觉感受,工艺欣赏) ...

  3. 人工智能跟脑神经科学没有关系。没有出差错的机会,就没有进化的可能。要想自己把事情做成功,就需要弄清楚事物的本质。...

    ​摘要:科技发展很快,但人性变化很慢!没有出差错的机会,就没有进化的可能.要想自己把事情做成功,就需要弄清楚事物的本质,找到自己领域的"空气动力学".图灵机只解决可计算的问题,不涉 ...

  4. 脑神经科学与心理学_为什么心理学家可以成为伟大的数据科学家

    脑神经科学与心理学 In one of my previous articles, I talked about transitioning from psychology (or any socia ...

  5. ev3怎么对场地进行测量_测量场地可靠性

    ev3怎么对场地进行测量 We have all been in the Dev vs. Ops world where the Dev and Ops teams had different obj ...

  6. 在Kotlin代码中要慎用Java 8 的 Stream API

    因为会有性能损失. 测试代码: 1.Java 中直接使用 Java 8 的 Stream API: package i;import java.util.ArrayList; import java. ...

  7. MIT教授Tomaso Poggio演讲与专访:智能背后的科学与工程 | 腾讯AI Lab学术论坛

    来源:腾讯AI实验室 腾讯AI Lab第二届学术论坛在深圳举行,聚焦人工智能在医疗.游戏.多媒体内容.人机交互等四大领域的跨界研究与应用.全球30位顶级AI专家出席,对多项前沿研究成果进行了深入探讨与 ...

  8. 两个黑箱问题 ——深度神经网络和脑神经网络

    来源:科技导报  概要:谷歌DeepMind 团队的研究将认知心理学和深度神经网络结合在一起,并发现两者在小样本词汇学习过程中具有相似之处--DNN 和脑神经网络都具有形状偏好,相关研究论文<C ...

  9. 如何赋予自主系统具备持续学习的能力?

    作为人工智能浪潮中最为突出的贡献之一,深度神经网络在固定任务的表现已经得到了广泛的认可,针对特定应用场景的优化部署也在急速增长.深度网络是一个静态的知识实体,但是在扩展此知识容量的过程中通常会导致已学 ...

最新文章

  1. 脑外伤急救后迟发性颅脑损伤影响因素分析案例
  2. ntko office在线编辑控件问题记录
  3. 计算机系统与网络技术简答题,计算机与网络技术基础 简答题
  4. linux系统几个重要图
  5. Flask从入门到做出一个博客的大型教程
  6. 带你深入浅出的分析 HashTable 源码
  7. Linux IPC实践(4) --System V消息队列(1)
  8. NOIP 2014 Day1 T3飞扬的小鸟
  9. python摄像头识别快递单号查询_python如何免费对接快递鸟api单号识别查询接口
  10. 通过VBA实现重复的PPT编辑操作
  11. android 文件大小排序,android 文件列表排序
  12. 计算机组成原理—Cache和主存的映射模式
  13. 北京化工大学研究生学堂在线矩阵论及其应用答案
  14. 使用sqlplus显示中文为乱码的解决办法
  15. storm启动报错,storm-ui界面显示不正常
  16. jscc控制器说明书_JSCC精研调速器 精研SF90E数显调速器 90W精研马达面板控制器
  17. 管理变量、机密和事实
  18. 医疗机构如何成功实施CRM?如下几点是关键因素
  19. 谷歌浏览器关闭系统代理后断网问题
  20. 【JMeter】JMeter简介

热门文章

  1. 国内几大网络安全公司介绍[转] - 网络安全 - Linuxer William
  2. 精益生产中APS的应用
  3. Linux C TCP Socket实现客户与服务器简单通信
  4. 葡萄牙—C罗:实力派的蜕变
  5. 【手势交互】12. MYO臂环
  6. 子div居中于父div
  7. Rpc及Dubbo的概述
  8. 交错斜齿轮的计算与SW建模流程
  9. JavaScript for impatient programmers
  10. srs之直播数据分析