11.24 本文的出发点:模仿人类视觉

表 1 列出了人类视觉系统实现视觉物体分割所依赖的能力及素材,以及计算机与之对应的能力和素材。可以看出二者之间具有很强的可类比性,因此,本文考虑借鉴人类视觉系统的成功经验来指导计算机实现视觉物体的分割。
由于表1中前三种能力不能直接得到语义级的物体分割,我们将主要关注后面几种能力及其对应的素材。对于人来说,运动感知需要持续一定时间的序列视觉信号,计算机与之对应的能力是光流估计,而所需要的素材为视频。视差感知则需要两只眼睛同时有视觉信号的输入,计算机与之对应的是经过立体校正后的双视图图片,而两个视图对应像素间匹配的过程又称为立体匹配。经过近30 年的研究,目前计算机已经基本具备了运动感知和视差感知能力。

上述两种能力所需要的素材有一个共同的特点,都是多张图片(或多视觉信号)。一般来说,多张图片间的匹配矢量是一种区分不同物体非常有效的特征,可以应用格式塔(Gestalt)心理学中的共同命运准则来实现物体分割。

另一类实现视觉物体分割的素材是通过大量视觉经验的积累而形成的先验知识,包括对物体大小、颜色、纹理、轮廓等特性的总结,被传授的知识等。这些先验知识使得人可以分割单张静止图片中的物体,而不用再完全依赖于多视觉信号。受人类视觉的启发,本文也考虑利用两类途径来使计算机具备分割视觉物体的能力:多视觉信号分析和融合先验知识。具体来说,我们研究了多视觉信号下的匹配和运动建模问题(第 2 和 3 章),研究了各种数据和模型先验下的建模和求解问题(第4 和 5 章)。这些研究对视觉物体分割问题提供了一些新颖的分析方法,也提供了一些有效的算法。

《中国人工智能学会通讯》——11.24 本文的出发点:模仿人类视觉相关推荐

  1. 中国人工智能学会通讯——基于视频的行为识别技术 1.7 视频的深度分段网络...

    1.7 视频的深度分段网络 下面介绍另外一个工作,是我们和 CUHK.ETH 联合开展的,这个工作考 虑视频的分段特性,我们知道视频可以分 成很多段,每一段有不同的内容.我们 开发了一个深度模型,对不 ...

  2. 中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )...

    到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它 ...

  3. 中国人工智能学会通讯——智能系统测评:挑战和机遇

    上面的四个报告从四个维度讨论了智能系统测评的不同方面--产业.基础.基础和伦理.我受中国人工智能学会的委托,组织这次分论坛,为此对这个领域做了一些调研和思考,从现状和挑战这两个方面做了一些初步总结. ...

  4. 中国人工智能学会通讯——深蓝、沃森与AlphaGo

    在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深 ...

  5. 《中国人工智能学会通讯》——11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法...

    11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法 如引言所述,视觉目标跟踪中表观建模主要分为目标表示和统计建模两部分.上两节主要关注的是在跟踪中如何设计一种有效的统计模型.本节主要关注的是表观建模 ...

  6. 中国人工智能学会通讯——人工智能在各医学亚专科的发展现状及趋势 1.3 人工智能在各医学亚专科的发展态势...

    1.3 人工智能在各医学亚专科的发展态势 1. 人工智能在眼科领域的应用 2016年11月,Google的研究者Gulshan博士等人在美国医学协会杂志"Journal of the Ame ...

  7. 中国人工智能学会通讯——人类作为“情感机器”——效用函数、情绪和社会偏好...

    20世纪五六十年代,受到当时新兴的信息论和控制论的影响,心理学界开启了一场认知科学革命[1].先前占主导地位的行为主义只关注刺激与行为之间的联结,以经典条件反射和操作性条件反射(后者亦称为" ...

  8. 中国人工智能学会通讯——沿着Marr的道路前进——视觉计算的前世今生

    眼睛是动物和人类感受世界的关键器官之一.通常认为,人类获取的外界信息中视觉要占到70%~80%的部分:同时与视觉相关的部分占据人类大脑皮层功能分区里最大的一块面积.能充分理解眼睛和与之相关的视觉处理机 ...

  9. 《中国人工智能学会通讯》——4.41 两种学习之间有什么区别?

    4.41 两种学习之间有什么区别? 来 看 一 下 剑 桥 大 学 信 息 工 程 教 授 ZoubinGhahramani 对贝叶斯规划学习(BPL)的评价,他认为 BPL 对人工智能.认知科学和机 ...

  10. 《中国人工智能学会通讯》——11.66 结构属性表示及其在脑影像分析中的应用...

    11.66 结构属性表示及其在脑影像分析中的应用 传统属性表示方法主要集中在视觉属性.部件属性和相似属性.由于现实问题的复杂性和多样性,现有的属性表示方法无法对具有明显结构信息的图像进行有效表达.例如 ...

最新文章

  1. html中写随机数,为HTML生成一个随机数
  2. flow 静态类型检查 js
  3. 西瓜书——EM算法(一)
  4. centos php ssl,CentOS下在Nginx中添加SSL证书以支持HTTPS协议访问
  5. uva 10594(最小费用最大流)
  6. 机器翻译简史:八十多年来,人类就是要再造一座通天塔
  7. ServerSocketChannel的使用例子
  8. 数值优化之高斯-牛顿法(Gauss-Newton)
  9. Cartoon CG:卡通渲染(开篇)
  10. Mac上最强大好用的的右键工具「iRightMouse 超级右键」(上)
  11. oracle视图、函数、循环、case when
  12. npm i 命令安装失败提示:npm WARN read-shrinkwrap,解决方法
  13. kafka问题之Listener method could not be invoked with the incoming message
  14. 模拟电路设计(39)---一文搞懂直流电源EMI滤波器
  15. 数组 reduce 简介及使用场景
  16. Ubuntu 键盘鼠标失效解决办法
  17. 学业水平考试b能上985吗_学业水平测试要求
  18. Verilog实现四位加法器
  19. matlab 中的三次样条插值函数spline使用说明
  20. 中国隧道掘进机(TBM)行业需求状况与投资价值评估报告2022-2027年

热门文章

  1. Atitit springboot helloword 最简化 attilax总结
  2. paip.论大数据的方法,技术erlang,haddop.attilax总结.
  3. paip.提升用户体验-------在C++ Builder 中为Form窗体添加背景图片
  4. paip.提升安全性--CRSF跨站请求伪造的检测与防范
  5. paip.http发文汉字乱码变问号的解决
  6. Rust: Path等
  7. (转)BlackRock:全球最大资管公司如何一步步倒戈人工智能?
  8. 2022趋势洞见之“云网端融合”
  9. 从心理学角度看,如何提高招聘面试的准确率?
  10. 【优化调度】基于matlab粒子群算法求解经济调度优化问题【含Matlab源码 1489期】