1什么是计算机视觉

计算机视觉(Computer Vision)是指用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解。

这意味着计算机视觉技术的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。因此不仅需要使机器能感知三维环境中物体的几何信息(形状、位置、姿态、运动等)而且能对它们进行描述、存储、识别与理解。可以认为,计算机视觉与研究人类或动物的视觉是不同的:它借助于几何、物理和学习技术来构筑模型,用统计的方法来处理数据。

人工智能的完整闭环包括感知、认知、推理再反馈到感知的过程,其中视觉在我们的感知系统中占据大部分的感知过程。所以研究视觉是研究计算机的感知重要的一步。

2发展的几个重要节点

  • 视觉研究的开端-Hubel和Wiesel关于大脑视皮层细脑感受野的论述

感受野-(一个感觉神经元的感受野是指这个位置里适当的刺激能够引起该神经元反应的区域。感受野一词主要是指听觉系统、本体感觉系统和视觉系统中神经元的一些性质。)

1959年,Hubel和Wiesel猫实验的故事,把微电极埋进猫的视皮质细胞,之后在屏幕上打出一些光影和图形。通过固定猫的头部来控制视网膜上的成像,并测试细胞对线条、直角、边缘线等图形的反应。Hubel和Wiesel告诉我们视觉识别应该从简单的形状开始。

对于看到鱼和老鼠投像的猫来说,视觉处理的前期并不是对整体的鱼或者老鼠进行处理,视觉处理流程的第一步是对简单的形状的结构处理、边缘排列。只有当图片切换时的反应激烈。

  • 二维到三维- Roberts积木世界让计算机理解三维场景

20世纪50年代主要分析二维图像,而Lary Roberts 1963年写的论文《block world》(积木世界),运用计算机程序,试图从图像中阐释出诸如立方体等多面体的这些边缘和形状。它根据线画图来理解由多面体构成的景物,并对物体形状物体的空间关系进行描述。

  • 学科的诞生

计算机视觉真正的诞生时间是在1966年,MIT人工智能实验室成立了计算机视觉学科,标志着CV成为一门人工智能领域中的可研究的学科,同时历史的发展也证明了CV是人工智能领域中增长最快的一个学科。

  • 视觉理论:视觉是分层的

20世纪80年代初,MIT人工智能实验室的David Marr出版了一本书《视觉》(全名《Vision: A Computational Investigation into the Human Representation and Processing of Visual Information》),他提出了一个观点:视觉是分层的。

他认为视觉是个信息处理任务,应该从三个层次来研究和理解,即计算理论、算法、实现算法的机制或硬件。

  • 一、信息处理的计算理论,在这个层次研究的是对什么信息进行计算和为什么要进行这些计算。

  • 二、算法,在这个层次研究的是如何进行所要求的计算,即设计特定的算法

  • 三、实现算法的机制或硬件,在这个层次上研究完成某一特定算法的计算机构。

  1. 例如根据 Fourier 分析理论,任意连续函数可用它的 Fourier 频谱来表示,因此 Fourier 变换是属于第一层的理论,而计算Fourier 变换的算法是属于第二个层次的,至于实现快速,Fourier算法的阵列处理机就属于第三层次。

视觉理论使人们对视觉信息的研究有了明确的内容和较完整的基本体系,仍被看做是研究的主流;

3计算机视觉是一门交叉学科

计算机视觉技术是一种典型的交叉学科研究领域,包含了生物、心理,物理,工程,数学,计算机科学等领域,存在与其他许多学科或研究方向之间相互渗透、相互支撑的关系。在概念的理解中我们常常听到AI、图像处理、模式识别、机器视觉等词语,那么他们和计算机视觉之间是怎样的关系呢?

(图片来自网络)

计算机视觉与人工智能

人工智能技术主要研究智能系统的设计和有关智能的计算理论与方法。 人工智能可被分为三个阶段感知 、认知和动作执行。计算机视觉常被视为A I的一分支 。

计算机视觉与图像处理

图像处理中,人是最终的解释者;计算机视觉中,计算机是图像的解释者。图像处理算法在机器视觉系统的早期阶段起着很大的作用,它们通常被用来增强特定信息并抑制噪声。计算机视觉系统必须有图像处理模块存在。

(图片来自wikipedia)

计算机视觉与模式识别

模式识别是根据从图像中抽取的统计特性或结构信息,把图像分为设定的类别。图像模式的分类是计算机视觉中的一个重要问题。模式识别中的许多方法可以应用于计算机视觉中。

计算机视觉与机器视觉

计算机视觉技术的研究目标是使计算机具有通过一幅或多幅图像认知周围环境的能力(包括对客观世界三维环境的感知 、识别与理解)。 这意味着计算机不仅要模拟人眼的功能,而且更重要的是使计算机完成人眼所不能胜任的工作。而机器视觉则是建立在计算机视觉理论基础之上,偏重于计算机视觉技术的工程化,能够自动获取和分析特定的图像,以控制相应的行为。与计算机视觉所研究的视觉模式识别、视觉理解等内容不同,机器视觉技术重点在于感知环境中物体的形状、位置 、姿态 、运动等几何信息 。两者基本理论框架、底层理论、算法相似,只是研究的最终目的不同。所以实际中并不加以严格划分,对于工业应用常使用“机器视觉” ,而一般情况下则常用“计算机视觉“。(部分选自《基于 OpenCV 的计算机视觉技术实现》)

4计算机视觉的关键任务

1、物体识别,识别图像物体属于的类别。

2、物体检测,用框去标出物体的位置,并给出物体的类别。

3、分类+定位,分类问题就是给输入图像分配标签的任务,找到图像中某一目标物体在图像中的位置,即定位。

4、图像分割,将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。

5值得关注的人工智能开放平台

Face++人工智能开放平台包含了包括人脸识别、人体识别、证件识别、图像识别在内的CV能力的体现。承接了如手机、营销、教育、汽车等行业的落地解接方案。

浅谈-什么是计算机视觉相关推荐

  1. 计算机技术与消防,浅谈计算机技术在消防领域中的应用

    随着计算机网络技术的发展和信息化时代的带来,计算机已经成为人类生活学习和工作不可缺少的一部分,扮演着越来越重要的角色.如今的社会在计算机的带领下已经成为了"数字化""信息 ...

  2. 沈向洋:浅谈人工智能创造

    来源:AI科技评论 本文约7000字,建议阅读10分钟 本文为你介绍沈向洋的<浅谈人工智能创造>,分享过去六年其在微软小冰身上得到的一些实践想法. 2020年9月21日上午9点,由北京大学 ...

  3. opencv运动目标跟踪预测_浅谈多目标跟踪中的相机运动

    ©PaperWeekly 原创 · 作者|黄飘 学校|华中科技大学硕士生 研究方向|多目标跟踪 之前的文章中我介绍了 Kalman 滤波器,这个算法被广泛用于多目标跟踪任务中的行人运动模型.然而实际场 ...

  4. 浅谈L0,L1,L2范数及其应用

    原文传送门:浅谈L0,L1,L2范数及其应用 浅谈L0,L1,L2范数及其应用 在线性代数,函数分析等数学分支中,范数(Norm)是一个函数,其赋予某个向量空间(或矩阵)中的每个向量以长度或大小.对于 ...

  5. 浅谈多目标跟踪中的相机运动

    ©PaperWeekly 原创 · 作者|黄飘 学校|华中科技大学硕士生 研究方向|多目标跟踪 之前的文章中我介绍了 Kalman 滤波器,这个算法被广泛用于多目标跟踪任务中的行人运动模型.然而实际场 ...

  6. 浅谈如何学习深度学习(经验之谈,仅供参考)

    浅谈如何学习深度学习 方向 书籍 视频 方向 首先,要选择一个感兴趣的方向,或者说是将深度学习与自己的专业.学校的优势学科相结合. 计算机视觉(数字图像处理.图像分类.目标检测.图像语义分割.目标跟踪 ...

  7. 经验 | 清华大学计算机系教授~浅谈研究生学位论文选题方法

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :清华大学,专知 AI博士笔 ...

  8. 朱松纯:浅谈人工智能:现状、任务、构架与统一 感悟以及部分内容的概括

    原稿:https://mp.weixin.qq.com/s/-wSYLu-XvOrsST8_KEUa-Q 本文是对朱松纯:浅谈人工智能:现状.任务.构架与统一一文的感悟以及部分内容的概括,原稿如上. ...

  9. 浅谈yolov4中的一部分数据增强

    浅谈yolov4中的数据增强 前言 数据增强 数据增强步骤 1.对图片进行水平翻转 2.对图片进行缩放 3.对图片HSV色域变换 4. Mosaic数据增强 5. 总代码 前言 在接下来的几天,我将解 ...

最新文章

  1. 使用AD8302进行检波
  2. 如何解决大规模机器学习的三大痛点?
  3. 安卓拒绝服务漏洞分析及漏洞检测
  4. [android] socket在手机上的应用
  5. 腾讯云开发者大会 | 腾讯云大学首次与业界顶尖厂商合作的线上学习专区重磅发布...
  6. msvcrt.dll故障模块 explorer.exe_辽阳专业的风冷热泵模块机组厂
  7. mac10.15切换大小写指示灯不亮
  8. 可以免费测试的短信验证码接口接入
  9. Python——顺序结构
  10. 关于二重积分,三重积分的理解
  11. 在计算机中正确的邮件写信格式,电子邮件格式怎么写
  12. 为了下一代,抖音真的该关了---读<<我观察到的牛人有这三个特质>>有感
  13. 怎么退出自适应巡航_定速巡航与自适应定速巡航到底有什么不同?
  14. JAVA经典算法大全
  15. Minio Utils
  16. jetson机器上对lxde桌面设置中文输入法详细过程(图文展示)
  17. Python获取QQ音乐某个歌手的歌单。
  18. likely()和unlikely()
  19. Swift —— 类与结构体
  20. 自制微信机器人:群发消息、自动接收好友

热门文章

  1. c语言使用系统,使用C语言入门
  2. BAV99与TVS在静电应用的比较
  3. vbs恶作剧(病毒)程序代码
  4. 2019年ios权限描述文字—所有APP通用版包过App Store审核
  5. Java框架tk_TKmybatis的框架介绍和原理解析
  6. 使用JS实现子页面调用父页面的函数
  7. springboot的精髓
  8. Smarty之section
  9. 计算机教学拼音打字教案,小学信息技术第2单元 Windows的常用功能第10课 中文输入法教案...
  10. jQuery 图像 360 度旋转插件