计算机视觉之基本概论

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

原理:
计算机视觉就是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现像人那样能识别和理解任何环境,完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。

发展情况:
计算机视觉领域的突出特点是其多样性与不完善性。这一领域的先驱可追溯到更早的时候,但是直到20世纪70年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。然而这些发展往往起源于其他不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的公式。

尽管如此,人们已开始掌握部分解决具体计算机视觉任务的方法,可惜这些方法通常都仅适用于一群狭隘的目标(如:脸孔、指纹、文字等),因而无法被广泛地应用于不同场合。

对这些方法的应用通常作为某些解决复杂问题的大规模系统的一个组成部分(例如医学图像的处理,工业制造中的质量控制与测量)。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。

人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?从而使之完成特定的技术动作(例如:移动一个机器人通过某种特定环境)。这一问题便与计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,为决策提供信息。另外一些研究方向包括模式识别和机器学习(这也隶属于人工智能领域,但与计算机视觉有着重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。

物理是与计算机视觉有着重要联系的另一领域。

计算机视觉关注的目标在于充分理解电磁波——主要是可见光与红外线部分——遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理和固态物理,一些尖端的图像感知系统甚至会应用到量子力学理论,来解析影像所表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决,例如流体运动。也由此,计算机视觉同样可以被看作是物理学的拓展

另一个具有重要意义的领域是神经生物学,尤其是其中生物视觉系统的部分。
在整个20世纪中,人类对各种动物的眼睛、神经元、以及与视觉刺激相关的脑部组织都进行了广泛研究,这些研究得出了一些有关“天然的”视觉系统如何运作的描述(尽管仍略嫌粗略),这也形成了计算机视觉中的一个子领域——人们试图建立人工系统,使之在不同的复杂程度上模拟生物的视觉运作。同时计算机视觉领域中,一些基于机器学习的方法也有参考部分生物机制。

计算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,尤其是对时变信号的处理,都可以很自然的被扩展为计算机视觉中对二元变量信号或者多元变量信号的处理方法。但由于图像数据的特有属性,很多计算机视觉中发展起来的方法,在单元信号的处理方法中却找不到对应版本。这类方法的一个主要特征,便是他们的非线性以及图像信息的多维性,以上二点作为计算机视觉的一部分,在信号处理学中形成了一个特殊的研究方向。

除了上面提到的领域,很多研究课题同样可被当作纯粹的数学问题。例如,计算机视觉中的很多问题,其理论基础便是统计学,最优化理论以及几何学。

如何使既有方法通过各种软硬件实现,或说如何对这些方法加以修改,而使之获得合理的执行速度而又不损失足够精度,是现今电脑视觉领域的主要课题。

计算机视觉之基本概论相关推荐

  1. 精通 TensorFlow 2.x 计算机视觉:第一部分

    原文:Mastering Computer Vision with TensorFlow 2.x 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自[ApacheCN 深度学习 译文集],采用 ...

  2. ApacheCN 深度学习译文集 20210112 更新

    新增了六个教程: TensorFlow 2 和 Keras 高级深度学习 零.前言 一.使用 Keras 入门高级深度学习 二.深度神经网络 三.自编码器 四.生成对抗网络(GAN) 五.改进的 GA ...

  3. 6.18电子书5折促销

    6.18电子书5折促销(点击书名了解书籍详细信息) ADS高速电路信号完整性应用实例 从实践中学习TCP/IP协议 Python网络爬虫从入门到实践 第2版 Python 3.x入门到应用实践 零基础 ...

  4. 保研数据中隐藏了哪些信息?用数理统计解决信息不对称问题!

    昨天,西安电子科技大学教务处公布了全校的保研名单. 出于对数据的敏感,我将相关数据汇总后,进行进一步分析,得出了许多有意思的结论,顺便可以解决一些信息不对称的问题. 数据大全 学院 专业 最高分 最低 ...

  5. 计算机视觉技术与应用概论,8计算机视觉概论2010.pdf

    8计算机视觉概论2010.pdf 授课内容与方式 东北大学自动化专业本科课程 • 专题讲座.增加互动 • 基本原理结合实际应用 数字图像处理与模式识别基础 • 具体内容 – 概论 – 立体成像 – 目 ...

  6. 【计算机视觉】概论篇

    什么是计算机视觉? 百度百科: 计算机视觉是使用计算机及相关设备对生物视觉的一种模拟.它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样. ...

  7. 学习笔记:《数字媒体技术概论》-3/10 计算机视觉技术及应用-中国大学慕课公开课

    目录 3-计算机视觉技术及应用 3.1-计算机视觉定义及概述 3.2-计算机视觉的主要研究内容 3.3-人工智能与深度学习 第三章 计算机视觉技术及应用 3.1-计算机视觉定义及概述 计算机视觉:信号 ...

  8. 计算机视觉结课论文,计算机视觉与图像识别结课论文

    <计算机视觉与图像识别结课论文>由会员分享,可在线阅读,更多相关<计算机视觉与图像识别结课论文(8页珍藏版)>请在人人文库网上搜索. 1.计算机视觉与图像识别结课论文基于C+的 ...

  9. DeepLearningAI 学习笔记 1.1 深度学习概论

    1.1 深度学习概论 视频:第一周 深度学习概论 整理:飞龙 什么是神经网络? "深度学习"指的是训练神经网络,有时候规模很大,那么神经网络究竟是什么呢?在这个视频中,我会讲些直观 ...

  10. Introduction to Graph Neural Network(图神经网络概论)翻译:目录总览

    前言:最近对图神经网络部分比较感兴趣,偶尔看到清华大学刘知远老师在今年3月份发表的一本书:Introduction to Graph Neural Network,于是将该书内容进行翻译,记录阅读中自 ...

最新文章

  1. Android数据持久化:SharePreference
  2. layui select 与 vue 的结合使用
  3. 分布式存储系统的关键技术-针对应用和负载的存储优化技术
  4. CVPR 2021| 端到端场景无关视觉定位算法(SuperGlue一作出品)
  5. UI产品设计流程中的14个要点
  6. [YTU]_2446( C++习题 输入输出--私有继承)
  7. 对称加密算法之分组加密的六种工作模式(ECB、CBC、PCBC、CFB、OFB、CTR)
  8. [Android] 年年有鱼手机主题
  9. iphone如何分屏_苹果手机如何操作分屏 苹果手机录屏没有声音这么做轻松解决...
  10. Verilog inout语句使用方法及技巧
  11. QuantLib 金融计算——QauntLib 入门
  12. python orm开发模型_Python ORM框架Peewee初探【二】创建或者生成模型
  13. FreeMarker语法之表达式(二)
  14. oracle查看所有用户6,CSS_Oracle 用户权限查询,1.查看所有用户:nb - phpStudy
  15. 微信小游戏3d入门视频教程
  16. 显卡故障软件测试,显卡软硬件故障检查与排除实战
  17. Linux下线程经典问题(生产者消费者问题,哲学家问题...)
  18. Win11 Android Stuido虚拟机启动失败、崩溃
  19. MediBangPaint Pro for mac(优秀漫画制作软件)
  20. 下载到的电子书格式是Mobi,这种格式能否在手机上打开?

热门文章

  1. 2021年 最全面 软件测试工程师面试题及答案
  2. 通达OA2017按部门创建公共文件柜
  3. Matlab带阻滤波器实验报告,有源滤波器实验报告
  4. 使用TestNG-abbot测试GUI
  5. 1925异常 xshell_Xmanager Power Suite 6
  6. oracle dbv验证,Oracle DBV工具说明
  7. 班级随机点名html,提问之星随机点名随机抽取班级学生教程
  8. 我理解的Sentinel:时间窗统计
  9. VS2017社区版离线安装
  10. 希尔密码_希尔密码| 网络安全