(物体识别过程

在计算机视觉领域,一个典型的物体识别系统往包含以下几个阶段预处理特征特征选择建模匹配定位

1.2.3预处理

预处理几乎是所有计算机视觉算法的第一步动机是尽可能在不改变图像承载的本质信息的前提下,使得每张图像的表观特性如颜色分布,整体明暗,尺寸大小等尽可能的一致,以之后的处理过程。预处理有生物学的对应。瞳孔,虹膜和视网膜上的一些细胞的行为类似某些预处理步骤,如自适应调节入射光的动态区域等等。和特征之间的界线不完全分明。有时两者交叉在一起。预处理经常与具体的采样设备和所处理的问题有关。

从理论上说,像预处理这种先验式的操作是不应该有的。因为它并不为任何目的服务,所以完全可以随意为之没有应该怎么做的标准,大部分情况下预处理是看着实验结果说话。这是因为计算机视觉目前没有一个整体的理论框架,无法从全局的高度来指导每一个步骤应该如何进行。在物体识别中所用到的典型的预处理方法不外乎直方图均衡及滤波几种。像高斯模糊可以用来使得之后的梯度计算更为准确直方图均衡可以克服一定程度的光照影响。值得注意的是,有些特征本身已经带有预处理的属性,因此不需要再进行预处理操作。

预处理通常包括五种基本运算:

编码实现模式的有效描述,适合计算机运算。

阀值滤波运算按需要选出某些函数,抑制另一些。

模式改善排除或修正模式中的错误,或不必要的函数值。

正规化使某些参数值适应标准值,或标准值域。

离散模式运算离散模式处理中的特殊运算。

2.4特征

特征的目的从模式样本中能代表该模式特有的性质。是模式分类中最关键的一步但又是最难以控制的一步。准则尽量少的特征,而能使分类的误差最小。矛盾特征在分类之前完成,事先知道哪些特征能使分类误差最小目前还无法解决这个矛盾。特征负责从图像中得到重要的信息以交给下一层使用,忽略不太重要的信息。特征的设计关键点在在哪里特征及什么特征。

对在哪里特征这个问题,有两种答案。某些系统仅在那些应该的地方特征,以保证得到的特征都是有效的,同时处理时间不会太长。为此就必须设计兴趣点检测器以在真正提取特征之前找到那些位置。此类检测器的设计思路是希一望这些点在仿射变换下保持不变,这样就能获得对扭曲及光线变化的鲁棒性。另一些系统则采用密集采样方式,对图像上的每一个点都进行特征提取。前一种方式具有效率高的特点,然如何选取兴趣点检测器本身就是一个相当艰难的任务,并会给系统引入不适当的先验,使得最终结果随着被测物体类别的不同会有偏离,与物体识别的精神不相符合后一种方式速度是其较大的问题。

对什么特征这个问题,答案则要丰富许多。对局部特征,已开

发的系统中已存在很多可用的局部特征也可以分为“形状(Shape)”及“材质(Texture )”两类。这两类特征编码本质上不同的信息,有不同的能力。形状特征,如线段,曲率,其具有的一大特性是对光照及形变的不变性,然同时也有时间长及对遮挡敏感的缺点,某些方法由数学上的限制,无法用自相交或者非闭合曲线等等在自然图像中司空见惯的情况。另一方面,一些材质特征,如图像小块,小波系数等等,时间相对较短,并对遮挡的抵抗强些,但是缺乏各方面的不变性还有一些材质特征如直方图,则具有相当强的变换不变性,但代价是丢失了空间信息。

近年来,子空间方法,如主成分分析(PCA),辨别成分分析(LDA),也成为一种相对重要的特征手段。这种方法将图像拉长成为高维空间的向量,并进行奇异值分解以得到特征方向。人脸识别便是其较为成功的应用范例此类方法能处理有全局噪声的情况,模型相当简单易实现然这种算法割裂了图像的内结构,因此在本质上是非视觉的,模型的内在机制较难令人理解,也没有任何机制能消去施加图像上的仿射变换。

2.2图像特征提取方法

图像特征提取就是提取出一幅图像中不同其他图像的根本属性,以区别不同的图像。如灰度、亮度、纹理和形状等等特征都是与图像的视觉外观相对应的还有一些则缺少自然的对应性,如颜色直方图、灰度直方图和空间频谱图等。

基图像特征进行物体识别实际上是根据提取到图像的特征来判断图像中物体属什么类别。形状、纹理和颜色等特征是最常用的视觉特征也是现阶段基图像的物体识别技术中采用的主要特征。下面分别介绍一下图像的形状、纹理和颜色特征的提取方法。

2.2.1图像形状特征提取

形状特征是反映出图像中物体最直接的视觉特征,大部分物体可以通过分辨其形状来进行判别。所以,在物体识别中,形状特征的正确提取显得非常重要。

常用的图像形状特征提取方法有两种基轮廓的方法和基区域的方法。这两种方法的不同之处在对轮廓的方法来说,图像的轮廓特征主要针对物体的外边界,描述形状的轮廓特征的方法主要有样条、链码和多边形逼近等在基区域的方法中,图像的区域特征则关系到整

计算机视觉物体识别的过程,(物体识别过程.doc相关推荐

  1. 计算机视觉——运用pycharm建构的物体识别软件

    #1.在手机上下载IP摄像头 #2.可以获取我在gitee仓库里的软件安装包并下载到本地 获取物体识别软件安装包 #3.进入IP摄像头,点击下方打开摄像头服务器,能看见画面则成功 *注意:此时ip摄像 ...

  2. CVPR 2020 | 腾讯优图17篇论文入选,含类比学习、人脸识别、物体检测、行人重识别等领域...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 本文来源:腾讯优图 全球计算机视觉顶级会议CVPR2020  (IEEE Conf ...

  3. 神经网络模型的训练过程,人脸识别神经网络模型

    如何通过人工神经网络实现图像识别 . 人工神经网络(ArtificialNeuralNetworks)(简称ANN)系统从20世纪40年代末诞生至今仅短短半个多世纪,但由于他具有信息的分布存储.并行处 ...

  4. opencv人脸识别以及自定义物体识别系统

    目录 一.简介: 二.软硬件应用: 三.模块介绍: (一)人脸识别: (二).自定义物体识别: (三).图片展示: (四).python框架: (五).执行器--单片机: 四.效果展示: 五.总结 : ...

  5. Java软件研发工程师转行之深度学习(Deep Learning)进阶:手写数字识别+人脸识别+图像中物体分类+视频分类+图像与文字特征+猫狗分类

    本文适合于对机器学习和数据挖掘有所了解,想深入研究深度学习的读者 1.对概率基本概率有所了解 2.具有微积分和线性代数的基本知识 3.有一定的编程基础(Python) Java软件研发工程师转行之深度 ...

  6. 开发物体识别桌、_科研人员开发突破性的技术,允许盲人识别形状和物体

    一项令人难以置信的新技术正在让失明人士有能力识别形状和物体,而这些形状和物体都是在他们的大脑上"画出来"的.一篇描述该技术的研究论文刚刚发表在<细胞>杂志上,正如Sci ...

  7. 计算机 识别u盘 原理,电脑与USB3.0之间的识别过程,识别原理,高额金币悬赏!...

    电脑与USB3.0之间的识别过程,识别原理,高额金币悬赏! 提问者:傻瓜774411  |  浏览 次  |  提问时间:2019-01-06  |  回答数量:9 说明:包含多个问题,默认悬赏50金 ...

  8. OpenCV-Python人脸识别,车辆识别,自定义物体识别,自定义分类器

    本文将使用opencv-python识别自定义物体,能够区分识别到的物体,如果用作人脸识别,则能够区分出不同的人脸id,也就是能够分得清张三,李四,王二麻子 (这方案已经很老了,去学 Tensorfl ...

  9. 行为识别C3D代码(pytorch)实现过程及常见错误

    行为识别C3D代码(pytorch)实现过程及常见错误 1.C3D网络代码 C3D(pytorch)实现代码链接: C3D代码 2.C3D代码复现过程 (1)环境版本要求 pytorch:3.5及以上 ...

  10. 【计算机视觉】基于OpenCV的人脸识别

    一点背景知识 OpenCV 是一个开源的计算机视觉和机器学习库.它包含成千上万优化过的算法,为各种计算机视觉应用提供了一个通用工具包.根据这个项目的关于页面,OpenCV 已被广泛运用在各种项目上,从 ...

最新文章

  1. Python入门知识
  2. android_secure写权限,android.permission.WRITE_SECURE_SETTINGS权限报错
  3. java 看书浏览器官_JAVA读取文件流,设置浏览器下载或直接预览操作
  4. Golang类型转换
  5. 大学python作业_2020年大学moocPython编程基础作业答案
  6. js 查看是否为空值
  7. Linux第二周考试题
  8. minio  nginx 配置
  9. 幻彩灯 html5,WS2811幻彩灯程序
  10. 字典(数字大小写转换器)
  11. 共享软件业余者VS共享软件专业者
  12. 服务端渲染(SSR)
  13. [已解决] Could not create connection to database server.
  14. html后代选择器的语法,[转]CSS子选择器与后代选择器
  15. 亚马逊云科技:云厂商做自研芯片的两个「选择」
  16. 高德地图交通态势爬取并存入MySQL数据库
  17. ZN-1AI工业机器人与智能视觉系统应用实训平台
  18. 查看CPU物理核数和逻辑核数
  19. ROS通信机制--键盘控制乌龟运动线速度角速度XYZ值的解释
  20. BP神经网络学习及matlab实现

热门文章

  1. cve-2021-22205复现
  2. 紧急通知,1秒下达给员工 | 巴别鸟 V5.0上线
  3. php开发地图导航,百度地图API使用方法详解
  4. docker swarm实践爆心肝总结全在这里,火速收藏!!!
  5. 年轻不要停止奋斗的脚步
  6. zk服务启动报错:Unexpected exception, exiting abnormally.java.io.IOException:
  7. Python的学习之旅第一站:基本语法
  8. gym101431D(传说中的构造(呸))
  9. c语言printf输出整数数字,C语言 念数字 输入一个整数,输出每个数字对应的拼音。当整数为负数时,先输出fu字...
  10. php sql 条件拼组_将数组里的元素拼接成sql里的in条件