传统手工特征(底层特征、中间特征)、深度特征:

底层特征: 主要指基于图像自身,通过简单操作就能得出的特征。如颜色、纹理、形状、梯度等属于底层特征,它们也是中间特征操作的基础特征。图像视频领域广为熟知的底层特征有:RGB、LAB、HSV、HOG、LBP、SIFT、SURF、SILTP(LBP改进)。特点:相对简单,无需学习与训练,仅需简单计算与统计。

中层特征: 在底层特征基础上进行多特征融合处理获得的特征,主要是颜色和纹理的多样性融合。例如:LOMO(HSV+SILTP)。也只特征提取方式进行改进与创新的一类特征,通常融入较为复杂的数据理论处理过程。特点:比较复杂,主要体现在提取策略与融合过程。

深度特征: 通常设计神经网络模型来挖掘图像更深、更为抽象的特征。特点:无需手工参与,受光照、姿态等影响较小,但特征表达方式取法明确知道。

来自:储慧芳_《基于深度特征与传统特征融合的行人再识别研究》


基本概念
hand-crafted: 传统手工方法就是人工设计的一步步能够说出理由来的方法。
end-to-end: 即端到端方法,意思是只有输入端和输出端,当中不需要设计和具体算法,就是一个神经网络。输入原始数据,输出结果即可。典型示例:RCNN(未使用)和FAST-RCNN(使用)

特征提取是CV领域核心问题之一(之二自然是分类问题,没有之三~),特征提取从思路上有两大类:一类是手动设计(hand-crafted)的方式,一类是纯学习的方式,这两种方式都是在某些生物神经理论的基础下进行的, 不同之处是hand-crafted的方式设计的是特征本身,而纯学习的方式设计的是特征提取的框架结构。换种方式来说,就好比是hand-crafted特征是模仿我们所知的人类视觉的流程得到特征,而纯学习的方式重点是学习这个流程本身。

这里都是针对无监督(unsupervised)的特征,也就是在没有label的情况下,直接从数据中学习特征,如果是结合label的特征学习就是supervised的特征了。

hand-crafted特征:

顾名思义人为设计的特征,即直接设计特征本身,根据仿照人类视觉的特点对什么样的特征敏感,什么样的特征不敏感提取图像中有区分能力的特征,因此提取出来的特征每一维往往都有具体的物理含义。目前最牛X的hand crafted 的特征常见的有反应纹理特点的方向梯度类特征siftsurfhog等,反应轮廓形状的shape context等,它们都是经过了很长的时间对人眼敏感信息的特点设计出来的,如果把所需学习的目标换成视频,则也同样需要把这些算法扩展到3D,比如HOG3D,3Dsurf。这些基本属于底层视觉特征,理论依据一般是V1区视觉特性。著名的稀疏编码(Sparse coding) 也是根据V1区视觉特性构造的特征表示方法。其不足之处在于:

  • 需要根据数据的特点精心设计,虽然是在众多的视觉神经理论依据下,但是难免有人为的想当然的成分。
  • 往往依赖于数据库,也就是说设计的特征只对某些数据库表现好,而对其它的数据库效果并不能保证就好。或者当把数据来源发生变化,比如对RGB数据设计的特征换成Kinect深度图像,这些特征点就不一定适应了,因此又得重新设计。
  • 提取过程所花时间很长,不利用大数据特征的提取(貌似不一定对)。

纯学习方式的特征:
设计的是特征提取的规则,一般就是一个model,如神经网络,人为设计的部分是model的结构以及学习的规则,至于model的参数则需要通过学习得到,通过训练得到一个具体的model,而特征则需要通过这个model去对具体的图像或视频提取,因此得到的特征往往无法解释具体每一维的物理含义。构建人的思考过程,这是神经网络理论提出的初衷。神经网络方法在沉默了若干年后,在坚持如一,锲而不舍的大牛Hinton的引领下进入了一个全面开花的阶段,deep learning, Deep belief nets被研究的如火如荼。deep learning框架就是模拟人脑的大脑皮层工作(生物神经理论上的支持),因为大脑皮层的视觉区域也是分层次工作的,越底层的视觉皮层对那些底层特征就越敏感,Feature learning就是以deep learning框架下学习图像或视频的特征,系统的输入为raw data,你只要设计好model的框架,通过训练得到model的参数,至于特征学习出来是什么样子,完全交给机器。

对比:

至于feature learning学习到的特征和 hand crafted特征孰优孰劣目前还不好下结论, 比如后续要介绍计的Quoc. Le(Andrew. Ng组的)特征学习方法用于action recognition,发在CVPR2011在几个复杂数据库(Hollywood2,Youtube)上号称打败了其他state of art 的特征,但是同期(CVPR2011)Heng Wang(LEAR)提出的dense trajectories 特征在这两个数据库上识别率更高,尤其值得注意的是这二人的方法在后续的分类上用的完全一样的框架(BOG+卡方SVM)。

  1. Quoc. Le. Learning hierarchical invariant spatio-temporal features for action recognition with independent subspace analysis
  2. Wang H. Action recognition by dense trajectories

传统手工特征与深度特征的融合(未完,待续)


以上内容来自:

  1. zhimahuuu_End-to-end/hand-crafted的含义(深度学习)
  2. 紫de甘蓝_Hand Crafted 特征 PK 纯学习的特征提取方法

传统手工特征深度特征【转载】相关推荐

  1. 特征工程之自动特征生成(自动特征衍生)工具Featuretools——深度特征合成

    深度特征合成 深度特征合成(DFS)是一种用于对关系数据和时间数据执行特征工程的自动方法. 输入数据 深度特征合成需要结构化数据集才能执行特征工程.为了演示DFS的功能,我们将使用客户交易数据集. I ...

  2. 深度特征融合--add和concat【转载】

    文章目录 一.如何理解concat和add的方式融合特征 二.concat实操 三.concat与add实例 3.1 Densenet 3.2 Feature-Fused SSD: Fast Dete ...

  3. 原创《基于深度特征学习的细粒度图像分类研究综述》

    原创,未经同意,请勿转载 后记:这篇综述文章虽然是19年放出来,但是我在18年初的时候写的,当时准备找个国内期刊投一下的,后面某些原因放弃了.所以文中引用的方法都是17年以前的,有点过时了,现在又出现 ...

  4. modelnet40介绍_三维形状数据的深度特征表示

    深度学习大讲堂致力于推送人工智能,深度学习方面的最新技术,产品以及活动.请关注我们的知乎专栏! 本文转载自CCF-CV,已获得专家委员会同意. 摘要 三维形状特征表示是三维目标识别.三维人脸识别以及三 ...

  5. 旷视提Circle Loss,统一优化视角,革新深度特征学习范式 | CVPR 2020

    作者 | 旷视研究院 本文是旷视 CVPR 2020的被收录论文解读第.它提出用于深度特征学习的Circle Loss,从相似性对优化角度正式统一了两种基本学习范式(分类学习和样本对学习)下的损失函数 ...

  6. CVPR 2020 Oral | 旷视提出Circle Loss,革新深度特征学习范式

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文系旷视研究院投稿 本文是旷视CVPR2020论文系列解读第4篇, ...

  7. CVPR 2020 Oral | 旷视研究院提出Circle Loss,革新深度特征学习范式

    IEEE 国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition) 将于 6 月 14 ...

  8. 深度特征合成与遗传特征生成,两种自动特征生成策略的比较

    来源:Deephub Imba 本文约1800字,建议阅读8分钟 本文我们将通过一个示例介绍如何使用 ATOM 包来快速比较两种自动特征生成算法. 特征工程是从现有特征创建新特征的过程,通过特征工程可 ...

  9. CVPR 2020 Oral | 人脸识别Loss新突破: 旷视提出Circle Loss,革新深度特征学习范式...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 来源:旷视研究院@微信公众号 旷视研究院提出用于深度特征学习的Circle Los ...

最新文章

  1. 尝试Java,从入门到Kotlin(上)
  2. 微服务追踪系统,你绝对想不到!
  3. python怎么打开文档_python打开怎么运行
  4. NYOJ 298 点的变换(矩阵快速幂)
  5. 安装mysql5.6.10_windows下安装mysql(mysql-installer-community-5.6.10.1)详细教程
  6. 如何使用Docker轻松设置Ruby on Rails开发环境
  7. web.xml中/和/*的区别
  8. java instanceof运算符_Java 中的instanceof 运算符
  9. HTML中标签的ref属性,itemref(属性) | itemref (attribute)
  10. 前端面试有这几篇就够了--HTML篇
  11. matlab画动态简单轨迹,MATLAB中绘制质点轨迹动图并保存成GIF
  12. Google 学术搜索(Google Scholar)使用技巧
  13. 幸福小夫妻被五百万巨奖生生拆散 急于离婚
  14. Ugly Windows UVA - 1419
  15. 影响时尚界的十大可穿戴技术创业公司
  16. 小米将在武汉建1万人研发中心
  17. EDUCoder编程练习题解(结构体)
  18. Altium Designer 如何从已有的PCB图、原理图,分别导出PCB封装库和原理图封装库
  19. 梯度下降算法原理 神经网络(Gradient Descent)
  20. MATLAB绘制二维曲线-fplot函数

热门文章

  1. Docker 使用 docker push 命令 推送本地镜像到远程DockerHub仓库服务器
  2. Python模块学习 - 用tinify模块压缩和优化图片
  3. Java多线程相关的几十个问题
  4. 使用adduser命令在Debian Linux中创建用户
  5. C语言,利用一维数组选择法排序,使学生成绩高低排序(要求输入为负值时输入结束)
  6. android gridview 按钮事件处理,Android TV gridview 的按键事件响应巧变 事件分发机制...
  7. Python每日一练(9)-批量爬取B站小视频
  8. 【苹果cms10 Maccmsv10 站群深度定制版 开发日志】 新增日志模块
  9. C#LeetCode刷题之#342-4的幂(Power of Four)
  10. abs.s19文件_ABS 1.2:后台命令和导入文件的功能