纹理特征,材料分类(Material Classification),在MINC-2500、Flickr Material Database、KTH-TIPS-2b、4D-Light-Field-Material、GTOS上state-of-the-art(2017年)。

思想主要来源是:传统图片分类方法都是提取人工设计的特征(SIFT等)然后使用BOW进行编码,再用SVM进行分类,后面BOW被VLAD、Fisher Vector编码替换并融合CNN特征可以达到sota的效果。然而这样的方法有缺点,就是编码和特征的学习并不是end-to-end的,所以作者设计了一个learnable residual encoding layer。作者还提到一般的CNN的方法虽然在图片分类和物体识别上有比较好的效果,但是在纹理识别上表现并不理想,给出的理由是:

``` recognizing textures needs for a spatially invariant representation describing the feature distributions instead of concatenation ```

这篇论文的主要贡献:

1. learnable residual encoding layer。能够生成鲁棒的残差编码例如(VLAD和Fisher Vector),能接收任意的输入分辨率,并且生成固定长度的特征表示,这种编码方式非常适合pretrained feature的迁移。关于该层的一个后向传播可以看论文的附录A,给了很清楚的推导。一个前向计算如下公式:

2.将feature extraction, dictionary learning, encoding 融合成一个end-to-end的形式。

整个网络模型结构:

开源代码:

Pytorch:https://github.com/zhanghang1989/PyTorch-Encoding-Layer

FisherVector的教程:http://www.vlfeat.org/api/fisher-fundamentals.html

VLAD的教程:http://www.vlfeat.org/api/vlad-fundamentals.html

转载于:https://www.cnblogs.com/Key-Ky/p/7183748.html

Deep TEN: Texture Encoding Network相关推荐

  1. 论文阅读 Deep TEN: Texture Encoding Network

    1.Introduction 说实话和作者的context encoding那篇有点重了的感觉 作者将字典学习和编码融合到一个模型里面了 inherent的视觉字典是从损失中直接学习出来的 整个的表示 ...

  2. 论文笔记:Person Re-identification with Deep Similarity-Guided Graph Neural Network

    Person Re-identification with Deep Similarity-Guided Graph Neural Network 2018-07-27 17:41:45 Paper: ...

  3. 【图像超分辨率】Learning Texture Transformer Network for Image Super-Resolution

    论文地址:http://openaccess.thecvf.com/content_CVPR_2020/papers/Yang_Learning_Texture_Transformer_Network ...

  4. (TTSR)Learning Texture Transformer Network for Image Super-Resolution

    中心提取: 1.该模型中提取Q.K.V的过程值得学习一下,他们使用的是:V自然就是参考图(Ref),用于辅助得到更好的纹理结果,Q是LR上采样图的特征(LR↑),K是参考图先下采样再上采样的特征(Re ...

  5. 论文Makeup Like a Superstar: Deep Localized Makeup Transfer Network(2016,妆容迁移,基于数据库匹配)

    论文下载地址:https://arxiv.org/pdf/1604.07102.pdf 演示粉底,唇彩,眼影的迁移,模型可扩展到其它化妆品的迁移,可控制妆容的轻薄程度.端到端的深度卷积神经网络(基于数 ...

  6. [IJCAI2016]Makeup Like a Superstar: Deep Localized Makeup Transfer Network

    标题:Makeup Like a Superstar: Deep Localized Makeup Transfer Network 链接:https://arxiv.org/pdf/1604.071 ...

  7. 【GANs】Deep Convolution Generative Adversarial Network

    [GANs]Deep Convolution Generative Adversarial Network 3 DCGAN 3.1 简介 3.2 DGGAN实现 3 DCGAN Unsupervise ...

  8. Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection

    Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection 一,Overview 二,文本组件预测: ①首先每 ...

  9. 论文翻译:2020_DCCRN: Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement...

    论文地址:DCCRN:用于相位感知语音增强的深度复杂卷积循环网络 论文代码:https://paperswithcode.com/paper/dccrn-deep-complex-convolutio ...

最新文章

  1. 技术分享(持续更新)
  2. java 动态拼接sql_动态SQL拼接工具类
  3. [阿里云]I+的一些探索
  4. 排列、组合问题(递归)
  5. opencomm在c语言中的作用,你能用C语言编写面向对象的代码吗?
  6. 从入门到入土(十)RocketMQ集群流程以及核心概念
  7. Xcode7.0 更新完后,网络请求报错
  8. APUE学习笔记-守护进程的创建
  9. CSAPP阅读进度日记
  10. Atitti html5 h5 新特性attilax总结
  11. EF Code First学习笔记 初识Code First
  12. 未处理的异常: 0xC0000005: 读取位置 0x00000000 时发生访问冲突
  13. 基于SSM框架的生源地助学贷款管理系统的设计与实现
  14. 如何查询Linux软件安装源,Zypper——suse软件查询 安装 升级 与 软件源编辑
  15. P28 Elastic Beanstalk
  16. 【PNP与NPN两种三极管使用方法(工作在开关状态)】
  17. lsnrctl监听器的启动和关闭
  18. R语言课上笔记(第1-4天)
  19. 钳形万用表使用方法,如何测量电压、电流、电阻?
  20. iOS 系统分享UIActivityViewController,自定义分享预览UI

热门文章

  1. 年过35岁的程序员都去哪儿了
  2. 客户端读写hdfs数据
  3. LeetCode - 69. x 的平方根
  4. IIS访问共享文件详解
  5. EngJS(超轻量) 中数据双向绑定如何使用
  6. idea 不能粘贴复制问题
  7. 在 Shell 脚本里使用数组
  8. java第二阶段学习day5
  9. 修改CentOS7网卡名称为传统名称eth0格式(20170711更新)
  10. Linux查看MBR的内容