双线性模型是2015年提出的一种细粒度图像分类模型。该模型使用的是两个并列的CNN模型,这种CNN模型使用的是AlexNet或VGGNet去掉最后的全连接层和softmax层,这个作为特征提取器,然后使用SVM作为最后的线性分类器。当然,作者还在实验中尝试了多种方法,比如最后使用softmax但类别有所减少的分类器,作者在特征提取器上也有三种尝试,分别是使用两个AlexNet,使用一个AlexNet和一个VGGNet,和使用两个VGGNet,这三种特征提取的方法在不同的数据集上效果各有一些小差别,但是总体来说,相比其他类型的细粒度分类方法在精度上有较大提高,比如使用CNN特征的Fisher Vector(FV-CNN)方法,使用SIFT特征的Fisher Vector(FV-SIFT)方法,普通的带全连接层的卷积神经网络(FC-CNN)方法。

双线性图像分类模型示意图如下:

用于图像分类的双线性模型由四元组组成。 这里是特征函数,是池化函数,是分类函数。 特征函数是一个映射 ,输入图像和位置并输出大小为 的特征。 我们说的位置通常是可以包含位置和尺度。 特征输出在每个位置上使用矩阵外积进行组合,即在位置处的的双线性特征组合由双线性函数 给出。

这种模型具有以下优点

1,该架构能够以平移不变的方式,对局部的对级(pairwise)特征交互进行建模,适用于细粒度分类。

2,能够泛化多种顺序无关的特征描述子,如Fisher 向量,VLAD及O2P。实验中使用使用卷积神经网络的作为特征提取器的双线性模型。

3,双线性形式简化了梯度计算,能够对两个网络在只有图像标签的情况下进行端到端训练。

这篇论文中提到的一些技术比如Fisher Vector方法,SIFT特征提取,VLAD,Bag-of-Visual-Words。然后在双线性模型里面的一些细节还是有很多不懂得地方。

参考:

Lin T Y, Roychowdhury A, Maji S. Bilinear CNN Models for Fine-Grained Visual Recognition[J]. 2015:1449-1457.

细粒度论文笔记:双线性模型 《Bilinear CNN Models for Fine-Grained Visual Recognition》相关推荐

  1. 论文笔记 | 基于双线性CNN模型的细粒度视觉识别

    细粒度视觉识别之双线性CNN模型 [1] Lin T Y, RoyChowdhury A, Maji S. Bilinear cnn models for fine-grained visual re ...

  2. 论文笔记--Evaluating Large Language Models Trained on Code

    论文笔记--Evaluating Large Language Models Trained on Code 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 评估 3.2 模型训练--Cod ...

  3. 【论文笔记 2】CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET

    [论文笔记 2]CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET 1. 综述 对现代的CNN网络结构进行了简要说明,一般的网络都是由卷 ...

  4. 论文笔记【A Comprehensive Study of Deep Video Action Recognition】

    论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...

  5. 【读点论文】Conformer: Local Features Coupling Global Representations for Visual Recognition卷积提取局部,SA获取全局

    Conformer: Local Features Coupling Global Representations for Visual Recognition Abstract 在卷积神经网络(CN ...

  6. 学习笔记之——Bilinear CNN model

    双线性模型是2015年提出的一种细粒度图像分类模型.该模型使用的是两个并列的CNN模型,这种CNN模型使用的是AlexNet或VGGNet去掉最后的全连接层和softmax层,这个作为特征提取器,然后 ...

  7. 论文笔记:Spherical CNN

    Spherical CNN 1.四个问题 要解决什么问题? 3D场景下旋转不变性特征的提取. 用了什么方法解决? 提出了球形卷积操作,也叫作球形互相关(spherical cross-correlat ...

  8. 论文笔记:A CNN Regression Approach for Real-Time 2D/3D Registration

    REAL-TIME 2D/3D REGISTRATION VIA CNN REGRESSION 摘要 介绍 问题描述 通过分层学习进行姿态估计 摘要 提出了用于实时2-D / 3-D注册的卷积神经网络 ...

  9. 论文笔记:Attention-based End-to-End Models for Small-Footprint Keyword Spotting

    <Attention-based End-to-End Models for Small-Footprint Keyword Spotting> 小米团队+西北工业大学,Interspee ...

最新文章

  1. Linux下使用ssh动态验证码登陆机器
  2. java 堆大小_适当的Java堆大小的5个技巧
  3. 前端实习生笔试_前端实习生面试题——HTML
  4. centos7挂载ntfs文件系统_MacOS读写挂载NTFS磁盘,几行代码就行了
  5. html如何在网页上看错误,HTML错误时,Spring MVC的,但不能查看网页时,静态
  6. html弄多个按钮_如何为HTML / CSS页面添加更多按钮?
  7. Synopsys MetaWare for Linux 安装与编译指南
  8. iMazing恢复备份的详细教程
  9. centos 对某ip开放 防火墙端口_Centos防火墙设置与端口开放的方法
  10. winyyy sys hcpidesk sys mtlrd sys uldfhjfh sys servets exe等1
  11. 《 郝斌 java自学视频 完结 》_郝斌Java自学视频 全107讲视频教程下载 完整版
  12. 印度十大最好电影排行
  13. 荣耀8X0安卓系统切换鸿蒙系统,华为大改安卓Q,EMUI 10将启用全新UI,花粉沸腾:静候鸿蒙...
  14. DAX Calculate的使用说明
  15. 真正免费的pdf转word在线工具
  16. Java 导出word文档,遍历表格数据,导出图片
  17. 关于google搜索栏首字母粘连问题
  18. php++i和i++区别_PHP和i,第1部分
  19. 物联网大白话之一-什么是物联网
  20. 百度地图Polyline实现多颜色绘制

热门文章

  1. Nuke python脚本开发 01
  2. RBF Kernel 是一种度量的证明
  3. Ubuntu18.04设置动态ip详细步骤(可视化)
  4. Oracle DCD
  5. mac上的一款超级强大的文件管理工具Forklift
  6. N个技巧,编写更高效 Dockerfile
  7. iPhone 近距离传感器的使用
  8. Asserted、Deasserted的理解
  9. idea 中maven assembly 打包项目
  10. 《蜡笔小新》的作者去世了