提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 动机与主要知识点介绍
  • 网络结构
    • Attribute→Visual Attention Sub-net
    • Visual→Attribute Attention Sub-net
    • Loss

动机与主要知识点介绍

动机:

先前的ZSL学习要么简单地将图像的全局特征与其相关的类语义向量对齐,要么利用单向注意力来学习有限的潜在语义表示。以上操作,没有有效的发现内在语义视觉特征和属性特征。说白了,以前的方法仅仅是简单地单向运用了全局的注意力机制,没有发现到网络真正注意到的属性部分,例如斑马的条纹属性,鸟的翅膀属性等等。

因此,提出了一个名为 Mutually Semantic Distillation Network (MSDN) 的网络,目的就是为了蒸馏视觉与语义特征之前内在的语义表示。由两部分组成:一是attribute →visual attention sub-net,学习基于属性的视觉特征;二是visual →attribute attention sub-net,学习基于视觉的属性特征。然后提出了一个蒸馏损失,可以两部分子网络相互矫正与学习。

网络结构

Attribute→Visual Attention Sub-net

输入:(1) 图像的视觉特征集合 V={v1,…,vR}V=\left\{v_1, \ldots, v_R\right\}V={v1​,…,vR​},每个视觉特征编码图像中的一个区域(2)语义特征向量集合A={a1,…,aK}A=\left\{a_1, \ldots, a_K\right\}A={a1​,…,aK​}。

关注每个属性的图像区域,并将每个属性与相应的关注视觉区域特征进行比较,以确定每个属性的重要性。对于第 k 个属性,对应图像的第 r 个区域的注意力权重定义为:βkr=exp⁡(ak⊤W1vr)∑k=1Kexp⁡(ak⊤W1vr)\beta_k^r=\frac{\exp \left(a_k^{\top} W_1 v_r\right)}{\sum_{k=1}^K \exp \left(a_k^{\top} W_1 v_r\right)}βkr​=∑k=1K​exp(ak⊤​W1​vr​)exp(ak⊤​W1​vr​)​,其中 W1 是一个可学习的矩阵,用于计算每个区域的视觉特征并衡量每个语义属性向量之间的相似度。由此,得到一组注意力权重{βkr}r=1R\left\{\beta_k^r\right\}_{r=1}^R{βkr​}r=1R​。然后,基于注意力权重,提取基于属性的视觉特征Fk=∑r=1RβkrvrF_k=\sum_{r=1}^R \beta_k^r v_rFk​=∑r=1R​βkr​vr​。在获取特征图集合F之后,这里要引入一个映射函数M1\mathcal{M}_1M1​,将它们映射到语义嵌入空间。为了更加精确,这里引入了语义属性向量集合A={a1,a2,⋯,aK}A=\left\{a_1, a_2, \cdots, a_K\right\}A={a1​,a2​,⋯,aK​},M1\mathcal{M}_1M1​将基于属性的视觉特征FkF_kFk​与aka_kak​相匹配。于是公式表示为:ψk=M1(Fk)=ak⊤W2Fk\psi_k=\mathcal{M}_1\left(F_k\right)=a_k^{\top} W_2 F_kψk​=M1​(Fk​)=ak⊤​W2​Fk​,这里ψk\psi_kψk​ 是一个属性得分,表示在给定图像中具有第 k 个属性的置信度。

Visual→Attribute Attention Sub-net

这一部分其实和Attribute→Visual Attention Sub-net十分相似,包括中间的推理及计算过程。

Loss

总共有两部分组成:

Zero-Shot Learning学习笔记 -- CVPR_2022_MSDN: Mutually Semantic Distillation Network for Zero-Shot Learn相关推荐

  1. 笔记 | 吴恩达Coursera Deep Learning学习笔记

    向AI转型的程序员都关注了这个号☝☝☝ 作者:Lisa Song 微软总部云智能高级数据科学家,现居西雅图.具有多年机器学习和深度学习的应用经验,熟悉各种业务场景下机器学习和人工智能产品的需求分析.架 ...

  2. 论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning

    论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning NDSS 2021录用文章 目录 论文学习笔记 POSEID ...

  3. 【Machine Learning 学习笔记】Stochastic Dual Coordinate Ascent for SVM 代码实现

    [Machine Learning 学习笔记]Stochastic Dual Coordinate Ascent for SVM 代码实现 通过本篇博客记录一下Stochastic Dual Coor ...

  4. 【Machine Learning 学习笔记】feature engineering中noisy feature的影响

    [Machine Learning 学习笔记]feature engineering中noisy feature的影响 通过本篇博客记录一下添加噪声对Lasso和SVM的影响,采用的数据集为sklea ...

  5. 网上某位牛人的deep learning学习笔记汇总

    目录(?)[-] 作者tornadomeet 出处httpwwwcnblogscomtornadomeet 欢迎转载或分享但请务必声明文章出处 Deep learning一基础知识_1 Deep le ...

  6. Machine Learning学习笔记(十)K-means聚类算法

    K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一.它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高:而不同聚类中的对象相似度较小.其聚类 ...

  7. 机器学习 Maching Learning - 学习笔记 - 概括篇

    此篇是概括总结,之后会更新每个模型的笔记.梳理一下这段时间学习的内容. 1 定义 What is Machine Learning Arthur Samuel(亚瑟塞缪尔): the field of ...

  8. [增强学习][Reinforcement Learning]学习笔记与回顾-1

    引言 增强学习这几篇博客在于学习增强学习中所获得知识的理解与回顾,如果想要深入学习增强学习,请参考后文所列出的资料和书籍.本文只用于复习与理解. Introduction to Reinforceme ...

  9. CV视觉论文Deep learning学习笔记(一)

    论文介绍和监督学习(introduction of paper and supervision of learning) 1. 论文介绍和作者介绍 作者:论文作者是2018年图灵奖得主yoshua B ...

最新文章

  1. Asp.net(c#)实现多线程断点续传
  2. 数博前沿 | 企业数据应用:聚焦场景,打通“最后一公里”
  3. Unix/Linux提权漏洞快速检测工具unix-privesc-check
  4. vs2010MFC D3D播放YUV格式视频详细制作全过程
  5. STL中list的使用(理论)
  6. 安卓APP_ 控件(3)—— EditText
  7. 【DKN】(六)KCNN.py
  8. Lsky Pro兰空图床程序网站PHP源码
  9. python和c++哪个好-C/C++和Python哪个更有前景?
  10. Android ProgressDialog示例
  11. Mysql5.7双主安装与使用
  12. axure删除的页面怎么恢复_Axure高保真还原Web首页布局和交互教程
  13. eclipse_开启出现弹窗_Subversive Connector Discovery
  14. appfuse mysql_Appfuse:起步
  15. java poi 水印_poi excel如何设置水印透明度
  16. 用python画人物素描_python实现图片素描效果
  17. 中文和英文论文哪个比较容易发表
  18. Android 使用so库的遇到的坑
  19. 云原生背景下的运维价值思考与实践
  20. threw exception [Circular view path [index]: would dispatch back to the current handler URL [/index]

热门文章

  1. matplotlib画会动的椭圆
  2. esc键退出全屏 vue_解决了VUE在浏览器全屏下监听不到Esc键盘事件
  3. vim保存分享录制宏
  4. python调用shell命令
  5. appinventor跑酷游戏_基于APPInventor的一款益智游戏的设计与实现
  6. 「项目管理」如何使用甘特图分解项目?
  7. 【NDN学习】NDN的定义,基础,解决什么问题
  8. Python实现GWO智能灰狼优化算法优化支持向量机回归模型(svr算法)项目实战
  9. 微信小程序设置背景图片
  10. 计算机试题九,2017年职称计算机考试Excel测验试题(九)