1.文章提出的背景:
DAP有许多缺点:
(1)预测属性可以,预测类别不太行
(2)不能增量学习
(3)无法利用除属性外的信息
*先科普一下什么是DAP
DAP(Direct Attribute Prediction)

DAP可以理解为一个三层模型:
第一层是原始输入层,例如一张图片,用像素的方式进行描述;
第二层是n维特征空间,每一维代表一个特征;
第三层是输出层,输出模型对输出样本的类别判断。
在第一层和第二层中间,训练n个分类器,用于对一张图片判断是否符合n维特征空间各个维度所对应的特征;
在第二层和第三层间,有一个语料知识库,用于保存n维特征空间和输出y的对应关系。


2.提出问题:有什么办法可以解决DAP模型的缺点?
3.提出方法:

(1)将图片映射到特征空间中得到θ(x)(文章在第四部分4.1中的特征提取中有写到,将128维的SIFT向量和96维的颜色向量用PCA降维成一个64维向量,然后将其用FV聚合成图像级表示,然后产生SIFT的FV和颜色的FV,然后用高斯混合模型把他们连接成65535维FV,这些FV就是映射到特征空间上的)
(2)将标签嵌入到属性空间(语义空间)得到ϕ(y)(文章在第三部分3.2的ALE中有写到,用ρ(属性与类之间的联系),ρ为0/1,还用奇异值分解(SVD)进行属性去相关性,映射过去后进行归一化,归一到{0,1}中),把一个类别映射到合适的欧几里得属性空间中。
(3)设计一个θ(x)与ϕ(y)匹配度函数F(x,y;w)(输入数据x与类别y之间的匹配度)
两种求法(1)通过一个中间矩阵W使θ(x)与ϕ(y)相乘(2)欧式距离
如果θ(x)与ϕ(y)的维数较大,还可以进行低秩分解
(4)给定一个数据x,用f(x;w)进行预测,预测函数f要从所有类别y中,找到一个类别y使得F(x, y; w)的值最大。
Zero-shot learning(不能用辅助信息):文中借鉴WSABIE算法,使目标函数变为跟SSVM很相似的结构、对于每一个样本,计算对应每个类别的得分。然后从其他所有不是正确类别的得分中找出最大的得分;逐样本累加后即得到损失函数的值,然后利用SGD等方法对参数进行更新
Few-shots learning(能用辅助信息):为了使遇到之前训练样本中不存在对应类别的数据时,能逐步利用新的训练样本来改善模型。文中借鉴WSABIE算法,使目标函数在ZSL目标函数的基础上加上欧氏距离。其中参数Φ为在一定维度随机初始化的参数。在使用SGD等方法进行参数更新的时候,为使该损失函数的值尽可能得小,显然Φ要尽可能得接近ΦA,同时也利用了训练样本中存在的部分信息。从而使得ALE模型达到可以逐步利用新的训练样本(之前的训练样本中不存在的类别)的信息来改善模型。
4.实验
(1)数据集:AWA和CUB
(2)所做实验
*训练所使用的框架:通过与RR和多类别比较,发现用排序框架好
*属性嵌入:通过与{-1,+1}和均值比较,发现用{0,1}加上l2归一化好
*ALP和DAP:发现在越详细的数据集上,ALE效果更好
*ALE和HLE:发现将属性换成其他数据源(例如Wordnet)一样能行
5.结论
解决了上面所提到的三个问题(1)用文中所提出的匹配函数解决,不像DAP用属性,ALE用类
(2)用SGD解决(3)HLE也行,说明可以用其他源
还可以应用到大量数据标签的识别
6.不足
(1)没有优化属性分类器(文中也做了实验,发现不影响可解释性)
(2)在第三部分等式(3)下面D矩阵不一定能直接跟E矩阵相乘

ALE-零学习zero-shot(Label-Embedding for Attribute-Base Classification)相关推荐

  1. 从零学习SwinTransformer

    论文信息 论文名称:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 原论文地址: https://arx ...

  2. 从零学习pytorch 第2课 Dataset类

    课程目录(在更新,喜欢加个关注点个赞呗): 从零学习pytorch 第1课 搭建一个超简单的网络 从零学习pytorch 第1.5课 训练集.验证集和测试集的作用 从零学习pytorch 第2课 Da ...

  3. 快速系统从零学习OpenCV 4路线图

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 转眼间,小白学视觉就要成立三周年了,小白一直是很感谢小伙伴们的支持 ...

  4. 【从零学习OpenCV 4】4种读取Mat类元素的的方法

    本文首发于"小白学视觉"微信公众号,欢迎关注公众号 本文作者为小白,版权归人民邮电出版社所有,禁止转载,侵权必究! 经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门 ...

  5. 【从零学习OpenCV 4】Mat类构造与赋值

    本文首发于"小白学视觉"微信公众号,欢迎关注公众号 本文作者为小白,版权归人民邮电出版社所有,禁止转载,侵权必究! 经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门 ...

  6. 【从零学习OpenCV 4】Mat类介绍

    本文首发于"小白学视觉"微信公众号,欢迎关注公众号 本文作者为小白,版权归人民邮电出版社所有,禁止转载,侵权必究! 经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门 ...

  7. 【从零学习OpenCV 4】安装过程中问题解决方案

    本文首发于"小白学视觉"微信公众号,欢迎关注公众号 本文作者为小白,版权归人民邮电出版社所有,禁止转载,侵权必究! 经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门 ...

  8. 【从零学习OpenCV 4】了解OpenCV的模块架构

    本文首发于"小白学视觉"微信公众号,欢迎关注公众号 本文作者为小白,版权归人民邮电出版社所有,禁止转载,侵权必究! 经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门 ...

  9. 【从零学习OpenCV 4】Image Watch插件的使用

    本文首发于"小白学视觉"微信公众号,欢迎关注公众号 本文作者为小白,版权归人民邮电出版社所有,禁止转载,侵权必究! 经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门 ...

  10. 【从零学习OpenCV 4】opencv_contrib扩展模块的安装

    本文首发于"小白学视觉"微信公众号,欢迎关注公众号 本文作者为小白,版权归人民邮电出版社所有,禁止转载,侵权必究! 经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门 ...

最新文章

  1. 实对称矩阵的性质_浅谈矩阵的相似对角化(一)
  2. 基于复杂方案OWSAP CsrfGuard的CSRF安全解决方案(适配nginx + DWR)
  3. 比赛-模拟赛 (17 Aug, 2018) (待施工)
  4. 一石二鸟:推荐系统多目标任务建模方法
  5. HTTP1.1/2.0与QUIC协议
  6. 用原生 JS 实现双向绑定及应用实例
  7. shell脚本发邮件内容html,Shell发送邮件以HTML展示
  8. MyCat分布式数据库集群架构工作笔记0016---高可用_单表存储千万级_海量存储_垂直分库划分原则
  9. webservice发请求没有不成功也不返回什么异常_RPC是什么,看完你就知道了
  10. 对于防止按钮重复点击的尝试
  11. 三相并联功率因数校正matlab,基于并联技术的三相功率因数校正方法研究
  12. 【人工智能】王飞跃教授讲述可解释的神经元网络发展历程
  13. 如何创建NEO轻客户端
  14. node的HTPP请求
  15. php的坑,PHP中的这容易被踩的坑,新人必看
  16. VMware workstation安装虚拟机--Windows XP
  17. 你了解HTTP2协议吗?(二)
  18. 消失的“金九银十” 互联网的下一个五年在哪里?
  19. Packet Tracer相关命令
  20. 移动echarts地图省份名称的位置

热门文章

  1. c语言随机数猜字,玩猜字游戏顺便理解c语言的伪随机数(rand,srand)
  2. C++ 结构体定义和使用
  3. 第一次作业——了解编译原理
  4. 极光推送 JPush 简介 集成
  5. cpri带宽不足的解决方法_一些常见网络问题的解决方法
  6. 【精华】批量修改文件夹中的文件名
  7. 应届毕业生简历内包含那些内容
  8. 小程序与api 的链接
  9. mysql 进阶_mysql进阶 - 随笔分类 - 云潇洒 - 博客园
  10. mybatis字符串拼接