论文链接:https://ieeexplore.ieee.org/document/8576656
代码链接:https://github.com/mysee1989/PG-CNN

主要目的

通过注意力机制的方式解决遮挡情况下的人脸表情识别

文章主要贡献

1)提出了一种带有注意机制的卷积神经网络(ACNN)来识别有部分被遮挡的面部表情。 ACNN 可以自动感知面部的遮挡区域,并专注于信息量最大且未被遮挡的区域;在各个数据集(实验室条件下和真实环境中)取得了最优结果;
2)提出了(FED-RO)数据集,是第一个专注于真实环境下面部遮挡的数据集。

网络结构


两张图放在一起看,看得比较清晰。
1)输入图像,经过VGG16得到512x28x28的feature map(特征图1)
2)在特征图1上裁剪得到24个大小为512x6x6的patch,裁剪的依据是根据原图像上的24个点,后续介绍;
3)每个patch经过各自的PG-Unit,这些图2画得很清楚,最后得到1x64的特征,图2中红色的64是我看源码后自己加上去的;
4)特征图1继续输入到GG-Unit,这些图2画得很清楚,最后得到1x512的特征,图2中红色的512是我看源码后自己加上去的;
5)最后得到24x64+512=2048的特征,再经过2层FC然后softmax输出。

其中,
1)每个patch相当于图像的局部,经过一个attention得到这个patch的重要性(或者叫遮挡程度)。所以24个patch相当于24个图像局部的注意力,判断图像局部区域的重要性,即局部区域被遮挡的严重与否;
2)GG-Unit相当于全局的判断,所以只有一个。

patch的裁剪

网络中裁剪的24个patch是由原图像中的24个点得来的。

1)从68个人脸关键点中选取编号为19、22、23、26、39、37、44、46、28、30、49、51、53、55、59、57一共16个点;
2)为了眉毛和眼睛上增加信息点。
作者额外为每支眉毛、眼睛加上一个点对,共4个点对,如图(a)中的红色。每个点对求中心点(即2点间的中心)得到一共4个点,如图(c)。正好每个眉毛、眼睛各一个点;
3)为了在脸颊上增加信息点。
选择索引为(18, 59), (27, 57)的这4个关键点,按照括号的分组求得中点,得到2个信息点,如图(d)中的黄色框线的点;
4)还是为了增加脸颊的信息点。
选择两个嘴角的关键点(应该是49和55),分别计算得到(Xleft-16,Yleft-16)和(Xright+16,Yright-16)的2个信息点,如图(d)中的黑色框线的点;
5)最终得到16+4+2+2=24个信息点,如图(f)所示。

每个patch就是以这24个点为中心点所裁剪的。

另:
信息点错位了怎么办?即信息点检测不准确怎么办?
1)作者用[33] J. Zhang, M. Kan, S. Shan, and X. Chen, “Occlusion-free face alignment:Deep regression networks coupled with de-corrupt autoencoders,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2016, pp. 3428–3437. 的方法在一定程度上对面部遮挡具有鲁棒性;
2)即使信息点不准确,但是patch的裁剪对其也不敏感。因为是在原图大小的1/8的特征图上裁剪patch,并不是在原图上裁剪,所以原图 8 像素错位只会在相关提取的补丁上引起 1 步偏差。

实验效果

作者做了大量实验,包括消融分析。就不贴图了。

FED-RO数据集

这个数据集是作者提出来的,本博客开头的源码链接中作者提供了百度网盘下载地址。

Occlusion Aware Facial Expression RecognitionUsing CNN With Attention Mechanism阅读笔记相关推荐

  1. 《Occlusion Aware Facial Expression RecognitionUsing CNN With Attention Mechanism》论文阅读(2019TIP)

    1. 本论文提出的ACNN框架 ACNN将人脸图像作为输入,并使用VGG-16网络对图像进行编码.然后,对于pACNN,通过区域分解方案将来自最后一个卷积层(VGG16网络中的conv4_2)的特征映 ...

  2. Facial Expression Recognition by De-expression Residue Learning-论文笔记

    Facial Expression Recognition by De-expression Residue Learning,这是一篇发表在CVPR2018上面的论文,翻译过来是"基于去表 ...

  3. 《Reasoning about Entailment with Neural Attention》阅读笔记

    题目直译的话就是使用神经网络注意力机制实现蕴涵推理,文章主要讲述了如何使用LSTM和Attention做英文阅读理解,结合数据集讲就是给出一段话或者说是上下文文本1(hypothesis),然后给出一 ...

  4. CNN去马赛克代码阅读笔记

    有的博客链接是之前几周写好的草稿,最近整理的时候才发布的 CNN去马赛克论文及代码下载地址 有torch,minimal torch和caffe三种版本 关于minimal torch版所做的努力,以 ...

  5. Region Attention Networks for Pose and Occlusion Robust Facial Expression Recognition

    摘要: 遮挡和姿势变化是面部表情识别(FER)的两个主要障碍.它们可以显著改变面部外观.尽管在过去几十年中,自动FER已经取得了实质性的进展,但FER的遮挡鲁棒性和姿势不变问题受到的关注相对较少,尤其 ...

  6. On the Generality of Facial Forgery Detection论文原文翻译以及阅读笔记

    论文题目及原文地址:On the Generality of Facial Forgery Detection 2019IEEE第16届移动特设和传感器系统研讨会国际会议 摘要: 摘要-针对面部伪造检 ...

  7. Adversarial disentanglement spectrum variations and cross-modality attention networks阅读笔记

    Adversarial disentanglement spectrum variations and cross-modality attention networks for NIR-VIS fa ...

  8. REASONING ABOUT ENTAILMENT WITH NEURAL ATTENTION 论文阅读笔记

    原文链接:http://cn.arxiv.org/pdf/1509.06664 读这篇论文的目的在于另一篇阅读理解的文章使用了这其中的方法 摘要部分 问题的引入,目前自然语言处理领域对于句子的蕴含关系 ...

  9. Few-Shot Semantic Segmentation with Democratic Attention Networks阅读笔记

    摘要 DAN机制可以激活更多的目标像素点,在support和query图像间构建一个稳固的关系. 介绍 目前大部分的小样本分割方法都是基于prototype来进行.这类方法用了一个两分支的编解码结构, ...

最新文章

  1. 《C++必知必会》读书笔记2
  2. 局域共享解决——用户账户限制,可能的原因包括不允许空密码,登录时间限制...
  3. 专科学会计还是计算机应用技术好,专科毕业想要学习会计专业,我专科是学计算机应用,但是毕业后家里让我学会计这门专业,具体是该怎么办呢...
  4. 降低软件复杂性一般原则和方法
  5. java for foreach 效率_Java中LinkedList的fori和foreach效率比较
  6. 【PL/SQL】学习笔记 (1)一个简单的PL/SQL程序
  7. 【UNITY3D 游戏开发之三】NGUI HUDTEXT 的练习源码及资源
  8. python能做什么-学了Python都能做什么
  9. 常用的功率半导体器件汇总
  10. node.js 在 Express4.0 框架使用 Connect-Busboy 实现文件上传
  11. 使用 crictl 对 Kubernetes 节点进行调试
  12. 测试开发进阶——常用中间件概念——线程与线程池理解
  13. [Vue warn]: Extraneous non-props attributes (style) were passed to component but could not be 警告
  14. 关于微信授权登录的用户取消-2的问题
  15. PTA L3-008 喊山 (BFS)
  16. 安全研究 # 课题:二进制成分分析(Binary SCA)
  17. 让知识构建未来—知识图谱技术与应用 | AI TIME-33
  18. idea向github传文件
  19. 软件测试的五个目的,你知道几个?
  20. ASUS华硕天选笔记本电脑FA506IV4900显卡2060原装出厂Windows10系统恢复原厂OEM系统

热门文章

  1. ubuntu解压命令
  2. 如何优雅的在 Microsoft word中插入代码
  3. Hutool 工具类优雅非空验证
  4. 央视春晚40年来首次采用国产8K摄像机摄制
  5. MacBook Pro 恢复出厂设置
  6. 如何判断链表是否有环
  7. 2023年成人高考标准拿证流程(入学前入学后)
  8. 早餐|第十三期 · 聊聊模型部署和边缘计算
  9. RPC(远程过程调用协议)
  10. JVM命令行监控工具之jhat(Java Heap Analysis Tool)