Former-DFER: Dynamic Facial Expression Recognition Transformer

哈喽,大家好呀!本菜鸡又来读论文啦!先来个酷炫小叮当作为我们的开场!
粉红爱心泡泡有没有击中你的少女心!看到这么可爱的小叮当陪我们一起读论文,是不是感觉瞬间充满动力了呢!突然想到下次确实可以搞一个漂亮妹妹的动图,让漂亮妹妹陪我们一起读论文,不知道大家有没有什么好建议呢!
不知不觉!今天竟然是冬至了!感觉时间真的过得好快,在我们老家,冬至应该吃饺子,不过我也是突然想起来这回事,因为我早上起的太晚了,竟然睡到快11点才醒。其实,我最近有点失眠,就很害怕早上起来看到手机时间才六点或七点这样,因为这样的话,我就要接着努力去睡觉,没想到今天早上起来竟然已经快11点了,感觉像是另一种惊吓。

昨天晚上看了一部电影《伊甸湖》,后劲儿还挺大的,差不多八点看完,结果一直难受到十点多,真的太让人难受了。如果没有看过这部电影的小朋友可以去看一看,真的挺不一样的,我是第一次看这种题材,后来发现竟然还是真实故事改变,更难受了。好像还有一些同类型的电影,不过我应该要再缓缓才能接着看别的电影了。
话不多说,让我们在小叮当的陪伴下,来看今天的论文:

在现实生活中的表情序列识别存在一些挑战,比如遮挡、非额叶姿势和头部运动。如下图:


基于这些问题,作者提出dynamic facial expression recognition transformer(Former-DFER)。Transformer的自注意力机制可以学习到区域面部特征的相关性以及时间上面部特征之间的相关性,具有处理以上挑战的能力。(哦对了!这篇论文还有github代码,我也去跑了一下,可以跑出来,大家放心去试)
下面,让我们来看一下这个模型的架构图,可以看到这个模型包括两个部分(绿色和蓝色)
1、convolutional spatial transformer(CS-former)
CS-former由五个卷积块和N个空间编码器组成,旨在引导网络从空间角度学习遮挡和姿态稳健的面部特征。
2、temporal transformer(T-former)
T-former由M个时间编码器组成,旨在允许网络从时间的角度学习上下文的面部特征。

接下来我们详细来看这两个模块的细节

CS-Former

CS-former由五个卷积块和N个Spatial Encoder组成


输入:首先把视频序列分成U段,接下来从每段序列中间取V帧,最终共输入U*V帧
输入帧首先通过四个卷积块来提取特征映射图,接下来将一个通道数为C的特征映射图组在通道维度上拉成一组序列,如上图所示,加上位置嵌入后,送入编码器,自注意机制的计算如下所示:


可以将四个卷积块的作用看做是提取局部特征,Spatial Encoder用于提取全局特征,可以看到从Spatial Encoder出来之后又连上一个卷积块,该卷积块的作用相当于对特征进行提炼。

T-Former

每一帧经过CS-Former都会得到一个特征表示,一组帧经过CS-Former会得到一个序列,为了最后的分类,我们增加一个Class Token,如图所示。接下来,加上一个Temporal Positional Embedding来表示时间顺序。

Temporal Encoder的计算流程,如下所示:


整个模型就是这样,接下来就是实验部分了,放上一些实验结果图:



【菜鸡读论文】Former-DFER: Dynamic Facial Expression Recognition Transformer相关推荐

  1. 【菜鸡读论文】Face2Exp: Combating Data Biases for Facial Expression Recognition

    [菜鸡读论文]Face2Exp: Combating Data Biases for Facial Expression Recognition 最近上海开始降温了,而且常常下雨,天气开始变得好冷啊! ...

  2. 【菜鸡读论文】Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty Estimation for Facia

    Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty Estimation for Facial Expre ...

  3. 【菜鸡读论文】Research on Micro-Expression Spotting Method Based on Optical Flow Features

    Research on Micro-Expression Spotting Method Based on Optical Flow Features 哈喽,大家好,从今天开始更<菜鸡读论文&g ...

  4. 【菜鸡读论文】AU-assisted Graph Attention Convolutional Network for Micro-Expression Recognition

    [菜鸡读论文]AU-assisted Graph Attention Convolutional Network for Micro-Expression Recognition 芜湖!又到了每周分享 ...

  5. 【菜鸡读论文】Learning-based Video Motion Magnification

    Learning-based Video Motion Magnification 哈喽,大家好呀! 这周有点开心,看到了一篇很有趣的论文.最近天气好热,明明已经十一月了,最近的温度却一直在25度以上 ...

  6. 【论文阅读】面部表情识别综述(2018年)(Deep Facial Expression Recognition: A Survey)

    论文地址:https://ieeexplore.ieee.org/abstract/document/9039580 百度网盘地址:https://pan.baidu.com/s/1A8NKT_wz4 ...

  7. 表情识别综述论文《Deep Facial Expression Recognition: A Survey》中文翻译

    本篇博客为论文<Deep Facial Expression Recognition: A Survey>的中文翻译,如有翻译错误请见谅,同时希望您能为我提出改正建议,谢谢! 论文链接:h ...

  8. 论文笔记 Deep Facial Expression Recognition: A Survey深度面部表情识别调查

    论文链接:https://arxiv.org/abs/1804.08348 面部表情是人类传达其情感状态和意图的最强烈,最自然和最普遍的信号之一.下图是面部表情识别数据库和方法的进化过程,由传统的Ha ...

  9. [论文阅读] Facial Expression Recognition Using Residual Masking Network

    Facial Expression Recognition Using Residual Masking Network 论文链接:https://ieeexplore.ieee.org/docume ...

最新文章

  1. 招硕博80人 (紧缺)!博士补贴33万,硕士房补22万,事业编,安置配偶+子女入学,坐标湖北...
  2. 2017 湘潭邀请赛JSCPC GJ
  3. 使用Python制作一个简单的刷博器
  4. 【Deep Learning笔记】Optic Disc 数据集
  5. mysql数据库array_mysql数据库array
  6. 由浅入深了解Thrift(三)——Thrift server端的几种工作模式分析
  7. ByteBuffer源码分析
  8. [vue] 说说你对slot的理解有多少?slot使用场景有哪些?
  9. Struts中DownloadAction的使用
  10. 恭喜 | 黑龙江大学自然语言处理实验室获得NLPCC2019跨领域移植中文依存句法分析封闭测试第一名!...
  11. Linux O(1)调度器
  12. 骗子丛生的58正失去“神奇”魔法
  13. Python的遗传算法GA优化深度置信网络DBN超参数回归预测
  14. Android studio做中国象棋,等级1(简单单人操作)
  15. android cardview,安卓 CardView 妙用
  16. Daydream播放3D视频(视频左右分屏3D效果)
  17. rbd feature
  18. 超级签补充-IOS描述文件mobileconfig的签名认证
  19. 【RNN】基于RNN的动态系统参数辨识matlab仿真
  20. 用Python做一个游戏辅助脚本(含完整编程思路)

热门文章

  1. 如何构建无服务器 WebSockets 平台
  2. 计算机考研学长学什么,关于考研的问题,学长们请指教:)
  3. 我在网上找到了新家:99盘
  4. 小米手环7外观曝光 相比小米手环6有大升级
  5. matlab填充封闭包含区域,求指导matlab怎么填充曲线构成的封闭区域
  6. Java一瓶可乐_Java实现可乐瓶问题
  7. Manifest和Repo使用详解
  8. 红蓝对抗——蓝队手册
  9. 苹果、谷歌等大厂的AI面试题(转)
  10. ros理论与实践网盘资源