3D卷积(w x h x d)=空间卷积(图片w x h)+时间卷积(相邻d帧)
原文链接:https://arxiv.org/pdf/1904.01390v1.pdf

解决问题:

传统方法:
传统的基于手工特征的微表情分析方法包括时空局部二值模式(LBP)、LBP-TOP 、定向平均光流特征 等。然而,这些方法的主要缺点是从视频提取的大多是表面信息,缺乏抽象特征表示的信息。

从文献综述中,我们可以观察到,手工设计的特征在鲁棒性和准确性方面都有局限性。

深度学习方法:
这些方法通常使用CNN来提取每一帧的空间特征,并馈送给RNN来编码表达视频中各帧之间的时间相关性。因此,这些方法不能同时编码视频特征之间的时空关系。为了克服现有技术的局限性,我们提出了两种三维CNN模型(MicroExpSTCNN和MicroExpFuseNet网络),通过在视频上应用三维卷积操作同时提取时空信息。

人们已经努力使用两步深度学习架构对微表情进行分类。在这种典型的两步模型中,第一步使用卷积神经网络(CNNs)在微表情视频的每一帧上提取空间特征。在第二个步骤中,将空间特征以相同的顺序输入一个基于长短期记忆(LSTM)的递归神经网络(RNN),以学习帧之间的时间相关性。这些方法无法更准确地学习时空关系。

如Satya等人,分别使用双流CNN来学习空间和时间特征。将空间和时间特征连接起来,得到最终的单一特征向量,用于SVM分类器的分类。Peng等人使用从每一帧获得的光流序列作为三维CNN架构的输入,对微表情进行分类。三维CNN在微表达识别方面的使用仍然很有限,并且使用了光流等额外的信息。

主要方法:

提出两个3维时空CNN:利用三维卷积核进行卷积运算,利用三维卷积层提取时空特征。与2D-CNN只在空间方向上使用卷积相比,3D-CNN也在时间方向上使用卷积三维池化层在保留重要特征的同时,逐步降低了三维卷积层的维度输出,三维池化层在一个小的时空窗口中选择最佳的特征表示。MicroExpSTCNN和MicroExpFuseNet模型的输入尺寸分别为64 x 64 x 96和32 x 32 x 96。

MicroExpSTCNN模型中的全脸区域来识别微表情,发现嘴区域和其他一些区域,如面颊可以描述识别的关键线索。
MicroExpSTCNN模型的输入维数为w x h x d,其中w和h固定为64,d的值依赖于所使用的数据集。MicroExpSTCNN模型由3D卷积层、3D池化层、全连接层、激活函数和退出层组成。

MicroExpFuseNet网模型将眼睛和嘴巴两个区域被用作两个独立的3D时空CNN的输入,最后被融合成一个单一的网络。(DLib人脸检测器裁剪眼睛和嘴巴的区域)

基于不同的融合策略(在不同的阶段融合):中期MicroExpFuseNet晚期MicroExpFuseNet.

中期MicroExpFuseNet

来自两个网络的扁平特征被连接起来形成一个新的向量,融合的特征在分类得分生成之前,再次用Dense层(全连接层)和Dropout层进行处理。


晚期MicroExpFuseNet

特征在最后一个Dense全连接层上融合在一起

在CAS(ME)b2数据集上,中间融合比晚期融合更适合于中间融合。然而,后期融合更适合于SMIC数据集。

创新点:

1>提出了一个能同时提取视频里的表情 spatial and temporal features来进行分类的MicroExpSTCNN模型。用这个模型达到了最好的表现。
2>提出了一个两分支的MicroExpFuseNet model提取眼睛和嘴巴区域的特征。
3>在3D-CNNs的基础上,在中间和后期混合了嘴巴和眼睛的特征进行实验
4>用salience maps来进行不同脸部特征的影响分析
5>使用了不同大小的3D卷积核来进行实验

效果:

实验在CAS(ME)b2和SMIC微表达数据库上进行。所提出的MicroExpSTCNN模型的性能优于最先进的方法。

实验数据集:(将几个数据集进行28划分,然后合并,得到一个训练集一个验证集)

分类交叉熵损失函数和SGD优化,epochs=100,batch_size = 8.

3D卷积核大小影响

最优的三维内核大小为3 x 3 x 15。结果表明,空间范围小(3x3)、时间范围大(15帧)的卷积核更适合。我们还可以看到,更深的内核(15帧)与更小的过滤器(3x3)一起工作得更好。

MicroExpSTCNN and MicroExpFuseNet-基于三维时空卷积神经网络的自发面部微表情识别相关推荐

  1. 基于三维时空卷积网络的自监督点云预测(CoRL2021)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨泡泡机器人SLAM 作者丨泡泡机器人 标题:Self-supervised Point Clou ...

  2. 基于tensorflow和卷积神经网络的电影推荐系统的实现

    基于tensorflow和卷积神经网络的电影推荐系统的实现 一. 数据处理 1. MovieLens数据集 2. 处理后的数据 二. 建模&训练 1. 嵌入层 2. 文本卷积层 3. 全连接层 ...

  3. 【城市污水处理过程中典型异常工况智能识别】(基于迁移学习,拓扑结构卷积神经网络的污水异常工况识别)

    基于迁移学习拓扑结构卷积神经网络的污水异常工况识别 **摘 要:针对城市污水处理过程的异常工况识别问题,本文提出了基于图像纹理性分析的工况识别方法.首先总结了几种典型的异常工况的特点,并且分析了卷积神 ...

  4. 【深度学习】基于Pytorch的卷积神经网络概念解析和API妙用(一)

    [深度学习]基于Pytorch的卷积神经网络API妙用(一) 文章目录 1 不变性 2 卷积的数学分析 3 通道 4 互相关运算 5 图像中目标的边缘检测 6 基于Pytorch的卷积核 7 特征映射 ...

  5. 【深度学习】基于Pytorch的卷积神经网络概念解析和API妙用(二)

    [深度学习]基于Pytorch的卷积神经网络API妙用(二) 文章目录1 Padding和Stride 2 多输入多输出Channel 3 1*1 Conv(笔者在看教程时,理解为降维和升维) 4 池 ...

  6. 基于Python的卷积神经网络和特征提取

     基于Python的卷积神经网络和特征提取 发表于2015-08-27 21:39| 4577次阅读| 来源blog.christianperone.com/| 13 条评论| 作者Christi ...

  7. CV之CNN:基于tensorflow框架采用CNN(改进的AlexNet,训练/评估/推理)卷积神经网络算法实现猫狗图像分类识别

    CV之CNN:基于tensorflow框架采用CNN(改进的AlexNet,训练/评估/推理)卷积神经网络算法实现猫狗图像分类识别 目录 基于tensorflow框架采用CNN(改进的AlexNet, ...

  8. 基于Keras的卷积神经网络(CNN)可视化

    基于Keras的卷积神经网络(CNN)可视化 标签(空格分隔): 深度学习 卷积神经网络可视化 本文整理自Deep Learning with Python,书本上完整的代码在 这里的5.4节,并陪有 ...

  9. 论文浅尝 | 基于注意力图卷积神经网络的依存驱动关系抽取

    笔记整理:王大壮 论文链接:https://aclanthology.org/2021.acl-long.344.pdf 动机 句法信息,特别是依存树,已经被广泛应用于关系提取,以更好地分析与给定实体 ...

  10. (论文阅读)基于融合深度卷积神经网络的人脸识别方法研究-褚玉晓

    一.基于融合深度卷积神经网络人脸识别方法设计 1.PCA算法提取人脸特征 主要成分分析法(Principal Component Analysis,PCA) 第一步,计算人脸图像的平均值并执行归一化的 ...

最新文章

  1. [快速技巧]通过命令在 Debian/Ubuntu 中设置默认浏览器
  2. css 控制li点与文字的距离
  3. LeetCode—209. 长度最小的子数组
  4. P3356 火星探险问题(网络流)
  5. linux安装meld rpm,Linux meld安装
  6. java 保留html_好程序员Java培训分享Java包是什么?
  7. 光机学院计算机系,计算机系召开第十二届科技节闭幕式
  8. android传感器_Android传感器
  9. Android核心分析 之二方法论探讨之概念空间篇
  10. 前缀、中缀、后缀表达式以及逆波兰计算器
  11. Linux进程的管理与调度(一)--- Linux进程描述符task_struct结构体详解
  12. QI精小无线充电接收模块(带线圈)可以输出5V,4.2V,QI协议,22MM圆形,500MA电流拿了即可使用
  13. 安装magicdrawUML出现的问题
  14. c语言程序设计计划书示例,C语言学习计划书
  15. 缓存算法篇其一-----FIFO(先入先出)
  16. 201621123068 Week03-面向对象入门
  17. Solr与MongoDB集成,实时增量索引[转]
  18. 公交IC卡刷卡数据分析
  19. JavaSwing_3.5: JLayeredPane(层级面板)
  20. win7语言栏或输入法图标不见了

热门文章

  1. [渝粤教育] 中国地质大学(武汉) 走近国粹 中国陶瓷 参考 资料
  2. 彻底清除计算机病毒的方式是,彻底清除电脑病毒的小方法
  3. 123456789中间任意加+或-结果等于100
  4. 《区块链编程》第七章
  5. 《亡灵序曲》各版本收集
  6. 回文数,回文字符串的判断
  7. python 灰度图像_Python灰度图像到3个通道
  8. 手机连接电脑后,QT的QDIR怎么读取手机文件路径
  9. 如何让单片机I/O口上电复位时为低电平
  10. 怎样用c语言实现CPU超频,【七彩虹Z170评测】装机不求人25 教你一分钟学会CPU超频(全文)_七彩虹 战斧C.Z170-D3旗舰版 V20_DIY攒机装机不求人-中关村在线...