本文介绍一篇于计算机领域顶级会议ACM MM 2020发表的论文《SST-EmotionNet: Spatial-Spectral-Temporal based Attention 3D Dense Network for EEG Emotion Recognition》,该研究提出了一种基于注意力机制的3D DenseNet对多媒体刺激产生的情感脑电信号进行分类,该模型在统一的框架下同时提取数据中的空间、频率、时间特征;并且设计了一种3D注意机制来自适应地探索具有判别力的局部模式提升情绪分类效果,在现有的多个数据集上分类表现均为最优。该文提出的模型是一个多变量脑电信号的通用框架,可以被拓展到其余信号分类任务中。

第一作者:

贾子钰,北京交通大学计算机与信息技术学院博士生,指导老师是林友芳教授和王晶副教授;计划于2021年在麻省理工学院进行博士联合培养,指导老师是Roger Mark教授(IEEE Fellow);主要研究兴趣集中于生理信号的分析与挖掘、深度学习理论与方法研究;目前已于IJCAI、ACM MM、ICDM、ECML-PKDD等会议或期刊发表论文8篇。

论文链接:

https://dl.acm.org/doi/abs/10.1145/3394171.3413724

论文代码链接:

https://github.com/ziyujia/SST-EmotionNet

1. 背景简介

情绪会影响人类的行为,且在日常生活中发挥着重要作用。许多精神疾病与情绪有关,例如自闭症和抑郁症。因此,情绪常被用作评估患者精神障碍的参考。越来越多的研究人员专注于针对特定刺激模式引起的不同情绪的脑电图分析。研究主要集中在使用多媒体材料(包括图像,声音,文本等)设计实验来刺激大脑并暴露其认知活动以进行情感分类。

2. 动机

2.1 挑战

2.1.1 挖掘脑电信号时-频-空特征的互补性。

现存的脑电情绪模型大多仅单独使用了脑电信号的时域、频域、空域信息或是以上两种特征的组合。这些模型忽略了脑电信号时-频-空特征之间的互补性,会在一定程度上限制脑电分类模型的性能表现。如何利用脑电信号中时-频-空特征之间的互补性,这是一个挑战。

2.1.2 捕获时-频-空特征之间的局部特征。

脑电信号的局部时-频-空特征中会存在一些反映大脑情绪的局部特征。如图中的红框所示,受试者处于积极情绪时,大脑颞叶在频段下的激活程度会比消极时更高。这些局部特征的存在有助于情绪的识别。因此,如何捕获情绪识别任务中脑电信号的局部时-频-空特征是另一个挑战。

2.2 贡献

  1. 基于构建的脑电的时-频-空特征,我们提出了一种双流3D密集连接网络,在统一的网络框架下融合了脑电信号的时-频-空特征。

  2. 我们设计了一种并行的时-频-空注意力机制,用于动态捕获在不同脑区、频段、时间之间的局部判别特征。

  3. 在基准数据集的实验结果表明,提出的SST-EmotionNet优于传统的基线方法,取得了SOTA的性能。

3. 数据表示与问题定义

脑电信号的3D表示的过程如图。具体而言,在本研究中,定义 为长为个时间点的个EEG电极的数据。其中,为在时间点时所有电极的数据。利用各个电极的空间位置信息,我们 将变换成2D时间平面图, 和 分别为2D平面图的高与宽。将所有时间点下形成的个2D平面图堆叠起来,我们能够得到信号的3D时空表示。

我们定义为包含了个频段的EEG信号的频域特征。其中, 为在频段下的所有电极的数据。与时域同理,会被变换成2D频域平面图。将所有频段下形成的个2D平面图堆叠起来,我们能够得到信号的3D频空表示 。此处,我们使用5了个频段的EEG频域特征,即。

EEG情绪识别问题被定义如下,模型需要学习一个映射函数,将输入映射到对应的情绪标签:

此处表示映射函数, 表示情绪的分类标签。

4. Spatial-Spectral-Temporal based Attention 3D Dense Network

SST-EmotionNet的总体架构如图所示。我们总结了本文模型的四大关键点:

  1. 基于构建的脑电3D时-频-空特征,在一个统一的网络框架下融合了脑电信号的时-频-空特征。

  2. 提出了一种并行的空-频/时注意力机制,用于动态捕获在不同脑区、频段、时间中的局部判别特征。

  3. 设计了3D密集连接模块和过渡层帮助特征重用,加强特征传播过程,以达到更高的模型效率。

  4. 使用伪3D模块提高3D卷积的内存效率与计算效率。

4.1 空-频/时注意力机制

脑电信号在不同情绪状态下的时-频-空特征激活中且存在一些有判别力的局部特征。我们设计了一种空-频/时注意力机制(SST-Attention)用于动态捕获这些有价值的局部特征。SST-Attention由两个子组件构成:空间注意力机制与频段/时间注意力机制。

由于空-频注意力机制与空-时注意力机制在结构上较为相似,此处我们将以空-频注意力机制为例进行展示。空-频注意力机制组件的结构如图所示。首先,跨通道的全局池化(channel-wise global average pooling, cGAP)被用于减少计算成本,它被定义如下:

其中, 在通道维度上退化可得到;表示cGAP函数;表示在张量的处的跨通道数据向量。

4.1.1 空间注意力机制

空间注意力机制用于动态关注空间上对情绪识别任务有价值的大脑区域。最开始,跨频段全局池化(band-wise global average pooling, bGAP)将用于退化频段维度,其过程定义如下:

其中表示频域特征在空间上的分布情况,它由退化频段维度得到;表示bGAP函数; 表示一个在张量的处的一个包含着跨频段数据的向量。

随后,空间注意力矩阵将由一个带有激活的全连接层得到:

其中 和为可学习的参数; 为归一化后的2D空间注意力矩阵。

4.1.2 频/时注意力机制

为了动态捕获不同频带、时间点中对情绪识别有辨识度的特征,我们设计了频/时注意力。以频域注意力机制为例,我们首先对输入的张量作空间全局池化(spatial-wise global average pooling, sGAP)用于退化空间维度,其过程定义如下:

其中,表示频域特征在不同频带上的分布情况,它由退化空间维度得到;表示sGAP函数;表示上第个频带上对应的平面。

而后,频域注意力矩阵将由一个带有激活的全连接层得到:

其中 和为可学习参数;为归一化后的频域注意力矩阵。

在得到了空间注意力矩阵与频域注意力矩阵以后,频-空注意力机制被定义如下:

其中代表逐元素相乘操作。在乘积操作过程中,频域注意力与空间注意力的数值将会分别沿着空间维度与频域维度被广播。为空-频/时注意力机制的输出张量。

4.2 3D密集连接模块

为了加强特征传播、达到更好的参数效率,受到2D DenseNet的启发,我们设计了一种3D密集连接模块(3D Densely Connected Module, 3DCM)。每个3DCM由若干个密集连接的伪3D卷积组成。频-空流中的3DCM结构如图所示。

密集连接:3DCM中采用了密集连接机制。对于该模块内的第层,它将前序的所有层的特征图作为输入:

其中表示进行拼接; 表示每层内进行的伪3D卷积。

**伪3D卷积:**传统的3D卷积核为,其中为卷积核在空间维度的边长、为频/空维度的长度,而传统3D卷积的计算开销较大。为了减少计算开销,伪3D卷积将传统的的3D卷积核分解为了等价于空域上2D卷积的卷积核的与时/频域上的1D卷积的卷积核。为了加快计算速度,我们在3DCM中使用伪3D卷积代替了传统的3D卷积操作。这样一来,前面的可被定义为:

其中表示伪3D卷积模块的输入;表示捕获空间特征的2D卷积;表示捕获频域或时域EEG特征的1D卷积。

4.3 过渡层

为了提高模型的紧凑性,我们采用了DenseNet的一个重要组成部分——过渡层。过渡层通过减少特征图的数量使模型变得紧凑。过渡层由一个Batch Normalization层、一个的卷积层、一个的平均池化层构成。的卷积层被用于减少特征图的数量,平均池化层用来减小特征图的大小。若一个3DCM包含个特征图,则跟随它的过渡层将会输出个特征图,其中 被称为压缩率。

4.4 融合分类层

SST-EmotionNet从频空流中提取脑电信号的频空特征,并从时空流中提取脑电信号的时空特征。频空流和时空流的输出被融合层所融合,从而进行高精度分类。融合层由连接层和具有激活的完全连接层组成。

5. 实验

5.1 数据集

我们在SEED(SJTU Emotion EEG Dataset)与SEED-IV数据集上评估了我们提出的模型。SEED数据集包含来自15名受试者在3个时间段内观看的15个能够诱发3种情绪电影片段的EEG记录;SEED-IV数据集则包含来自15名受试者在3个时间段内观看的15个能够诱发4种情绪电影片段的EEG记录。EEG信号在5个频带下的差分熵特征(differential entropy, DE)被提取作为输入的频域特征。

5.2 结果

我们与8种Baseline方法进行了比较,结果如表2所示:

SST-EmotionNet在两个数据集上均取得了优于所有基线方法的性能。我们推测模型分类性能提升原因有以下几点:

  1. 不同于现有的方法,SST-EmotionNet同时捕获脑电信号的空间、频率、时间特征,并利用了各种特征之间的互补性进行情绪分类。

  2. 空-频/时注意力机制的引入使模型更专注于对情绪识别有辨识力的时-频-空局部模式的识别,提升了分类表现。

5.3 消融实验

为了进一步验证我们模型各个组件的有效性,我们设计了一系列消融实验。

双流消融:我们首先将双流的模型结构消融成了单流的模型结构,实验结果如图所示:

在使用双流模型的情况下,模型的准确率能够比单独使用时-空、频-空流的模型分别高出9.48%与3.51%。该结果表明利用不同特征之间的互补性能够有效提高分类准确率。

注意力机制消融:我们对SST-Attention的两个子组件分别进行了消融,实验结果如图所示:

在消融各个注意力机制时,各类评价指标均有下降。如仅使用时/频注意力机制的模型比原模型的分类准确率下降了1.94%,仅使用空间注意力机制的模型则下降了3.30%。该实验结果表明了SST-Attention模块能够捕获有价值的局部特征从而提高模型的分类性能。

6. 结论

本文提出了一种脑电情绪识别模型SST-EmotionNet,该模型使用双流的结构同时捕获脑电信号具有互补性的空间、频率、时间三类特征;同时,设计了一种空-频/时注意力机制,使该模型能够动态关注一些对情绪识别任务较有辨识度的时-频-空局部模式。在公开的脑电情绪识别数据集SEED与SEED-IV上的实验表明,该模型有着出色的性能优于传统的基线方法。此外,该文提出的模型是一个多变量生理时间序列的通用框架,未来可以应用于睡眠分期、疲劳驾驶监测等相关领域中。

论文信息:

Jia Z, Lin Y, Cai X, et al. SST-EmotionNet: Spatial-spectral-temporal based attention 3D dense network for EEG emotion recognition[C]//Proceedings of the 28th ACM International Conference on Multimedia. 2020: 2909-2917.

https://ziyujia.github.io/Chinese-Reading-Materials/Materials/SST-EmotionNet/SST-EmotionNet.html

不用于商业行为,转载请联系后台

若有侵权,请后台留言,管理员即时删侵!

更多阅读

一种基于EEG和sEMG的假手控制策略

通过超声波来远程控制大脑区域的选择行为

挑战马斯克的Neuralink,另一家神秘的「脑机接口」公司已获投资

脑机接口:未来生命科学和信息技术交叉融合的主战场

EEG Feature Extraction

手把手教你EEG脑电数据预处理-操作篇

Python-可视化Evoked数据

快速入门脑机接口:BCI基础(一)

你的每一次在看,我都很在意!

ACM MM 2020:一种基于情感脑电信号时-频-空特征的3D密集连接网络相关推荐

  1. ACM MM:一种基于情感脑电信号时-频-空特征的3D密集连接网络

    本文介绍一篇于计算机领域顶级会议ACM MM 2020发表的论文<SST-EmotionNet: Spatial-Spectral-Temporal based Attention 3D Den ...

  2. 基于情感脑电信号时-频-空特征的3D密集连接网络

    ©PaperWeekly 原创 · 作者|蔡晞阳 学校|北京交通大学 研究方向|时间序列分析与挖掘 ‍ ‍ 本文介绍一篇北京交通大学网络科学与智能系统研究所于计算机领域顶级会议 ACM MM 2020 ...

  3. ACM MM 2020视频目标检测挑战赛冠军DeepBlueAI团队技术分享

    ©PaperWeekly 原创 · 作者|罗志鹏 单位|深兰北京AI研发中心 研究方向|物体检测 ACM MM(ACM International Conference on Multimedia, ...

  4. ACM MM 2020大奖项出炉!南开获最佳论文奖,西安交大获最佳学生论文奖

    本文转载自AI科技评论. 作者 | 陈大鑫 刚刚!第28届ACM国际多媒体会议(ACM MM)最佳论文奖.最佳学生论文奖.最佳demo奖. 最佳开源软件奖在内的所有多媒体领域大奖都已出炉. 其中最佳论 ...

  5. 多媒体领域顶会--ACM MM 2020 会议论文打包下载

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 ACM International Conference on Multimedia (ACM ...

  6. 多媒体领域顶会,ACM MM 2020 会议论文下载

    ACM International Conference on Multimedia (ACM MM) 是多媒体领域顶会,研究内容覆盖图像.视频.音频.人机交互.社交媒体等,今年的ACM MM 202 ...

  7. 【脑电信号分类】脑电信号提取PSD功率谱密度特征

    本文是由CSDN用户[frostime]授权分享.主要介绍了脑电信号提取PSD功率谱密度特征,包括:功率谱密度理论基础.matlab中PSD函数的使用介绍以及实验示例.感谢 frostime! 1. ...

  8. tensorflow提取mel谱特征_【脑电信号分类】脑电信号提取PSD功率谱密度特征

    点击上面"脑机接口社区"关注我们 更多技术干货第一时间送达 本文是由CSDN用户[frostime]授权分享.主要介绍了脑电信号提取PSD功率谱密度特征,包括:功率谱密度理论基础. ...

  9. NeurIPS 2020 | 一种基于动作采样的简单高效的正则化强化学习方法

    编者按:现有的强化学习方法通常通过熵正则化的方式控制最优策略的随机性,以保证训练过程中的良好探索以及目标策略的鲁棒性.然而,熵正则化的强化学习方法通常会面临表达能力有限的策略结构和复杂低效的训练过程之 ...

最新文章

  1. python3 PIL、opencv, 二进制、base64 四种图片格式转换
  2. 一文了解web无状态会话token技术JWT
  3. python nlp_使用python在stanford-nlp中的回指解析
  4. LeetCode-----旋转数组的最小数字
  5. DataTable 数字排序问题
  6. python接口自动化(四十三)-公共模块 pymysql 连接mysql数据库(单独说明)
  7. mysql 向量写法_mysql – 你如何在Ruby中处理一个非常大的向量?
  8. ace treeview.php,改造 Ace Admin 模板的 ace_tree 组件的 folderSelect 样式
  9. cad一键卸载工具叫什么_CAD专用卸载修复工具,一键完全彻底卸载删除CAD软件的专用卸载工具...
  10. 数据统计获取一年 有多少个自然周,起止时间,当前是第几个周
  11. 设置图例legend分行显示
  12. PS压缩1寸照片大小降低到50KB以下的方法
  13. AR可视化远程协助,医护诊疗,对讲指挥调度系统方案
  14. 一道积分不等式的最优估计探索
  15. HDU 百度之星(测试赛) - 1002 列变位法解密
  16. 实习 | 深圳市彼岸心智科技有限公司招募新成员啦
  17. Codeforces Round #617 (Div. 3)
  18. 移动web前端开发总结
  19. EventLoop 事件循环
  20. 【转载】不出国如何练就一口流利的英语?

热门文章

  1. 【Spark篇】---Spark解决数据倾斜问题
  2. input中v-model和value不能同时调用时解决方案
  3. 为什么CSS使用假元素?
  4. Hibernate hbm2ddl.auto配置的可能值是什么,它们做了什么
  5. 如何找到调用当前方法的方法?
  6. flask常见面试题
  7. Docker多台宿主机间的容器互联-centos7
  8. CentOS 5升级Python版本(2.42.7)
  9. rpm出现error: %preun( ) scriptlet failed, exit status 1问题
  10. Android 关于Handler