基于深度学习的脑电图识别 综述篇(二)数据采样及处理
作者|Memory逆光
本文由作者授权分享
导读
脑电图(EEG)是一个复杂的信号,一个医生可能需要几年的训练并利用先进的信号处理和特征提取方法,才能正确解释其含义。而如今机器学习和深度学习的发展,大量的研究和应用表明它们在从原始数据提取特征并分类方面有很大的潜力。因此这篇综述回顾了从 2010 年到 2018 年的 156 篇将 DL(Deep Learning,深度学习)应用在 EEG 的文章,这些论文涵盖了不同的应用领域,如枕测、睡眠、脑机接口、认知和情感监测,并从大量的文献中提取趋势并突出有趣的方法,以便为未来的研究提供信息并制定建议。
这篇综述将分析每个项目:1)数据、2)预处理方法、3)DL设计选择、4)结果和5)实验重现性;
之前分享了综述的总体概述《基于深度学习的脑电图识别 综述(一)总体概述》,这篇主要分享数据采样、数据扩充、数据处理(预处理、人工处理)、特征提取等进行了解说和汇总。
文章选取和分布
本文选取了 2010 到 2018 年间相关的论文,对于每一篇被选择的文章,大约70个数据项被提取出来,包括 5 个类别:文章的来源,基本原理,使用的数据,脑电图处理方法,深度学习方法和报告的结果;
下图为为所选的每个项目提取数据项
最终作者选取了 156 篇论文,选取过程如下:
第一作者的国籍分布(所以中国还是很猛的):
大多数研究(86%)集中于使用深度学习对脑电图数据进行分类,最显著的是用于睡眠分期、癫痫发作检测和预测、脑机接口(BCIs)以及认知和情感监测;
大约 9% 的研究集中在处理工具的改进上,比如从脑电图中学习特征,处理工件,或者可视化训练过的模型;
其余的论文(5%)探讨了从脑电图中产生数据的方法,如增加数据或以脑电图为条件生成图像;
研究重点分布如下,其中每个类别的论文数量在括号中显示,涉及一个以上主题的研究按其主要关注点进行分类:
增长趋势为:
数据量:
上图左栏显示了每项研究(包括训练、验证和测试集)中使用的脑电图数据量(以分钟为单位);
注意,这里报告的时间不一定对应于实验的总记录时间,研究的总记录时间的均值为 62,602,中位数为 360;
中间栏是每项研究的样本数,根据滑窗大小和重叠度不同,这个值有很大的差异,均值为 251,532, 中位数为 14,000;
右栏是每项研究脑电图数据时长跟样本数的比值;
实际观察主题数:
超过一半的研究主题数都在 13 以下;
采样参数:
采样的设备统计如下:
采样时的通道数(即电极数)统计如下:
从理论上讲,通道数越多,空间分辨率越高,但是较多的采样电极会造成患者的不适,并且增加采样成本,而且邻近的电极差异不是很大;
研究发现,通道数从 4 提高到 22 有很好的提升效果,其中敏感度从 31% 提高到了 39%,特异性从 40% 提高到了 90%;
采样频率大部分集中在 100 Hz 到 1000 Hz 间,其中 50% 使用了 250 Hz 或者更小的频率;
数据扩充
如果处理得当,数据扩充可以提高准确性和稳定性,从而更好地泛化新数据;
156 篇论文中有 3 篇分别从睡眠,情感监测和脑机接口三个方向,明确论述了 DL-EEG 中的数据扩充;
使用随机高斯噪声,在 SEED 和 MAHNOB-HCI 数据集上,LeNet 和 ResNet 的准确率都有了很大的提升;其最佳精度为使用 0.2 的标准偏差,并通将数据增加到原始大小的30倍;
利用条件深卷积生成对抗网((cDCGAN)在 BCI 图像数据集上生成人工脑电图信号,可以发现数据扩充有助于将运动图像分类的准确率从 83% 提高到 86% 左右;
通过在 CAPSLPDB 数据集上生成原始脑电图数据的傅里叶变换(FT)来明确针对代表性不足的睡眠阶段的类不平衡问题;
其他的论文中采用的数据扩充方法有:
向 2D 的特征图中增加随机噪声;
使用眨眼、肌肉活动以及高斯白噪声等伪影被用来增强数据并提高鲁棒性;
向输入的特征向量中加入高斯噪声;
使用重叠窗口,即通过生成更多的具有较小移位的训练样本,性能有了显著提高;
cropped training,即不规则训练,保证每个窗口只训练一次;
加大共享信息窗口分类不一致时的惩罚项;
交换左右电极;
复制样本并只保留一种模态的值,同时将另一种模态的值设置为0,反之亦然;
利用在预处理阶段向下采样脑电图时经常丢弃的数据,即在下采样参数为 N NN 时允许数据扩充 N NN 倍;
为每个类别单独训练 GAN 生成新数据;
数据处理
统计数据如下(N/M 是在研究中未提及):
预处理:
通常的预处理方式有:下采样、带通滤波和滑窗;
有的研究提出,需要对脑电图试验进行修剪,将数据采样到 512 Hz 和 64 个电极,识别噪声通道,计算平均参考线,去除线噪声,并对从 1 Hz 开始的数据进行高通滤波;
有的关于睡眠的研究则下采样到 256 Hz 并移除噪声通道,从 2 Hz 开始进行滤波;
人工处理:
人工处理用于移除特定的噪声,比如眼部和肌肉的伪影,从而学习的负担从潜在的噪声信号转移到神经网络上;
有些研究采用了基于人类知识的方法,如振幅阈值化、人工识别高方差段、基于高振幅 EOG 段处理与眨眼相关的噪声等;
许多其他文章支持不太依赖人工干预的技术,比如盲源分离技术,例如,ICA(独立成分分析)被用来从脑电图数据中分离眼部成分;
为了研究在使用深度神经网络时去除脑电伪迹的必要性,本文将选取的论文分为三类,特征工程是传统脑电信号处理管道中要求最严格的步骤之一46% 的论文没有使用伪迹处理方法,24% 的论文使用了这种方法,31% 的研究没有提及是否需要人工处理来达到他们的结果;
特征提取
特征工程是传统脑电信号处理系统中要求最严格的步骤之一;
虽然一些研究表明,使用深度信念网络(DBNs)可以接受原始数据输入,但是也有相当比例的评论论文使用人工设计的特征作为其深度神经网络的输入;
例如,可以使用通过快速傅里叶变换(STFT)获得的脑电图的时频域表示来检测二进制用户偏好(喜欢与不喜欢);也有研究使用 STFT 作为二维 EEG 表示,用于在 CNN 中使用癫痫 预测;
脑电图学界广泛采用的特征是约1 Hz~40 Hz的经典频带的功率谱密度(PSD);
还有一些研究采用了多种特征的组合,如使用PSD特征,以及熵、峰度、分形分量等作为提出的 CNN 输入,用于缺血性脑卒中检测;
尽管如此,仍有 49% 研究使用了 EEG 的原始数据作为输入;
作者博客
https://blog.csdn.net/weixin_44936889/article/details/104686542
文章来源于网络,仅用于学术交流,不用于商业行为
若有侵权及疑问,请后台留言,管理员即时删侵!
更多阅读
EEG伪影类型详解和过滤工具的汇总(一)
脑机融合系统综述
清华张钹院士专刊文章:迈向第三代人工智能(全文收录)
脑机接口拼写器是否真的安全?华中科技大学研究团队对此做了相关研究
脑机接口和卷积神经网络的初学指南(一)
脑电数据处理分析教程汇总(eeglab, mne-python)
P300脑机接口及数据集处理
快速入门脑机接口:BCI基础(一)
如何快速找到脑机接口社区的历史文章?
脑机接口BCI学习交流QQ群:515148456
微信群请扫码添加,Rose拉你进群
(请务必填写备注,eg. 姓名+单位+专业/领域/行业)
长按关注我们
基于深度学习的脑电图识别 综述篇(二)数据采样及处理相关推荐
- 基于深度学习的脑电图识别 综述篇(三)模型分析
作者|Memory逆光 本文由作者授权分享 导读 脑电图(EEG)是一个复杂的信号,一个医生可能需要几年的训练并利用先进的信号处理和特征提取方法,才能正确解释其含义.而如今机器学习和深度学习的发展,大 ...
- 基于深度学习的脑电图识别 综述(一)总体概述
作者|Memory逆光 本文由作者授权分享 本文主要介绍了深度学习在EEG分析上的应用<Deep learning-based electroencephalography analysis: ...
- 基于深度学习的人脸识别综述
本文转载自 https://xraft.github.io/2018/03/21/FaceRecognition/ (作者:Caleb Ge (葛政)),如有侵权请告知删除. (下文中的"我 ...
- 【基于深度学习的脑电图识别】综述篇(二)数据采样及处理:Deep learning-based electroencephalography analysis: a systematic review
Deep learning-based electroencephalography analysis: a systematic review 文章选取和分布: 数据量: 实际观察主题数: 采样参数 ...
- 【基于深度学习的脑电图识别】数据集篇:脑电信号自动判读的大数据
本文是由CSDN用户[Memory逆光]授权分享.主要介绍了<THE TUH EEG CORPUS: A Big Data Resource for Automated EEG Interpre ...
- 【基于深度学习的脑电图识别】应用篇:DEEP LEARNING APPROACHES FOR AUTOMATIC ANALYSIS OF EEGS
DEEP LEARNING APPROACHES FOR AUTOMATIC ANALYSIS OF EEGS 摘要: 数据: 时序信号的时序建模: 特征提取方法: 利用时空上下文建模: 1. 混合 ...
- 基于深度学习的行为识别方法综述
前言 行为识别是机器理解世界以及人类行为的关键技术,在智慧护理.智能监控.视频检索.智能家居方面有着广泛的应用前景.本文对当前流行的基于深度学习的行为识别技术进行总结. 一.行为识别方法 基于深度学习 ...
- 基于深度学习的性格探测综述 阅读笔记
Recent trends in deep learning based personality detection 目录 Recent trends in deep learning based p ...
- python dlib caffe人脸相似度_基于深度学习的人脸识别系统(Caffe+OpenCV+Dlib)【一】如何配置caffe属性表...
前言 基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
最新文章
- 如何删除计算机桌面多余的大e,桌面有个大E浏览器图标,怎么也删除不了
- 没有调查就没有发言权
- 数据库系统(四)——触发器
- Laravel 5 多个视图共享数据的方法
- 扎根CNCF社区贡献五年是怎样的体验?听听华为云原生开源团队的负责人怎么说
- Java 堆内存是线程共享的!面试官:你确定吗?
- mysql数据库表字段使用DESC等关键字报错及解决方法
- C经典100题(1)
- java 排队实现_java中的优先列队-PriorityQueue源码实现解析
- 数据结构实验一:顺序表的实现及应用
- 计算几何【套模板,推荐模板】 Separating Pebbles UVALive - 7461
- MySQL函数及用法
- 19寸宽屏液晶显示器的设置 有效保护视力
- 戴尔服务器r720怎么进入系统安装,戴尔R720服务器安装步骤.doc
- 19行列式公式和代数余子式
- 自动化车间3D可视化设计思路
- p37 p38 p39 p40 p41
- 项目一_GoldenEye
- 提取NTLDR文件,分解Osloader.exe;pe文件找e_lfanew、IMAGE_EXPORT_DIRECTORY-AddressOfFunctions
- 黎曼猜想证明了?Michael Atiyah的愚人节难道在9月吗……