以下是我的数据:

我有500个录音(任意分成训练,验证和测试集)。每个记录包含一定数量的行,每一行对应一个1s的EEG片段,换句话说,每个记录的长度等于一个EEG信号的长度(s)。每行包含22个通道*22个时间/频率特征=484个特征+输出标签(0或1)。在

所以我想执行二进制分类。在

正如许多论文(看this good paper)所建议的那样,对于每一个记录,我创建长度为look_back的序列,以便在预测每个标签时考虑到“周围”片段的特征。代码如下:def create_dataset(feat,targ, look_back=1):

semi_window=math.floor(look_back/2)

dataX, dataY = [], []

for i in range(semi_window,len(targ)-semi_window):

a = feat[i-semi_window:(i+semi_window+1), :]

dataX.append(a)

dataY.append(targ[i])

return np.array(dataX), np.array(dataY)

此函数返回大小为(samples, look_back=time_steps, features=484)的三维数组。在

为了处理不平衡的类,我测试了make_imbalance函数以删除实例以保持每个类的实例数不变,以及在loss函数中考虑到不平衡的class_weight参数。在

所以,我使用了一个LSTM模型,并使用earlystup回调参数,在验证精度没有增加给定容差的情况下停止。在

这是我的完整模型:

^{pr2}$

我得到的结果是:

训练混淆矩阵显著,但验证矩阵和测试矩阵较差。。。在

我想这并不过分,因为我的模型尺寸很小(一层,…)。此外,我认为这个模型是恰当的,因为它能够很好地区分(巨大)训练集上的数据。。。在

那么,怎么了?在

NB:我说的是,我对经典的Keras前馈神经网络也有同样的问题

编辑:以下是我绘制学习曲线时得到的结果:

你可以看到的是,训练精度仍然很高,而验证精度(实际上橙色曲线应该是“验证”)仍然很低。。。在

编辑:我尝试使用XGBoost和SVM分类器,但是我无法得到结果(仍然是相同的行为)

编辑:我试着洗牌数据看看。我得到了很好的结果,但这有点像海市蜃楼。。。事实上,我有来自相同记录的数据(不完全相同,但非常接近)在训练和验证集。。。有点作弊。当我向模特展示一张全新的唱片时,它崩溃了。。。所以,我还没有找到解决办法

python模型训练效果没有优化_LSTM模型训练效果好,但测试结果较差,不能看出拟合过度...相关推荐

  1. B.机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)重点讲解模型验证、特征优化、模型融合等

    [机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...

  2. 模型部署到移动端_模型压缩+编译器优化,使AI算法在移动端性能超越专用硬件...

    作者 | 王言治,美国东北大学电子与计算机工程系助理教授 出品 | AI科技大本营(ID:rgznai100) 近年来,机器学习(Machine Learning)领域的研究和发展可谓是与日俱新,各式 ...

  3. python 调用gpu算力_GPU捉襟见肘还想训练大批量模型?谁说不可以

    原标题:GPU捉襟见肘还想训练大批量模型?谁说不可以 选自Medium 深度学习模型和数据集的规模增长速度已经让 GPU 算力也开始捉襟见肘,如果你的 GPU 连一个样本都容不下,你要如何训练大批量模 ...

  4. python ocr中文训练_cnocr: cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用...

    English README. cnocr 使用交流QQ群 欢迎扫码加入QQ交流群: 最近更新 [2020.05.29]:V1.2.2 主要变更: 优化了对数字识别的准确度. 优化了模型结构,进一步降 ...

  5. pythonocr训练模型_cnocr: cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用...

    English README. cnocr 使用交流QQ群 欢迎扫码加入QQ交流群: Release Notes Update 2020.04.21: 发布 cnocr V1.1.0 V1.1.0对代 ...

  6. windows python 访问mtp存储空间_用Windows电脑训练深度学习模型?超详细配置教程来了...

    虽然大多数深度学习模型都是在 Linux 系统上训练的,但 Windows 也是一个非常重要的系统,也可能是很多机器学习初学者更为熟悉的系统.要在 Windows 上开发模型,首先当然是配置开发环境. ...

  7. Python实现ABC人工蜂群优化算法优化支持向量机回归模型(SVR算法)项目实战

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 人工蜂群算法(Artificial Bee Colony, AB ...

  8. Python实现GWO智能灰狼优化算法优化支持向量机分类模型(SVC算法)项目实战

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 灰狼优化算法(GWO),由澳大利亚格里菲斯大学学者 Mirjal ...

  9. Python实现GWO智能灰狼优化算法优化支持向量机回归模型(svr算法)项目实战

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 灰狼优化算法(GWO),由澳大利亚格里菲斯大学学者 Mirjal ...

最新文章

  1. content-type的作用
  2. 王晓东:科学家要耐得住寂寞
  3. c++ 预处理命令 预定义变量用法
  4. exec 执行结果_php执行系统外部命令的4种方法
  5. java后台验证不能为空_java validation 后台参数验证的使用详解
  6. 第一批 90 后还有半个月就 30 岁了!那些 30 岁前就成博导的人都怎样了...
  7. 北京航空航天大学计算机科学与工程系,北航郑征主页 北京航空航天大学教师个人主页系统...
  8. 截取台风后的图片_今年首个台风来袭!“大黄蜂”下,货代如何“防台”?
  9. 一个模型使召回阶段又准确又多样
  10. IPTV软件如何做自己的广告系统?
  11. 两个需求理论:马斯洛需求层次理论和KANO模型
  12. 蜜罐 计算机术语,检测虚机和蜜罐方法的概念 -电脑资料
  13. Nik Collection 4
  14. ERP实施中需掌握的基本财务基础知识
  15. 20 个 Laravel Eloquent 必备的实用技巧 1
  16. 计算机无法打开命令,电脑点击运行cmd打不开怎么办
  17. MATLAB基础应用精讲-【基础知识篇】MATLAB中的标点符号
  18. 在树莓派上搭建ad-hoc网络教程
  19. 信号完整性分析2——时域与频域
  20. 菜刀怎么接mysql_chopper菜刀一句话操作mysql数据库乱码问题 -电脑资料

热门文章

  1. 【LeetCode从零单排】No83 Remove Duplicates from Sorted List
  2. 20年IT老兵分享:账务系统设计及应用--转
  3. kafka源码分析之一server启动分析
  4. apache kafka技术分享系列(目录索引)--转载
  5. 使用 JSSE 定制 SSL 连接的属性--转载
  6. 重磅 | 2017年全球最聪明公司排行榜TOP50,哪9家中国公司上榜?
  7. 从自我学习到深层网络
  8. Java开发者必备的六款工具
  9. Java Review - 并发编程_ArrayBlockingQueue原理源码剖析
  10. Spring5源码 - 09 循环依赖解读