python模型训练效果没有优化_LSTM模型训练效果好,但测试结果较差,不能看出拟合过度...
以下是我的数据:
我有500个录音(任意分成训练,验证和测试集)。每个记录包含一定数量的行,每一行对应一个1s的EEG片段,换句话说,每个记录的长度等于一个EEG信号的长度(s)。每行包含22个通道*22个时间/频率特征=484个特征+输出标签(0或1)。在
所以我想执行二进制分类。在
正如许多论文(看this good paper)所建议的那样,对于每一个记录,我创建长度为look_back的序列,以便在预测每个标签时考虑到“周围”片段的特征。代码如下:def create_dataset(feat,targ, look_back=1):
semi_window=math.floor(look_back/2)
dataX, dataY = [], []
for i in range(semi_window,len(targ)-semi_window):
a = feat[i-semi_window:(i+semi_window+1), :]
dataX.append(a)
dataY.append(targ[i])
return np.array(dataX), np.array(dataY)
此函数返回大小为(samples, look_back=time_steps, features=484)的三维数组。在
为了处理不平衡的类,我测试了make_imbalance函数以删除实例以保持每个类的实例数不变,以及在loss函数中考虑到不平衡的class_weight参数。在
所以,我使用了一个LSTM模型,并使用earlystup回调参数,在验证精度没有增加给定容差的情况下停止。在
这是我的完整模型:
^{pr2}$
我得到的结果是:
训练混淆矩阵显著,但验证矩阵和测试矩阵较差。。。在
我想这并不过分,因为我的模型尺寸很小(一层,…)。此外,我认为这个模型是恰当的,因为它能够很好地区分(巨大)训练集上的数据。。。在
那么,怎么了?在
NB:我说的是,我对经典的Keras前馈神经网络也有同样的问题
编辑:以下是我绘制学习曲线时得到的结果:
你可以看到的是,训练精度仍然很高,而验证精度(实际上橙色曲线应该是“验证”)仍然很低。。。在
编辑:我尝试使用XGBoost和SVM分类器,但是我无法得到结果(仍然是相同的行为)
编辑:我试着洗牌数据看看。我得到了很好的结果,但这有点像海市蜃楼。。。事实上,我有来自相同记录的数据(不完全相同,但非常接近)在训练和验证集。。。有点作弊。当我向模特展示一张全新的唱片时,它崩溃了。。。所以,我还没有找到解决办法
python模型训练效果没有优化_LSTM模型训练效果好,但测试结果较差,不能看出拟合过度...相关推荐
- B.机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)重点讲解模型验证、特征优化、模型融合等
[机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...
- 模型部署到移动端_模型压缩+编译器优化,使AI算法在移动端性能超越专用硬件...
作者 | 王言治,美国东北大学电子与计算机工程系助理教授 出品 | AI科技大本营(ID:rgznai100) 近年来,机器学习(Machine Learning)领域的研究和发展可谓是与日俱新,各式 ...
- python 调用gpu算力_GPU捉襟见肘还想训练大批量模型?谁说不可以
原标题:GPU捉襟见肘还想训练大批量模型?谁说不可以 选自Medium 深度学习模型和数据集的规模增长速度已经让 GPU 算力也开始捉襟见肘,如果你的 GPU 连一个样本都容不下,你要如何训练大批量模 ...
- python ocr中文训练_cnocr: cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用...
English README. cnocr 使用交流QQ群 欢迎扫码加入QQ交流群: 最近更新 [2020.05.29]:V1.2.2 主要变更: 优化了对数字识别的准确度. 优化了模型结构,进一步降 ...
- pythonocr训练模型_cnocr: cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用...
English README. cnocr 使用交流QQ群 欢迎扫码加入QQ交流群: Release Notes Update 2020.04.21: 发布 cnocr V1.1.0 V1.1.0对代 ...
- windows python 访问mtp存储空间_用Windows电脑训练深度学习模型?超详细配置教程来了...
虽然大多数深度学习模型都是在 Linux 系统上训练的,但 Windows 也是一个非常重要的系统,也可能是很多机器学习初学者更为熟悉的系统.要在 Windows 上开发模型,首先当然是配置开发环境. ...
- Python实现ABC人工蜂群优化算法优化支持向量机回归模型(SVR算法)项目实战
说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 人工蜂群算法(Artificial Bee Colony, AB ...
- Python实现GWO智能灰狼优化算法优化支持向量机分类模型(SVC算法)项目实战
说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 灰狼优化算法(GWO),由澳大利亚格里菲斯大学学者 Mirjal ...
- Python实现GWO智能灰狼优化算法优化支持向量机回归模型(svr算法)项目实战
说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 灰狼优化算法(GWO),由澳大利亚格里菲斯大学学者 Mirjal ...
最新文章
- content-type的作用
- 王晓东:科学家要耐得住寂寞
- c++ 预处理命令 预定义变量用法
- exec 执行结果_php执行系统外部命令的4种方法
- java后台验证不能为空_java validation 后台参数验证的使用详解
- 第一批 90 后还有半个月就 30 岁了!那些 30 岁前就成博导的人都怎样了...
- 北京航空航天大学计算机科学与工程系,北航郑征主页 北京航空航天大学教师个人主页系统...
- 截取台风后的图片_今年首个台风来袭!“大黄蜂”下,货代如何“防台”?
- 一个模型使召回阶段又准确又多样
- IPTV软件如何做自己的广告系统?
- 两个需求理论:马斯洛需求层次理论和KANO模型
- 蜜罐 计算机术语,检测虚机和蜜罐方法的概念 -电脑资料
- Nik Collection 4
- ERP实施中需掌握的基本财务基础知识
- 20 个 Laravel Eloquent 必备的实用技巧 1
- 计算机无法打开命令,电脑点击运行cmd打不开怎么办
- MATLAB基础应用精讲-【基础知识篇】MATLAB中的标点符号
- 在树莓派上搭建ad-hoc网络教程
- 信号完整性分析2——时域与频域
- 菜刀怎么接mysql_chopper菜刀一句话操作mysql数据库乱码问题 -电脑资料
热门文章
- 【LeetCode从零单排】No83 Remove Duplicates from Sorted List
- 20年IT老兵分享:账务系统设计及应用--转
- kafka源码分析之一server启动分析
- apache kafka技术分享系列(目录索引)--转载
- 使用 JSSE 定制 SSL 连接的属性--转载
- 重磅 | 2017年全球最聪明公司排行榜TOP50,哪9家中国公司上榜?
- 从自我学习到深层网络
- Java开发者必备的六款工具
- Java Review - 并发编程_ArrayBlockingQueue原理源码剖析
- Spring5源码 - 09 循环依赖解读