分类模型训练完之后,测试效果极差可能原因分析
在知乎上有这样一个问题:
acc很高,但预测正确的样本占比又很低,怎么回事? - 知乎
关于这个问题,在这个问题的回答中,有许多大佬从数据的分布、模型的结构、数据集的划分,以及验证指标等层面进行了解答。
在这里按照我的理解,简单描述一下这个问题:模型训练正常,模型测试效果很差,甚至在训练集上的测试效果都很差。简单分析一下大概有以下几个方面的原因可以排查:
1、检查模型训练和模型测试的数据处理pipeline是否一致,比如训练时做了Normalize,测试时也要做Normalize,这一点至关重要,我遇到的这类问题基本上都是因为数据预处理不一致导致的
2、检查模型在测试时有没有切换到推理模式,如pytorch中的eval()转换
3、检查输入的数据维度是否正确,比如训练时使用[N, C, H, W],测试时也要使用同样的数据维度顺序,现在好多分类模型在后面会添加AdaptiveAvgPool层,即使输入的数据尺寸和训练时不一样也不会报错
4、检查模型参数加载是否正确,还是以pytorch框架为例,pytorch在加载模型时如果设置完全匹配的参数为False,在加载过程中即使参数和模型不匹配也不会报错,但是会使用默认的随机参数
以上就是目前在实际工作中遇到的一些可能原因分析,如果还有其他可能原因,欢迎随时指导。
分类模型训练完之后,测试效果极差可能原因分析相关推荐
- 分类模型训练完成,却预测不准的原因
最近,在用resnet模型进行图像分类的时候,出现了个问题.就是在test时候,准确率能达到93,单单张图片预测的时候,结果几乎没有正确的. 最开始以为模型训练的时候的问题,因为我想要最大概率的结果, ...
- 神经网络学习小记录19——微调VGG分类模型训练自己的数据(猫狗数据集)
神经网络学习小记录19--微调VGG分类模型训练自己的数据(猫狗数据集) 注意事项 学习前言 什么是VGG16模型 VGG模型的复杂程度 训练前准备 1.数据集处理 2.创建Keras的VGG模型 3 ...
- PytorchCNN图片识别和分类模型训练框架
PytorchCNN图片识别和分类模型训练框架 文章目录 PytorchCNN图片识别和分类模型训练框架 前言 一.图片数据集预处理 二.模型训练 1.transforms.Compose准备 2.通 ...
- 神经网络学习小记录17——使用AlexNet分类模型训练自己的数据(猫狗数据集)
神经网络学习小记录17--使用AlexNet分类模型训练自己的数据(猫狗数据集) 学习前言 什么是AlexNet模型 训练前准备 1.数据集处理 2.创建Keras的AlexNet模型 开始训练 1. ...
- bert中文分类模型训练+推理+部署
文章预览: 0. bert简介 1. bert结构 1. bert中文分类模型训练 1 下载bert项目代码 代码结构 2 下载中文预训练模型 3 制作中文训练数据集 2. bert模型推理 1.te ...
- keras构建前馈神经网络(feedforward neural network)进行多分类模型训练学习
keras构建前馈神经网络(feedforward neural network)进行多分类模型训练学习 前馈神经网络(feedforward neural network)是一种最简单的神经网络,各 ...
- AI:神经网络IMDB电影评论二分类模型训练和评估
AI:Keras神经网络IMDB电影评论二分类模型训练和评估,python import keras from keras.layers import Dense from keras import ...
- 模型训练完才是业务的开始?说说模型监控 | CSDN博文精选
扫码参与CSDN"原力计划" 作者 | A字头 来源 | 数据札记倌(ID:Data_Groom) "模型训练结束后才是业务真正的开始" 简述 每次模型训练完成 ...
- 黑马NLP实战 --- 新闻分类模型训练
关于<黑马程序员>课程中NLP中 训练新闻分类模型 最近在学习NLP的相关知识,找了资料比较全的黑马程序员中讲解NLP的课程,可是其中有一部分实战 新闻主题分类实战项目中,我发现黑马程序员 ...
最新文章
- python 多态_Python中的多态
- python读取yuv
- SecureCRT设置
- 线上故障快速定位及恢复
- QT5开发及实例学习之四容器类
- python 批量网址 网页截图_python实现网页截图
- 本科生如何系统地学习前端开发?
- mysql 按照汉字的拼音排序、按照首字母分类
- 高中函数知识点太多记不住?一张思维导图教你轻松学习函数
- TCP服务器 IO多路复用的实现:select、poll、epoll
- 指数解读:沪深300(CSI300)[000300](续)
- 图像分割-连通区域分析
- RGB,ARGB颜色值的表示表示
- 玖逸云黑v1.4-更高级的云黑系统
- 为什么进程切换比线程切换耗费资源?
- 神经网络调参-warmup and decay
- Win10 蓝牙已配对但无法连接的问题
- 在ListView中实现button功能
- 攻防世界MISCall
- QrCodeUtil--二维码工具类
热门文章
- 六十、基础框架(十八)辞典物件
- 【solidity入门】4. 函数输出 Return
- 闪击6偏大偏小?_WEN开箱 | 开箱李宁闪击5季后赛版探讨对比普通版和闪击3怎么选...
- mysql 同步复制 半同步复制_一文看懂MySQL的异步复制、全同步复制与半同步复制...
- 程序设计文档编写_编写有效的设计系统文档的6个技巧
- 小程序预览加载不出图片
- 你看到的都是招数,不是内功
- java编写分数加减法_JAVA 分数加减法
- 学习日志(一):与SISR相关又没用的一些概念
- 迷路的奶牛 Farmer John C++