【error】RuntimeError: size mismatch与全连接fc层
今天跑代码的时候遇到了这个错误:
RuntimeError: size mismatch, m1:[1152 x 1] ,m2:[576 x 192] ,at /opt/conda/conda-bld/pytorch_1524
调试之后发现是如下有问题:
源代码在这里:
这是class里init中相应的部分
def forward的相应的问题
问题就在于y1 = self.fc_1(y)这里,fc_1也是同fc一样的全连接层,而全连接层输入的尺寸只有两维!
从图上可以看到,y输出的尺寸是[2,576,1,1]
在y1 = self.fc_1(y)的时候,因为y是四维的,所以会自动变成两维的,具体怎么变呢就是:
假设y是[2,576,1,1],输入全连接层fc_1之后,pytorch会自动将[2,576,1,1]压成[2X576,1X1],这就是二维的了。
所以应该改成如下:
在pytorch中,全连接层是通过torch.nn.linear()这个函数实现的,输入的参数只有feature的channels(就是途中的in_features),而size则根据前面的量来自适应的,所以很多人会自动的认为不需要注意输入的shape,自适应即可。这时全连接层就会帮你把你超过二维的shape给自动调整成二维的,这时就会报错啦。所以要自己调整fc的输入shape,只要batchSize和Channel数即可。
全连接层真是神了……这个地方揣摩了一个早上,下午和同学讨论了一会突然灵光一现想到的。
代码终于跑起来了好开心,安心的去上课了。
---------------------
作者:lingzhou33
来源:CSDN
原文:https://blog.csdn.net/lingzhou33/article/details/88312502
版权声明:本文为博主原创文章,转载请附上博文链接!
【error】RuntimeError: size mismatch与全连接fc层相关推荐
- RuntimeError: size mismatch, m1: [80 x 4], m2: [320 x 50] at ..\aten\src\TH/generic/THTensorMath.cpp
RuntimeError: size mismatch, m1: [80 x 4], m2: [320 x 50] at -\aten\src\TH/generic/THTensorMath.cpp: ...
- RuntimeError: size mismatch
RuntimeError: size mismatch出现于pytorch框架下加载VGG11预训练模型时出现的错误.笔者初期认为,出现该错误的主要原因是输出和输入的维度不匹配.带着疑惑,我们通过输出 ...
- pytorch搭建cnn报错:RuntimeError: size mismatch, m1: [10 x 43264], m2: [10816 x 2] at C...
具体报错信息: Traceback (most recent call last):File "E:/Program Files/PyCharm 2019.2/machinelearning ...
- RuntimeError: size mismatch, m1: [512 x 12800], m2: [2048 x 1024] at C
RuntimeError: size mismatch, m1: [512 x 12800], m2: [2048 x 1024] at C 说一下这错误,意思就是m1和m2两个数组尺寸不一样. 为啥 ...
- 做项目遇到问题 2 AWS NLP 剽窃RuntimeError: size mismatch, m1: [10 x 3], m2: [2 x 10]检测部署报错
报错 RuntimeError: size mismatch, m1: [10 x 3], m2: [2 x 10] 原因: train.csv 为100x4 4列 第一列 标签是否剽窃 ...
- PyTorch RuntimeError: size mismatch, m1:
在查看torch的FastRCNNPredictor官方实现时,想弄清楚一些细节,其中nn.Linear使用的时候需要给定(in_channels, num_classes). 随便打一点测试代码,报 ...
- pytorch RuntimeError: size mismatch, m1: [64 x 784], m2: [784 x 10] at
from torch import nnclass Mnist_Logistic(nn.Module):def __init__(self):super().__init__()self.lin=nn ...
- 全连接 dense层
keras dense 层: 深入理解 keras 中 Dense 层参数 全连接层的作用是什么
- python神经网络案例——FC全连接神经网络实现mnist手写体识别
全栈工程师开发手册 (作者:栾鹏) python教程全解 FC全连接神经网络的理论教程参考 http://blog.csdn.net/luanpeng825485697/article/details ...
最新文章
- 在坚持了15年后,我毅然决定离开 Linux,投入 Mac 的怀抱
- 物理IP和浮动IP分别的含义是什么
- oracle之 安装 11G RAC 报 NTP failed
- (一)Git学习记录(不断更新)
- make: 'pcs.o' is up to date.问题解决
- 基于jquery,bootstrap数据验证插件bootstrapValidator 教程
- 【围棋棋盘绘制——html实现】
- matlab最小二乘法拟合原理,最小二乘法曲线拟合_原理及matlab实现
- MySQL said: Host 'XXX' is not allowed to connect to this MySQL server
- 网站服务器登录很慢,网站打开速度慢如何解决?有何技巧?
- css多种方法画四分之一圆曲线
- 最小生成树Prim算法java实现
- CPU-流水线的数据相关问题
- php webmail,10个基于Ajax的PHP Webmail客户端
- 滤波器频率响应的归一化
- 6G新天线技术白皮书(附下载)
- Beats: Filebeat 和 pipeline processors
- 万能查询,总有你想要的!
- 小红书KOC素人笔记种草怎么做?
- Git建立本地分支和远程分支的映射关系
热门文章
- php拼音模糊查询,PHP模糊查询技术实例分析【附源码下载】
- 编写一个头文件,头文件中定义一个宏cube(x)用于求一个数的平方
- appscan无法连接到服务器_SQL Server无法连接服务器
- Linux网络服务-Web Service之【HTTP协议简介】(一)
- RedHat 7.0 Chrome浏览器 安装
- js 事件函数中的参数带换行符或换行标签都不能起作用的解决方法
- 初谈SQL Server逻辑读、物理读、预读
- 【C/C++】计时函数比较
- JavaEE(14) - JPA关联映射
- 8核移动处理器时代来临