今天跑代码的时候遇到了这个错误:
RuntimeError: size mismatch, m1:[1152 x 1] ,m2:[576 x 192] ,at /opt/conda/conda-bld/pytorch_1524

调试之后发现是如下有问题:
源代码在这里:
这是class里init中相应的部分

def forward的相应的问题

问题就在于y1 = self.fc_1(y)这里,fc_1也是同fc一样的全连接层,而全连接层输入的尺寸只有两维!
从图上可以看到,y输出的尺寸是[2,576,1,1]
在y1 = self.fc_1(y)的时候,因为y是四维的,所以会自动变成两维的,具体怎么变呢就是:
假设y是[2,576,1,1],输入全连接层fc_1之后,pytorch会自动将[2,576,1,1]压成[2X576,1X1],这就是二维的了。
所以应该改成如下:

在pytorch中,全连接层是通过torch.nn.linear()这个函数实现的,输入的参数只有feature的channels(就是途中的in_features),而size则根据前面的量来自适应的,所以很多人会自动的认为不需要注意输入的shape,自适应即可。这时全连接层就会帮你把你超过二维的shape给自动调整成二维的,这时就会报错啦。所以要自己调整fc的输入shape,只要batchSize和Channel数即可。

全连接层真是神了……这个地方揣摩了一个早上,下午和同学讨论了一会突然灵光一现想到的。
代码终于跑起来了好开心,安心的去上课了。
--------------------- 
作者:lingzhou33 
来源:CSDN 
原文:https://blog.csdn.net/lingzhou33/article/details/88312502 
版权声明:本文为博主原创文章,转载请附上博文链接!

【error】RuntimeError: size mismatch与全连接fc层相关推荐

  1. RuntimeError: size mismatch, m1: [80 x 4], m2: [320 x 50] at ..\aten\src\TH/generic/THTensorMath.cpp

    RuntimeError: size mismatch, m1: [80 x 4], m2: [320 x 50] at -\aten\src\TH/generic/THTensorMath.cpp: ...

  2. RuntimeError: size mismatch

    RuntimeError: size mismatch出现于pytorch框架下加载VGG11预训练模型时出现的错误.笔者初期认为,出现该错误的主要原因是输出和输入的维度不匹配.带着疑惑,我们通过输出 ...

  3. pytorch搭建cnn报错:RuntimeError: size mismatch, m1: [10 x 43264], m2: [10816 x 2] at C...

    具体报错信息: Traceback (most recent call last):File "E:/Program Files/PyCharm 2019.2/machinelearning ...

  4. RuntimeError: size mismatch, m1: [512 x 12800], m2: [2048 x 1024] at C

    RuntimeError: size mismatch, m1: [512 x 12800], m2: [2048 x 1024] at C 说一下这错误,意思就是m1和m2两个数组尺寸不一样. 为啥 ...

  5. 做项目遇到问题 2 AWS NLP 剽窃RuntimeError: size mismatch, m1: [10 x 3], m2: [2 x 10]检测部署报错

    报错 RuntimeError: size mismatch, m1: [10 x 3], m2: [2 x 10] 原因: train.csv 为100x4    4列  第一列  标签是否剽窃  ...

  6. PyTorch RuntimeError: size mismatch, m1:

    在查看torch的FastRCNNPredictor官方实现时,想弄清楚一些细节,其中nn.Linear使用的时候需要给定(in_channels, num_classes). 随便打一点测试代码,报 ...

  7. pytorch RuntimeError: size mismatch, m1: [64 x 784], m2: [784 x 10] at

    from torch import nnclass Mnist_Logistic(nn.Module):def __init__(self):super().__init__()self.lin=nn ...

  8. 全连接 dense层

    keras dense 层: 深入理解 keras 中 Dense 层参数 全连接层的作用是什么

  9. python神经网络案例——FC全连接神经网络实现mnist手写体识别

    全栈工程师开发手册 (作者:栾鹏) python教程全解 FC全连接神经网络的理论教程参考 http://blog.csdn.net/luanpeng825485697/article/details ...

最新文章

  1. 在坚持了15年后,我毅然决定离开 Linux,投入 Mac 的怀抱
  2. 物理IP和浮动IP分别的含义是什么
  3. oracle之 安装 11G RAC 报 NTP failed
  4. (一)Git学习记录(不断更新)
  5. make: 'pcs.o' is up to date.问题解决
  6. 基于jquery,bootstrap数据验证插件bootstrapValidator 教程
  7. 【围棋棋盘绘制——html实现】
  8. matlab最小二乘法拟合原理,最小二乘法曲线拟合_原理及matlab实现
  9. MySQL said: Host 'XXX' is not allowed to connect to this MySQL server
  10. 网站服务器登录很慢,网站打开速度慢如何解决?有何技巧?
  11. css多种方法画四分之一圆曲线
  12. 最小生成树Prim算法java实现
  13. CPU-流水线的数据相关问题
  14. php webmail,10个基于Ajax的PHP Webmail客户端
  15. 滤波器频率响应的归一化
  16. 6G新天线技术白皮书(附下载)
  17. Beats: Filebeat 和 pipeline processors
  18. 万能查询,总有你想要的!
  19. 小红书KOC素人笔记种草怎么做?
  20. Git建立本地分支和远程分支的映射关系

热门文章

  1. php拼音模糊查询,PHP模糊查询技术实例分析【附源码下载】
  2. 编写一个头文件,头文件中定义一个宏cube(x)用于求一个数的平方
  3. appscan无法连接到服务器_SQL Server无法连接服务器
  4. Linux网络服务-Web Service之【HTTP协议简介】(一)
  5. RedHat 7.0 Chrome浏览器 安装
  6. js 事件函数中的参数带换行符或换行标签都不能起作用的解决方法
  7. 初谈SQL Server逻辑读、物理读、预读
  8. 【C/C++】计时函数比较
  9. JavaEE(14) - JPA关联映射
  10. 8核移动处理器时代来临