drop_last=True
当你使用了batch normalization的时候,如果batch_size设置得不合适,又没有使用 drop_last = true,那么可能会遇到以下错误

Expected more than 1 value per channel when training, got input size torch.Size([1, 1024])

解决方案:

https://discuss.pytorch.org/t/about-the-relation-between-batch-size-and-length-of-data-loader/10510/4

train_iter = torch.utils.data.DataLoader(train_dataset, batch_size = batch_size, shuffle = True, num_workers = num_workers, drop_last=True)

test_iter = torch.utils.data.DataLoader(test_dataset, batch_size = batch_size, shuffle = True, num_workers = num_workers, drop_last=True)

使用了drop_last = True, 可能会有以下后果:

比如 test set中有229个数据, 如果batch size = 40, 那么就会有29个数据不会被使用。在每一个epoch中,就只有200个数据。229 - 40*5 = 29

再比如,batch size = 20, 那么就会有9个数据不会被使用。在每一个epoch中,就只有220个数据。 229 - 20*11 = 9
作者:宿安雅
https://www.bilibili.com/read/cv4956521/
出处: bilibili

drop_last=True相关推荐

  1. 收藏 | GPU多卡并行训练总结

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:记忆的迷谷@ ...

  2. Seq2Seq实现闲聊机器人

    Seq2Seq实现闲聊机器人 1. 准备训练数据 单轮次的聊天数据非常不好获取,所以这里从github上使用一些开放的数据集来训练我们的闲聊模型 数据地址:https://github.com/cod ...

  3. 极简PaddlePaddle的房价预测Demo

    简 介: ※利用最简单的线性关系预测数据之间的相关性. 关键词: 线性相关,预测# #mermaid-svg-7sGsiuDJBmN3r5cU {font-family:"trebuchet ...

  4. pytorch多进程加载数据

    数据是提前准备,所以是在每次训练时,加载下一批的数据 每个epoch最后一次,加载下一个epoch的数据. def DataLoaderProcess(list_path,cfg, args, dat ...

  5. pytorch DataLoader

    COCODataset 中返回numpy数组或者字典中包含numpy,会自动转换为tenser from torch.utils.data import DataLoaderdataloader =D ...

  6. pytorch 数据加载性能对比

    传统方式需要10s,dat方式需要0.6s import os import time import torch import random from common.coco_dataset impo ...

  7. Pytorch 怎么构建自己的数据集。怎么重写官方数据集。

    小白记录,大神勿扰 小白入门的时候,发现,现有的基本都是直接类似这样的: trainset = datasets.MNIST('../MNIST', download=True,train=True, ...

  8. GCN代码超详解析Two-stream adaptive graph convolutional network for Skeleton-Based Action Recognition(三)

    代码地址https://github.com/lshiwjx/2s-AGCN 本篇解析对应 2s-AGCN/graph/ntu_rgb_d.py ,用于创建NTURGB-D对应的图结构,以及2s-AG ...

  9. DataLoader 与 Dataset

    一.总体概览 二.具体详解 DataLoader源码 class DataLoader(Generic[T_co]):r"""Data loader. Combines ...

  10. Lesson 11.1-11.5 梯度下降的两个关键问题反向传播的原理走出第一步:动量法开始迭代:batch和epochs在Fashion—MNIST数据集熵实现完整的神经网络

    在之前的课程中,我们已经完成了从0建立深层神经网络,并介绍了各类神经网络所使用的损失函数.本节课开始,我们将以分类深层神经网络为例,为大家展示神经网络的学习和训练过程.在介绍PyTorch的基本工具A ...

最新文章

  1. Matlab Robotic Toolbox V9.10工具箱(四):常用函数
  2. webpack入坑指南
  3. 用javascript代码拼html
  4. php composer源码打包,手把手教你发布自己的 Composer 包
  5. 排序算法(6)----计数排序
  6. 自动化测试工具Selenium
  7. Ubuntu之更新CMake的版本
  8. android蓝牙控制继电器——手机客户端的实现
  9. linux命令从哪里敲,Linux 笔记本基于“敲打”的命令
  10. JavaScript 高级教程
  11. CSS权威指南(4)
  12. java中的jQuery与Ajax的应用,菜鸟教程
  13. 常见端口号服务用途及查看端口
  14. kmeans-用户分层
  15. 3D游戏编程与设计4——游戏对象与图形基础
  16. 前端拖拽时手型为禁用
  17. 解决nasm汇编gdb无法单步调试
  18. JAVA 系列——包装类
  19. imperva代理拦截
  20. 云南b系列服务器机柜,标准B型网络服务器机柜

热门文章

  1. Matlab二元函数图像绘制
  2. 什么是PLC可编程控制器,理论基础知识讲解QY-KC801
  3. [转载vchome] 2005年经典事件
  4. python 录制网易云登陆_Github获8300星!用Python开发的一个命令行的网易云音乐
  5. 计算机无法通过网络连接打印机共享,共享打印机无法连接,详细教您共享打印机无法连接怎么办...
  6. 计算机电子贺卡制作圣诞节,圣诞电子贺卡_圣诞节英文电子贺卡怎么制作
  7. 这家山炮公司,居然让腾讯又有了梦想!?
  8. 计算机二级什么叫项目符号,项目符号
  9. 抖音小程序开发教程之 02 创建第一个hello world 小程序(教程含源码)
  10. 抖音小程序开发 唤起收银台支付(可以选择支付宝APP支付或微信H5支付)