validation_data: tuple (x_val, y_val) or tuple (x_val, y_val, val_sample_weights) on which to evaluate the loss and any model metrics at the end of each epoch. The model will not be trained on this data. This will override validation_split.
验证数据集是用来对每一个epoch都会做一次评估,模型在验证数据集上不进行训练
validation loss is the value of cost function for cross validation set and loss is the value of cost function for training set.”
val_loss is the value of cost function for your cross validation data and loss is the value of cost function for your training data. On validation data, neurons using drop out do not drop random neurons. The reason is that during training we use drop out in order to add some noise for avoiding over-fitting. During calculating cross validation, we are in recall phase and not in training phase. We use all the capabilities of the network.

在训练中我们使用dropout是为了增加一些噪声,避免过度拟合。
而在验证数据上,使用dropout的神经元不会随机丢弃神经元。

Thanks to one of our dear friends, I quote and explain the contents from here which are definitely useful.

validation_split: Float between 0 and 1. Fraction of the training data to be used as validation data. The model will set apart this fraction of the training data, will not train on it, and will evaluate the loss and any model metrics on this data at the end of each epoch. The validation data is selected from the last samples in the x and y data provided, before shuffling.

validation_data: tuple (x_val, y_val) or tuple (x_val, y_val, val_sample_weights) on which to evaluate the loss and any model metrics at the end of each epoch. The model will not be trained on this data. This will override validation_split.

As you can see

fit(self, x=None, y=None, batch_size=None, epochs=1, verbose=1, callbacks=None, validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None, validation_steps=None)
fit method used in Keras has a parameter named validation_split, which specifies the percentage of data used for evaluating the model which is created after each epoch. After evaluating the model using this amount of data, that will be reported by val_loss if you’ve set verbose to 1; moreover, as the documentation clearly specifies, you can use either validation_data or validation_split. Cross validation data is used to investigate whether your model over-fits the data or does not. This is what we can understand whether our model has generalization capability or not.

Keras difference beetween val_loss and loss during training
https://datascience.stackexchange.com/questions/25267/keras-difference-beetween-val-loss-and-loss-during-training?rq=1

训练集、验证集、测试集相关推荐

  1. 【小白学PyTorch】 2.浅谈训练集验证集和测试集

    文章目录: 经验误差与过拟合 评估方法 经验误差与过拟合 关键词:错误率(error rate),精度(accuracy). 错误率好理解,就是m个样本中,a个样本分类错误,则错误率E = a/m . ...

  2. 训练集 验证集_训练与验证、测试集数据分布不同的情况

    在不同分布的数据集上进行训练与验证.测试 深度学习需要大量的数据,但是有时我们可获得的满足我们真实需求分布的数据并不是那么多,不足以对我们的模型进行训练.这时我们就会收集大量相关的数据加入到训练集中, ...

  3. 机器学习典型步骤以及训练集、验证集和测试集概念

    1. 机器学习典型步骤 数据采集和标记 数据清洗 特征选择 如房子的面积.地理位置.朝向.价格等. 模型选择 有监督还是无监督,问题领域.数据量大小.训练时长.模型准确度等多方面有关. 模型训练和测试 ...

  4. 【入门篇】如何正确使用机器学习中的训练集、验证集和测试集?

    [注] ·本文为转载文章,原文作者是王树义老师,原文链接为 https://zhuanlan.zhihu.com/p/71961236 训练集.验证集和测试集,林林总总的数据集合类型,到底该怎么选.怎 ...

  5. 训练集(train set) 验证集(validation set) 测试集(test set)

    在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(validation set) 测试集(test set). http://blog.si ...

  6. 机器学习中训练集、验证集和测试集的区别

    通常,在训练有监督的机器学习模型的时候,会将数据划分为训练集.验证集合测试集,划分比例一般为0.6:0.2:0.2.对原始数据进行三个集合的划分,是为了能够选出效果(可以理解为准确率)最好的.泛化能力 ...

  7. [机器学习] 训练集(train set) 验证集(validation set) 测试集(test set)

    在有监督(supervise)的机器学习中,数据集常被分成2~3个即: 训练集(train set) 验证集(validation set) 测试集(test set) 一般需要将样本分成独立的三部分 ...

  8. 训练集、验证集和测试集的意义

    原文 在有监督的机器学习中,经常会说到训练集(train).验证集(validation)和测试集(test),这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别. I. ...

  9. Recbole自定义训练集、验证集和测试集推荐

    文章目录 Recbole简介 Recbole使用 自定义训练集.验证集和测试集 Recbole简介 Recbole(中文名称:伯乐)是一款使用Python开发的开源推荐框架,里面集成了大量的推荐模型, ...

  10. 训练集、验证集和测试集的概念及划分原则

    深度学习中,常将可得的数据集划分为训练集(training set),验证集(development set/validation set)和测试集(test set).下文主要回答以下几个问题:一是 ...

最新文章

  1. sqlserver中,如果正确得到中文的长度
  2. win2003的IIS無法使用,又一次安裝提示找不到iisadmin.mfl文件
  3. 在WPF中实现玻璃模糊效果
  4. 第四十一期:深度解析5G核心网建设难点和挑战
  5. android布局的一些知识
  6. MySQL运维常用系统命令
  7. [转]Tomcat启动报错:AnnotationConfigBeanDefinitionParser are only available on JDK 1.5 and higher...
  8. 托管型呼叫中心与自建型呼叫中心的区别
  9. uva 1291 - Dance Dance Revolution ( dp )
  10. python如何识别中文_python如何识别图片中的文字
  11. ethtool 命令输出的注意点--网卡参数
  12. 中山香山杯 misc write up
  13. Entegris EUV 1010光罩盒展现极低的缺陷率,已获ASML认证
  14. Unity获取组件的几种方式(拖拽法、标签法、名字法)
  15. LSVGlobal Mapper应用----影像下载
  16. 电脑插上串口,鼠标乱飘乱动
  17. 全球首份AR报告第二章:AR的工作原理
  18. 电信行业大数据应用的四个方向
  19. 如何提升运行效率(性能优化)
  20. MFC 获取所有USB设备 列举所有USB设备 列举所有USB HUB

热门文章

  1. 分布式业务Redis安装与集群配置
  2. cJSON解析和打包
  3. Centos 查看CPU个数、核心数等信息
  4. Java Mysql数据库创建视图、索引、备份和恢复
  5. fiddler修改客户端发出去的请求
  6. 实现系统菜单的两种方式
  7. 【linux】IP最大可传65535而以太网最大只能传1500问题解析
  8. 前端基础-html 介绍和head标签 ( 1 )
  9. UOJ #357. 【JOI2017春季合宿】Sparklers
  10. windows下配置mysql数据库主从