迭代次数和熵之间关系的一点联想

( A, B )---3*30*2---( 1, 0 )( 0, 1 )

做一个网络来分类A和B，网络输入只有3个节点，每个训练集只有3张图片。让B全为0，让A的3张图片中只有3个1，排列组合A的所有可能，固定收敛误差观察迭代次数平均值的变化。

				A-B	迭代次数
18	1	0	0	406-000	13286.89
	0	0	0	406-000	13286.89
	1	1	0	406-000	13286.89

18	0	0	0	023-000	14368.13
	0	1	0	023-000	14368.13
	0	1	1	023-000	14368.13

8	0	1	0	205-000	24369.4
	0	0	0	205-000	24369.4
	1	0	1	205-000	24369.4

8	1	0	1	502-000	24797.43
	0	0	0	502-000	24797.43
	0	1	0	502-000	24797.43

18	1	0	0	414-000	26861.2
	0	0	1	414-000	26861.2
	1	0	0	414-000	26861.2

3	0	1	0	222-000	27189.46
	0	1	0	222-000	27189.46
	0	1	0	222-000	27189.46

6	0	0	1	124-000	38687.38
	0	1	0	124-000	38687.38
	1	0	0	124-000	38687.38

3	0	0	0	070-000	44792.64
	1	1	1	070-000	44792.64
	0	0	0	070-000	44792.64

共有82组，但只有8种不同的迭代次数。

0	1	0	222-000	27189.4623
0	1	0	222-000	27189.4623
0	1	0	222-000	27189.4623

1	0	0	444-000	27206.1558
1	0	0	444-000	27206.1558
1	0	0	444-000	27206.1558

0	0	1	111-000	27318.7588
0	0	1	111-000	27318.7588
0	0	1	111-000	27318.7588

按照对称性上面3组算作迭代次数相同。

假设有一个盒子，这个盒子里有9个不同的位置，里边有3个完全相同的粒子，并且两个粒子不能重叠，现在让这3个粒子在这个盒子里自由的运动。

按照热力学第二定律，一个孤立的系统的熵总是增加，这就意味着这个盒子里的3个粒子的相对位置关系的变化是唯一的，有一个特征的顺序。一定是按照有序到无序的顺序在排列。

由训练集AB组成的系统是一个孤立的系统吗？所谓孤立的系统要求不与外界产生物质交换和能量交换。训练集A中只有3个1不会增加，显然是没有物质交换的。训练集相对网络似乎是一个静态的对象，迭代次数再多对训练集也不会有任何影响。所以认为训练集AB组成的系统是一个孤立系统的假设似乎是可能的。

如果AB是一个孤立系统，那AB的排序就仅取决于熵，所以迭代次数不就是熵的倒数吗？

这就意味着迭代次数越小熵越大，信息量也越大，发生的概率越小。如果一次扔9枚硬币，其中3枚朝上，如果只考虑正面反面，那概率是相同的信息量也是相同的。但是如果加入空间变量，考虑硬币之间的位置关系，如果认为无论3枚朝上的硬币之间是如何排列的整体熵都相同，那就没有有序和无序的差别，熵就是定值，也就没有热力学第二定律了。

如果迭代次数表达的是一种包含空间变量的信息熵，那神经网络无比明确的表明，含空间位置的信息熵是相对的不是绝对的。比如3个粒子从3个一行变成3个一列，这个过程是熵增的还是熵减的还是不变？神经网络告诉我们这个排序取决于参照物B，空间的形态，如果B改变了迭代次数的排序就会变。

迭代次数和熵之间关系的一点联想相关推荐

神经网络迭代次数的一个近似关系
(A,B)---m*n*k---(1,0)(0,1) 移位距离和假设用神经网络分类A和B,把参与分类的A和B中的数字看作是组成A和B的粒子,分类的过程就是让A和B中的粒子互相交换位置,寻找最短移位路 ...
详细解释：Epoch、batch_size批处理大小、迭代次数之间的关系
Epoch.batch_size批处理大小.迭代次数之间的关系问题:当遇到参数Epoch时,我们应该将其具体设置多少呢?或者应该迭代多少次呢? 举例说明问题:当遇到参数Epoch时,我们应该将其具 ...
测量一组5层网络的迭代次数
如图左边5层网络很显然可以看作是右边的3层网络两个组合而成的,所以左边的5层网络的迭代次数和右边的3层网络的迭代次数有没有什么关系? 5层 3层 2*10*2*10*2 2*10*2 3*10*3*1 ...
一个用于推算神经网络理论收敛迭代次数的方法
神经网络的收敛过程就是输出值从0或者1逐渐逼近0.5的过程,也就是1-δ→0.5或者0+δ→0.5,所以用δ表示收敛标准,假设神经网络收敛迭代次数n与δ的关系为 n=r*δ^( -1*π/2) r是系 ...
带卷积核的神经网络的迭代次数与收敛标准的关系
制作一个带有卷积核的神经网络让这个网络向1,0收敛,y[0]向1收敛,y[1]向0收敛.收敛标准用δ表示,当满足条件 while(Math.abs(y[0]-1)> δ || Math.abs ...
Lr中脚本的迭代次数和场景运行时间的关系
Loadrunner中脚本的迭代次数和场景运行时间的关系 LR 的Vugen和controller中迭代是这样的: 当场景的持续时间为"运行至结束"时,以Vugen中设置的迭代次数 ...
交叉熵与KL散度和交叉熵之间的关系
1.熵熵的本质是香农信息量log1plog\frac{1}{p}logp1 现有关于样本的两个概率分布ppp和qqq,其中ppp为真实分布,qqq为非真实分布.按照真实分布ppp来衡量识别一个样本 ...
决定迭代次数的两种效应
由于对称导致的空间结构耦合的不规则效应,和等位点数值差导致的线性效应共同决定了神经网络的迭代次数.而增加训练集图片数量和扩大图片的尺寸都可能弱化对称性,并同时弱化结构耦合的不规则效应,使得线性效应占优 ...
形态等位点对迭代次数的贡献
用神经网络分类8123*11和8123*99,在收敛误差一致的情况下他们的迭代次数之间有什么关系?哪个迭代次数更大些? 移位距离和假设 (A,B)---m*n*k---(1,0)(0,1) 用神经网络 ...

迭代次数和熵之间关系的一点联想

迭代次数和熵之间关系的一点联想相关推荐

最新文章

热门文章