神经网络的迭代次数是一个线性的变量吗?
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能。
如果一个神经网络对图片1的迭代次数是n1对图片2的迭代次数是n2,做一个网络向网络输入50%的1和50%的2得到的迭代次数n12会和n1和n2有什么关系?
制作一个带一个3*3卷积核的神经网络,测试集是mnist的0和一张图片x,将28*28的图片缩小成9*9,隐藏层30个节点所以网络的结构是
这个网络分成两个部分左边的是让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但是让左右两边的权重实现同步更新,实现权重共享。前面大量实验表明这种效果相当于将两个弹性系数为k1,k2的弹簧并联成一个弹性系数为k的弹簧,并且让k1=k2=k/2的过程。
将上图简写成
S(mnist0)81-(con3*3)49-30-2-(1,0)
S(x)81-(con3*3)49-30-2-(0,1)
w=w,w1=w1,w2=w2
进一步简写成
d2(mnist0, x=1)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
这个网络的收敛标准是
if (Math.abs(f2[0]-y[0])< δ && Math.abs(f2[1]-y[1])< δ )
本文尝试了δ从0.5到1e-6在内的26个值,训练集是mnist0
图片x就是一张二维数组,让x=1.
具体进样顺序 |
||||
进样顺序 |
迭代次数 |
|||
δ=0.5 |
||||
mnist 0-1 |
1 |
判断是否达到收敛 |
||
X |
2 |
判断是否达到收敛 |
||
梯度下降 |
||||
mnist 0-2 |
3 |
判断是否达到收敛 |
||
X |
4 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
mnist 0-4999 |
9997 |
判断是否达到收敛 |
||
X |
9998 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
如果4999图片内没有达到收敛标准再次从头循环 |
||||
mnist 0-1 |
9999 |
判断是否达到收敛 |
||
X |
10000 |
判断是否达到收敛 |
||
…… |
||||
达到收敛标准记录迭代次数,将这个过程重复199次 |
||||
δ=0.4 |
||||
…… |
用这个方法可以得到网络
d2(mnist0, x=1)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
的迭代次数曲线n1。
用同样的办法制作另一个网络
d2(mnist0, x=0.1)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但让x=0.1.得到迭代次数曲线n0.1
在《测量一组对角矩阵的频率和质量》中已经将这两个迭代次数都测出来了
1 |
0.1 |
|
δ |
迭代次数n1 |
迭代次数n0.1 |
0.5 |
17.40201005 |
17.87437186 |
0.4 |
951.2110553 |
1408.577889 |
0.3 |
1144.577889 |
1720.517588 |
0.2 |
1313.633166 |
1995.110553 |
0.1 |
1505.824121 |
2243.834171 |
0.01 |
2362.115578 |
3001.552764 |
0.001 |
4129.020101 |
4007.532663 |
1.00E-04 |
10353.37186 |
5532.668342 |
9.00E-05 |
10653.93467 |
5683.753769 |
8.00E-05 |
11292.43719 |
6131.934673 |
7.00E-05 |
11761.11055 |
6106.919598 |
6.00E-05 |
12657.69347 |
6014.688442 |
5.00E-05 |
13305.44221 |
6455.321608 |
4.00E-05 |
15844.29648 |
6724.738693 |
3.00E-05 |
17291.77387 |
7055.80402 |
2.00E-05 |
20753.56281 |
7763.41206 |
1.00E-05 |
27708.19598 |
8749.050251 |
9.00E-06 |
29358.8593 |
8879.41206 |
8.00E-06 |
30689.87437 |
9387.150754 |
7.00E-06 |
33437.22111 |
9532.648241 |
6.00E-06 |
36960.63819 |
9957.683417 |
5.00E-06 |
40669.92462 |
10661.56281 |
4.00E-06 |
44594.04523 |
11025.0402 |
3.00E-06 |
51522.10553 |
11653.63317 |
2.00E-06 |
67583.53266 |
13076.9196 |
1.00E-06 |
107224.5276 |
15184.58794 |
现在做第3个网络
d2(mnist0 ; 50% x=1, 50%x=0.1)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但让x在1和0.1之间随机。让1与0.1的比例是1:1.
具体进样顺序 |
||||
进样顺序 |
迭代次数 |
|||
δ=0.5 |
||||
mnist 0-1 |
1 |
判断是否达到收敛 |
||
50% x=1,50% x=0.1 |
2 |
判断是否达到收敛 |
||
梯度下降 |
||||
mnist 0-2 |
3 |
判断是否达到收敛 |
||
50% x=1,50% x=0.1 |
4 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
mnist 0-4999 |
9997 |
判断是否达到收敛 |
||
50% x=1,50% x=0.1 |
9998 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
如果4999图片内没有达到收敛标准再次从头循环 |
||||
mnist 0-1 |
9999 |
判断是否达到收敛 |
||
50% x=1,50% x=0.1 |
10000 |
判断是否达到收敛 |
||
…… |
||||
达到收敛标准记录迭代次数,将这个过程重复199次 |
||||
δ=0.4 |
||||
…… |
相当于分类两个图片集,一个图片集是mnist的0另一个图片集只有两张图片,两张图片随机取样。
得到的数据
f2[0] |
f2[1] |
迭代次数n1-0.1 |
平均准确率p-ave |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时min/199次 |
最大准确率p-max |
0.504392749 |
0.496482833 |
16 |
0.500241159 |
0.5 |
1032.487437 |
205482 |
3.4247 |
0.870449173 |
0.608226758 |
0.391936599 |
1134.527638 |
0.492051273 |
0.4 |
1267.477387 |
252229 |
4.203816667 |
0.982033097 |
0.713814664 |
0.286192435 |
1451.502513 |
0.601689298 |
0.3 |
1334.150754 |
265543 |
4.425716667 |
0.992907801 |
0.815849437 |
0.184081652 |
1595.351759 |
0.651443981 |
0.2 |
1363.070352 |
271251 |
4.52085 |
0.996690307 |
0.912219268 |
0.087818118 |
1745.78392 |
0.664181427 |
0.1 |
1339.628141 |
266602 |
4.443366667 |
0.995744681 |
0.992111381 |
0.007894949 |
2770.829146 |
0.652928947 |
0.01 |
1545.462312 |
307547 |
5.125783333 |
0.996690307 |
0.999271145 |
7.30E-04 |
4088.98995 |
0.608686458 |
0.001 |
1813.819095 |
360950 |
6.015833333 |
0.997163121 |
0.999927651 |
7.23E-05 |
7854.296482 |
0.569369305 |
1.00E-04 |
1935.939698 |
385252 |
6.420866667 |
0.995271868 |
0.999929991 |
7.00E-05 |
8622.899497 |
0.546795443 |
9.00E-05 |
2720.281407 |
541352 |
9.022533333 |
0.997163121 |
0.999940592 |
5.95E-05 |
9150.155779 |
0.537728833 |
8.00E-05 |
2833.653266 |
563897 |
9.398283333 |
0.990543735 |
0.999946971 |
5.30E-05 |
8925.030151 |
0.545505304 |
7.00E-05 |
2799.869347 |
557174 |
9.286233333 |
0.994799054 |
0.99995488 |
4.51E-05 |
9390.949749 |
0.55782696 |
6.00E-05 |
2889.035176 |
574934 |
9.582233333 |
0.997635934 |
0.999961445 |
3.86E-05 |
10619.74372 |
0.540173682 |
5.00E-05 |
3134.035176 |
623673 |
10.39455 |
0.996690307 |
0.999970219 |
2.98E-05 |
10684.25628 |
0.573904986 |
4.00E-05 |
3151.276382 |
627108 |
10.4518 |
0.995271868 |
0.999976706 |
2.33E-05 |
12772.34673 |
0.566287703 |
3.00E-05 |
3547.859296 |
706029 |
11.76715 |
0.994326241 |
0.999984778 |
1.52E-05 |
14707.11055 |
0.561645105 |
2.00E-05 |
4023.798995 |
800740 |
13.34566667 |
0.997635934 |
0.999992452 |
7.55E-06 |
18918.50754 |
0.551644749 |
1.00E-05 |
4873.386935 |
969809 |
16.16348333 |
0.997163121 |
0.999993043 |
6.96E-06 |
21982.04523 |
0.537997315 |
9.00E-06 |
5494.050251 |
1093324 |
18.22206667 |
0.996690307 |
0.999994 |
6.00E-06 |
21742.02513 |
0.555940459 |
8.00E-06 |
4965.522613 |
988144 |
16.46906667 |
0.996690307 |
0.99999488 |
5.12E-06 |
20971.37186 |
0.551815817 |
7.00E-06 |
5284.075377 |
1051539 |
17.52565 |
0.995744681 |
0.999995492 |
4.51E-06 |
21427.84422 |
0.551430913 |
6.00E-06 |
5405.316583 |
1075665 |
17.92775 |
0.996690307 |
0.999996169 |
3.83E-06 |
27284.71859 |
0.529814557 |
5.00E-06 |
6364.065327 |
1266451 |
21.10751667 |
0.997635934 |
0.99999693 |
3.07E-06 |
32387.41206 |
0.540518194 |
4.00E-06 |
7671.984925 |
1526733 |
25.44555 |
0.995744681 |
0.999997682 |
2.31E-06 |
37624.34673 |
0.530453687 |
3.00E-06 |
7199.050251 |
1432611 |
23.87685 |
0.997635934 |
0.999998443 |
1.56E-06 |
40271.80402 |
0.551799185 |
2.00E-06 |
7600.959799 |
1512639 |
25.21065 |
0.99858156 |
0.999999207 |
7.93E-07 |
60514.71859 |
0.524841703 |
1.00E-06 |
10767.01508 |
2142636 |
35.7106 |
0.997635934 |
所以现在有了3个迭代次数分别是
x=1 |
n1 |
x=0.1 |
n0.1 |
x=1||x=0.1 |
n1-0.1 |
验算n1-0.1与n1和n0.1之间的关系
1:1 |
1 |
0.1 |
理论值 |
测量值 |
||
δ |
迭代次数n1 |
迭代次数n0.1 |
(n1+n0.1)/2 |
n1-0.1 |
理论值/测量值 |
|
16 |
0.5 |
17.40201005 |
17.87437186 |
17.63819095 |
16 |
1.102386935 |
1134.527638 |
0.4 |
951.2110553 |
1408.577889 |
1179.894472 |
1134.527638 |
1.039987421 |
1451.502513 |
0.3 |
1144.577889 |
1720.517588 |
1432.547739 |
1451.502513 |
0.986941274 |
1595.351759 |
0.2 |
1313.633166 |
1995.110553 |
1654.371859 |
1595.351759 |
1.036995039 |
1745.78392 |
0.1 |
1505.824121 |
2243.834171 |
1874.829146 |
1745.78392 |
1.073918212 |
2770.829146 |
0.01 |
2362.115578 |
3001.552764 |
2681.834171 |
2770.829146 |
0.967881464 |
4088.98995 |
0.001 |
4129.020101 |
4007.532663 |
4068.276382 |
4088.98995 |
0.994934307 |
7854.296482 |
1.00E-04 |
10353.37186 |
5532.668342 |
7943.020101 |
7854.296482 |
1.011296189 |
8622.899497 |
9.00E-05 |
10653.93467 |
5683.753769 |
8168.844221 |
8622.899497 |
0.947343086 |
9150.155779 |
8.00E-05 |
11292.43719 |
6131.934673 |
8712.18593 |
9150.155779 |
0.952135258 |
8925.030151 |
7.00E-05 |
11761.11055 |
6106.919598 |
8934.015075 |
8925.030151 |
1.001006711 |
9390.949749 |
6.00E-05 |
12657.69347 |
6014.688442 |
9336.190955 |
9390.949749 |
0.994168982 |
10619.74372 |
5.00E-05 |
13305.44221 |
6455.321608 |
9880.38191 |
10619.74372 |
0.930378564 |
10684.25628 |
4.00E-05 |
15844.29648 |
6724.738693 |
11284.51759 |
10684.25628 |
1.056181852 |
12772.34673 |
3.00E-05 |
17291.77387 |
7055.80402 |
12173.78894 |
12772.34673 |
0.953136428 |
14707.11055 |
2.00E-05 |
20753.56281 |
7763.41206 |
14258.48744 |
14707.11055 |
0.969496176 |
18918.50754 |
1.00E-05 |
27708.19598 |
8749.050251 |
18228.62312 |
18918.50754 |
0.963533888 |
21982.04523 |
9.00E-06 |
29358.8593 |
8879.41206 |
19119.13568 |
21982.04523 |
0.869761457 |
21742.02513 |
8.00E-06 |
30689.87437 |
9387.150754 |
20038.51256 |
21742.02513 |
0.921648855 |
20971.37186 |
7.00E-06 |
33437.22111 |
9532.648241 |
21484.93467 |
20971.37186 |
1.024488756 |
21427.84422 |
6.00E-06 |
36960.63819 |
9957.683417 |
23459.1608 |
21427.84422 |
1.094797991 |
27284.71859 |
5.00E-06 |
40669.92462 |
10661.56281 |
25665.74372 |
27284.71859 |
0.940663677 |
32387.41206 |
4.00E-06 |
44594.04523 |
11025.0402 |
27809.54271 |
32387.41206 |
0.85865282 |
37624.34673 |
3.00E-06 |
51522.10553 |
11653.63317 |
31587.86935 |
37624.34673 |
0.839559277 |
40271.80402 |
2.00E-06 |
67583.53266 |
13076.9196 |
40330.22613 |
40271.80402 |
1.001450695 |
60514.71859 |
1.00E-06 |
107224.5276 |
15184.58794 |
61204.55779 |
60514.71859 |
1.011399527 |
从数据看
这个公式是符合的很好的。
由这个实验结果猜测对一个二分类网络,分类两个对象A和B,B中有K张图片,B的图片被均匀取样,最终的迭代次数等于B中每张图片相对A的迭代次数与每张图片所占比例的乘积的累加和。
实验数据
学习率 0.1 |
权重初始化方式 |
Random rand1 =new Random(); |
int ti1=rand1.nextInt(98)+1; |
int xx=1; |
if(ti1%2==0) |
{ xx=-1;} |
tw[a][b]=xx*((double)ti1/x); |
第一层第二层和卷积核的权重的初始化的x分别为1000,1000,200 |
d2(mnist0 ; 50% x=1, 50%x=0.1)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
这个实验的数据比较多有感兴趣的朋友可以到我的资源里下载
神经网络的迭代次数是一个线性的变量吗?相关推荐
- 用两个矩阵的点积计算神经网络的迭代次数 2-8
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 在<神经网络的迭代次数是一个线性的变量吗?>中得到表达式 一个二分类网络分类两个对象 ...
- 用矩阵点积的办法构造神经网络的迭代次数1:0.6:0.1=1:1:1
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 一个二分类网络分类两个对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi,B中第i张图 ...
- 神经网络迭代次数的一个近似关系
(A,B)---m*n*k---(1,0)(0,1) 移位距离和假设 用神经网络分类A和B,把参与分类的A和B中的数字看作是组成A和B的粒子,分类的过程就是让A和B中的粒子互相交换位置,寻找最短移位路 ...
- 神经网络的迭代次数和收敛误差与谐振子的位移和时间
几乎任何随时间变化的周期函数或准周期函数F(t),都可以展成一些依赖于时间的谐和函数的无限级数---就是说, 它可以分解成许多谐振子之和.这级数(称为傅立叶级数)的每一项,可以用一个整数n来标示,n等 ...
- 带卷积核的神经网络的迭代次数与收敛标准的关系
制作一个带有卷积核的神经网络让这个网络向1,0收敛,y[0]向1收敛,y[1]向0收敛.收敛标准用δ表示,当满足条件 while(Math.abs(y[0]-1)> δ || Math.abs ...
- 由神经网络的迭代次数计算输出值并评价网络性能
在<用共振频率去理解神经网络-将乙烯模型运行300次的数据>文中将乙烯模型运行了300次,得到了300组输出与迭代次数的数据.这次计算只用了其中的150组数据,其中的6组明显不合理被剔除了 ...
- 神经网络迭代次数的线性累加现象
神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 在<神经网络的迭代次数是一个线性的变量吗?>中得到表达式 一个二分类网络分类两个对象A和 ...
- 用神经网络迭代次数曲线模拟原子光谱
大量实验表明每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 一个二分类网络分类两组对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi, ...
- 神经网络迭代次数的数学构成
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 在<神经网络的迭代次数是一个线性的变量吗?>中得到表达式 一个二分类网络分类两个对象 ...
最新文章
- Git - Tutorial官方【转】
- 实现jquery.ajax及原生的XMLHttpRequest调用WCF服务的方法
- 章节七、4-Sets
- hihocoder1479 三等分
- SpringMVC学习(四)——Spring使用到的设计模式分析
- 腾讯推出百万现金漏洞悬赏计划!
- keras时间序列数据预测_使用Keras的时间序列数据中的异常检测
- mui组件 a 锚点定位(Demo案例演示)- 代码篇
- 再谈共相式GIS和ArcObjects
- ubuntu 18 安装xgboost GPU版本
- Ubuntu 20.04安装微信,QQ,TIM
- 学习官方SSIS教程的错误总结
- java 中文繁体转换简体
- 双绞线的制作T568A线序,T568B线序
- 利用python转载朋友微信表情包
- 简历空白怎么办?计算机专业应届生和在校生怎么写简历?
- 可口又可乐的鬼马小精灵杨若兮
- 达梦数据库服务启动的三种方式
- ESP8266-Arduino编程实例-MQ3酒精传感器驱动
- vue前端实现微信支付-微信公众号JSSDK