用矩阵内积的办法构造迭代次数受控的神经网络1:0.6:0.1=4:3:2
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能。
一个二分类网络,分类两个对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi,B中第i张图片相对A的迭代次数为ni最终的迭代次数nt等于pi*ni的累加和。
由此可以构造两个矩阵一个是随机矩阵PJ
PJ表明图片集B中第i张图片被抽样到的概率
和矩阵NJ
NJ表明图片集B中第i张图片相对A的迭代次数
总的迭代次数nt等于矩阵PJ和NJ的点积
为了验证这个关系构造了等式
本文验算这个表达式是否正确
实验过程
首先用实验的方法测量n1
制作一个带一个3*3卷积核的神经网络,测试集是mnist的0和一张图片x,将28*28的图片缩小成9*9,隐藏层30个节点所以网络的结构是
这个网络分成两个部分左边的是让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但是让左右两边的权重实现同步更新,实现权重共享。前面大量实验表明这种效果相当于将两个弹性系数为k1,k2的弹簧并联成一个弹性系数为k的弹簧,并且让k1=k2=k/2的过程。
将上图简写成
d2(mnist0, x=1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
这个网络的收敛标准是
if (Math.abs(f2[0]-y[0])< δ && Math.abs(f2[1]-y[1])< δ )
本文尝试了δ从0.5到1e-6在内的26个值,训练集是mnist0,测试集是mnist的0和1
图片x就是一张二维数组,让x=1.
具体进样顺序 |
||||
进样顺序 |
迭代次数 |
|||
δ=0.5 |
||||
mnist 0-1 |
1 |
判断是否达到收敛 |
||
X |
2 |
判断是否达到收敛 |
||
梯度下降 |
||||
mnist 0-2 |
3 |
判断是否达到收敛 |
||
X |
4 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
mnist 0-4999 |
9997 |
判断是否达到收敛 |
||
X |
9998 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
如果4999图片内没有达到收敛标准再次从头循环 |
||||
mnist 0-1 |
9999 |
判断是否达到收敛 |
||
X |
10000 |
判断是否达到收敛 |
||
…… |
||||
达到收敛标准记录迭代次数,将这个过程重复199次 |
||||
δ=0.4 |
||||
…… |
用这个方法可以得到网络
d2(mnist0, x=1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
的迭代次数曲线n1。
第二步测量n0.6
用同样的办法制作另一个网络
d2(mnist0, x=0.6)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但让x=0.6.得到迭代次数曲线n0.6
第三步测量n0.1
用同样的办法制作另一个网络
d2(mnist0, x=0.1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但让x=0.1.得到迭代次数曲线n0.1
实验数据
在《测量一组对角矩阵的频率和质量》中已经将这两个迭代次数都测出来了
1 |
0.6 |
0.1 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
0.5 |
17.40201005 |
18.7839196 |
17.87437186 |
0.4 |
951.2110553 |
1117.532663 |
1408.577889 |
0.3 |
1144.577889 |
1415.271357 |
1720.517588 |
0.2 |
1313.633166 |
1623 |
1995.110553 |
0.1 |
1505.824121 |
1821.562814 |
2243.834171 |
0.01 |
2362.115578 |
2582.668342 |
3001.552764 |
0.001 |
4129.020101 |
3895.211055 |
4007.532663 |
1.00E-04 |
10353.37186 |
7057.452261 |
5532.668342 |
9.00E-05 |
10653.93467 |
7175.934673 |
5683.753769 |
8.00E-05 |
11292.43719 |
7392.497487 |
6131.934673 |
7.00E-05 |
11761.11055 |
8186.427136 |
6106.919598 |
6.00E-05 |
12657.69347 |
8620.758794 |
6014.688442 |
5.00E-05 |
13305.44221 |
9001.532663 |
6455.321608 |
4.00E-05 |
15844.29648 |
9694.778894 |
6724.738693 |
3.00E-05 |
17291.77387 |
10665.48241 |
7055.80402 |
2.00E-05 |
20753.56281 |
11822.9397 |
7763.41206 |
1.00E-05 |
27708.19598 |
15788.16583 |
8749.050251 |
9.00E-06 |
29358.8593 |
15766.86935 |
8879.41206 |
8.00E-06 |
30689.87437 |
16904.54774 |
9387.150754 |
7.00E-06 |
33437.22111 |
18446.72864 |
9532.648241 |
6.00E-06 |
36960.63819 |
18505.60302 |
9957.683417 |
5.00E-06 |
40669.92462 |
19916.76884 |
10661.56281 |
4.00E-06 |
44594.04523 |
20718.10553 |
11025.0402 |
3.00E-06 |
51522.10553 |
26158.03518 |
11653.63317 |
2.00E-06 |
67583.53266 |
26274.55779 |
13076.9196 |
1.00E-06 |
107224.5276 |
37806.51759 |
15184.58794 |
现在做第3个网络
d2(mnist0 ; 4x/9=1, 3x/9=0.6,2x/9=0.1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但让x在1,0.6,0.1之间随机。让1:0.6:0.1的比例是4:3:2.
具体进样顺序 |
||||
进样顺序 |
迭代次数 |
|||
δ=0.5 |
||||
mnist 0-1 |
1 |
判断是否达到收敛 |
||
4x/9=1, 3x/9=0.6,2x/9=0.1 |
2 |
判断是否达到收敛 |
||
梯度下降 |
||||
mnist 0-2 |
3 |
判断是否达到收敛 |
||
4x/9=1, 3x/9=0.6,2x/9=0.1 |
4 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
mnist 0-4999 |
9997 |
判断是否达到收敛 |
||
4x/9=1, 3x/9=0.6,2x/9=0.1 |
9998 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
如果4999图片内没有达到收敛标准再次从头循环 |
||||
mnist 0-1 |
9999 |
判断是否达到收敛 |
||
4x/9=1, 3x/9=0.6,2x/9=0.1 |
10000 |
判断是否达到收敛 |
||
…… |
||||
达到收敛标准记录迭代次数,将这个过程重复199次 |
||||
δ=0.4 |
||||
…… |
相当于分类两个图片集,一个图片集是mnist的0另一个图片集只有三张图片,三张图片被取样的概率是4:3:2
得到的数据
用0和x二分类 |
||||||||
1:0.6:0.1=4:3:2 |
||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时min/199次 |
最大准确率p-max |
0.498465855 |
0.504407153 |
15.40201005 |
0.509835228 |
0.5 |
715.7839196 |
142442 |
2.374033333 |
0.822695035 |
0.607975726 |
0.391821652 |
1068.59799 |
0.488159473 |
0.4 |
869.080402 |
172949 |
2.882483333 |
0.894089835 |
0.714811563 |
0.28557279 |
1373.130653 |
0.548907659 |
0.3 |
944.959799 |
188063 |
3.134383333 |
0.995744681 |
0.815422226 |
0.184650986 |
1511.291457 |
0.594190812 |
0.2 |
1010.125628 |
201031 |
3.350516667 |
0.997635934 |
0.9131958 |
0.086833451 |
1666.718593 |
0.628121696 |
0.1 |
1038.889447 |
206755 |
3.445916667 |
0.996690307 |
0.991909048 |
0.00809399 |
2555.060302 |
0.628088433 |
0.01 |
1199.376884 |
238692 |
3.9782 |
0.997635934 |
0.999220131 |
7.80E-04 |
4194.979899 |
0.578426411 |
0.001 |
1489.859296 |
296483 |
4.941383333 |
0.996690307 |
0.999925034 |
7.48E-05 |
8077.261307 |
0.535775806 |
1.00E-04 |
1884.336683 |
374999 |
6.249983333 |
0.992434988 |
0.999929893 |
7.01E-05 |
8569.532663 |
0.539446642 |
9.00E-05 |
2150.693467 |
427989 |
7.13315 |
0.99858156 |
0.999936335 |
6.37E-05 |
9286.849246 |
0.521059197 |
8.00E-05 |
2265.557789 |
450862 |
7.514366667 |
0.996690307 |
0.999946467 |
5.35E-05 |
9572.59799 |
0.530955011 |
7.00E-05 |
2363.477387 |
470350 |
7.839166667 |
0.996690307 |
0.999953363 |
4.67E-05 |
9702.276382 |
0.545488673 |
6.00E-05 |
2383.447236 |
474308 |
7.905133333 |
0.995271868 |
0.999961078 |
3.89E-05 |
10840.82915 |
0.522461005 |
5.00E-05 |
2490.025126 |
495516 |
8.2586 |
0.996217494 |
0.999968703 |
3.13E-05 |
12212.41709 |
0.550059993 |
4.00E-05 |
2731.316583 |
543536 |
9.058933333 |
0.996217494 |
0.999976775 |
2.32E-05 |
13375.83417 |
0.530218468 |
3.00E-05 |
2159.150754 |
429681 |
7.16135 |
0.99858156 |
0.999983578 |
1.64E-05 |
15823.60302 |
0.534046117 |
2.00E-05 |
3254.648241 |
647681 |
10.79468333 |
0.989598109 |
0.999992049 |
7.94E-06 |
20360.31658 |
0.517267187 |
1.00E-05 |
3999.110553 |
795827 |
13.26378333 |
0.963120567 |
0.999992974 |
7.02E-06 |
20639.1005 |
0.514891241 |
9.00E-06 |
4148.809045 |
825613 |
13.76021667 |
0.991962175 |
0.999993747 |
6.26E-06 |
21407.29146 |
0.524893973 |
8.00E-06 |
4191.396985 |
834088 |
13.90146667 |
0.997635934 |
0.999994533 |
5.47E-06 |
25353.76382 |
0.511042209 |
7.00E-06 |
4840.41206 |
963258 |
16.0543 |
0.992434988 |
0.999995284 |
4.72E-06 |
24650.38693 |
0.527557409 |
6.00E-06 |
4721.844221 |
939647 |
15.66078333 |
0.989598109 |
0.999996007 |
3.99E-06 |
27221.62312 |
0.53021134 |
5.00E-06 |
5143.045226 |
1023466 |
17.05776667 |
0.988179669 |
0.999996817 |
3.18E-06 |
29481.81407 |
0.539643846 |
4.00E-06 |
5316.748744 |
1058033 |
17.63388333 |
0.996217494 |
0.999997542 |
2.46E-06 |
35670.74874 |
0.523297338 |
3.00E-06 |
7065.874372 |
1406110 |
23.43516667 |
0.997635934 |
0.999998413 |
1.59E-06 |
43239.72362 |
0.521408461 |
2.00E-06 |
9577.733668 |
1905969 |
31.76615 |
0.990543735 |
0.999999173 |
8.26E-07 |
64535.65327 |
0.510597907 |
1.00E-06 |
13978.8995 |
2781817 |
46.36361667 |
0.978250591 |
所以现在有了3个迭代次数分别是
x=1 |
n1 |
|||||||
x=0.6 |
n0.6 |
|||||||
x=0.1 |
n0.1 |
|||||||
4x/9=1||3x/9=0.6||2x/9=0.1 |
n1-0.6-0.1 |
|||||||
1 |
0.6 |
0.1 |
理论值 |
实测值 |
理论值/实测值 |
|||
δ |
迭代次数n |
迭代次数n |
迭代次数n |
n1*4/9+n0.6*3/9+n0.1*2/9 |
|
|
||
0.5 |
17.40201005 |
18.7839196 |
17.87437186 |
17.96761586 |
15.40201005 |
1.166576038 |
||
0.4 |
951.2110553 |
1117.532663 |
1408.577889 |
1108.288666 |
1068.59799 |
1.037142757 |
||
0.3 |
1144.577889 |
1415.271357 |
1720.517588 |
1362.795645 |
1373.130653 |
0.992473398 |
||
0.2 |
1313.633166 |
1623 |
1995.110553 |
1568.194863 |
1511.291457 |
1.037652172 |
||
0.1 |
1505.824121 |
1821.562814 |
2243.834171 |
1775.072585 |
1666.718593 |
1.06501037 |
||
0.01 |
2362.115578 |
2582.668342 |
3001.552764 |
2577.730318 |
2555.060302 |
1.008872596 |
||
0.001 |
4129.020101 |
3895.211055 |
4007.532663 |
4024.086544 |
4194.979899 |
0.959262414 |
||
1.00E-04 |
10353.37186 |
7057.452261 |
5532.668342 |
8183.464545 |
8077.261307 |
1.013148422 |
||
9.00E-05 |
10653.93467 |
7175.934673 |
5683.753769 |
8390.116695 |
8569.532663 |
0.979063506 |
||
8.00E-05 |
11292.43719 |
7392.497487 |
6131.934673 |
8845.67895 |
9286.849246 |
0.952495159 |
||
7.00E-05 |
11761.11055 |
8186.427136 |
6106.919598 |
9313.062535 |
9572.59799 |
0.972887668 |
||
6.00E-05 |
12657.69347 |
8620.758794 |
6014.688442 |
9835.825237 |
9702.276382 |
1.013764693 |
||
5.00E-05 |
13305.44221 |
9001.532663 |
6455.321608 |
10348.55667 |
10840.82915 |
0.954590884 |
||
4.00E-05 |
15844.29648 |
9694.778894 |
6724.738693 |
11767.88889 |
12212.41709 |
0.96360031 |
||
3.00E-05 |
17291.77387 |
10665.48241 |
7055.80402 |
12808.35008 |
13375.83417 |
0.957573929 |
||
2.00E-05 |
20753.56281 |
11822.9397 |
7763.41206 |
14889.98827 |
15823.60302 |
0.940998599 |
||
1.00E-05 |
27708.19598 |
15788.16583 |
8749.050251 |
19521.7091 |
20360.31658 |
0.958811668 |
||
9.00E-06 |
29358.8593 |
15766.86935 |
8879.41206 |
20277.20771 |
20639.1005 |
0.98246567 |
||
8.00E-06 |
30689.87437 |
16904.54774 |
9387.150754 |
21360.82691 |
21407.29146 |
0.997829499 |
||
7.00E-06 |
33437.22111 |
18446.72864 |
9532.648241 |
23128.26298 |
25353.76382 |
0.912222073 |
||
6.00E-06 |
36960.63819 |
18505.60302 |
9957.683417 |
24808.30318 |
24650.38693 |
1.006406238 |
||
5.00E-06 |
40669.92462 |
19916.76884 |
10661.56281 |
27083.68118 |
27221.62312 |
0.994932634 |
||
4.00E-06 |
44594.04523 |
20718.10553 |
11025.0402 |
29175.61977 |
29481.81407 |
0.989614129 |
||
3.00E-06 |
51522.10553 |
26158.03518 |
11653.63317 |
34207.75489 |
35670.74874 |
0.958986175 |
||
2.00E-06 |
67583.53266 |
26274.55779 |
13076.9196 |
41701.29369 |
43239.72362 |
0.964420912 |
||
1.00E-06 |
107224.5276 |
37806.51759 |
15184.58794 |
63631.87102 |
64535.65327 |
0.985995613 |
从数值看
这个公式还是符合的很好的。
表明神经网络的迭代次数可以被看作是一个线性变量可以用概率矩阵和迭代次数矩阵的点积来计算。
将两组图片分组应该至少区分点的分布,数值大小和对称关系这3个属性,在实验
《图片的三种可能属性:点的分布规律,数值大小,对称关系》以表明迭代次数曲线不携带对称关系属性。所以尽管迭代次数可能是连续的,有很多种可能构造出同一个值,但并不表明有相同的分辨能力,
实验参数
学习率 0.1 |
权重初始化方式 |
Random rand1 =new Random(); |
int ti1=rand1.nextInt(98)+1; |
int xx=1; |
if(ti1%2==0) |
{ xx=-1;} |
tw[a][b]=xx*((double)ti1/x); |
第一层第二层和卷积核的权重的初始化的x分别为1000,1000,200 |
用矩阵内积的办法构造迭代次数受控的神经网络1:0.6:0.1=4:3:2相关推荐
- 人工构造迭代次数高度简并的神经网络训练集
(x)---81*30*2---(1,0) 做一个结构是81*30*2的网络,人工构造一个训练集x,并让这个训练集向(1,0)收敛,不分类.让收敛标准为1e-4.使得迭代次数高度简并,有明显的谱线特征 ...
- 用矩阵点积的办法构造神经网络的迭代次数1:0.6:0.1=1:1:1
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 一个二分类网络分类两个对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi,B中第i张图 ...
- 用数学方法构造神经网路的迭代次数1-9
神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 一个二分类网络分类两组对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi,B中第i张图片相 ...
- 用两个矩阵的点积计算神经网络的迭代次数 2-8
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 在<神经网络的迭代次数是一个线性的变量吗?>中得到表达式 一个二分类网络分类两个对象 ...
- 神经网络迭代次数的数学构成
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 在<神经网络的迭代次数是一个线性的变量吗?>中得到表达式 一个二分类网络分类两个对象 ...
- 由神经网络的迭代次数计算输出值并评价网络性能
在<用共振频率去理解神经网络-将乙烯模型运行300次的数据>文中将乙烯模型运行了300次,得到了300组输出与迭代次数的数据.这次计算只用了其中的150组数据,其中的6组明显不合理被剔除了 ...
- 神经网络迭代次数的线性累加现象
神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 在<神经网络的迭代次数是一个线性的变量吗?>中得到表达式 一个二分类网络分类两个对象A和 ...
- 神经网络的迭代次数是一个线性的变量吗?
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 如果一个神经网络对图片1的迭代次数是n1对图片2的迭代次数是n2,做一个网络向网络输入50%的1 ...
- 输入对5层网络迭代次数的影响
制作一个5层网络和一个3层网络 图中左边的5层网络很显然可以看作是由两个右边的3层网络组合而成,所以左边的网络的迭代次数和右边的网络的迭代次数有什么关系? 在<测量一组5层网络的迭代次数> ...
最新文章
- MyBatis整合第三方缓存
- sql注入原理及解决方案
- ASP.NET页面的生命周期
- monotouch Single View Application
- java8 Map新增方法的使用
- Word2Vec训练同义词模型
- quartz cron 每周一_quartz框架和关闭超时订单
- Visual C# 2005——超好用的DropDown与DropDownClosed事件
- 安卓 linux arm go,go arm、android版本
- C语言回文数判断,结果写入文件中
- POJ 3422 Kaka's Matrix Travels(拆点+最大费用流)题解
- Fuchsia 系统的编译和探索
- YuniKorn 介绍
- 用NDK交叉编译pixman-0.34
- 如何在Win10系统下的IntelliJ IDEA 2018.3.5下载与安装以及激活教程
- Java Class
- PHP实现图片合并功能(根据群用户头像生成群logo图片)
- php每四位隔开,php数字每三位加逗号的功能函数
- 用python画一个汉字_python使用reportlab画图示例(含中文汉字)
- Django框架学习(一)Django框架安装和项目创建详解
热门文章
- 1003 我要通过! (20 分) python版答案(全部代码都有注释)
- 各个版本通道_绝地求生各个参数对画面的影响,软硬件优化帧数,拒绝做睁眼瞎...
- mailmessage html编码,C#MailMessage顯示HTML標記的AlternateViews
- mysql自动转库_JAVA自动操作0racle数据库转mysql数据库
- 中缀表达式转化为后缀表达式
- [NOI2016]区间-线段树
- U盘加载速度慢的解决方法
- 十三、IntelliJ IDEA 中的版本控制介绍(下)
- C/S和B/S的区别
- laravel在wamp中输入地址后总是无法访问