用两个矩阵的点积计算神经网络的迭代次数 2-8
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能。
在《神经网络的迭代次数是一个线性的变量吗?》中得到表达式
一个二分类网络分类两个对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi,B中第i张图片相对A的迭代次数为ni,最终的迭代次数nt等于pi*ni的累加和。
由此可以构造两个矩阵一个是随机矩阵PJ和迭代次数矩阵NJ
总的迭代次数nt等于矩阵PJ和NJ的点积
PJ表明图片集B中第i张图片被抽样到的概率为pi
NJ表明图片集B中第i张图片相对A的迭代次数为ni
由此总迭代次数nt可以通过构造矩阵PJ和矩阵NJ的方法精确的控制
本文分别制作两个矩阵让
本文验证这个乘法关系是否成立
制作一个二分类网络区分数据集mnist0和数据集B,其中B中只有两张图片,两张图片被抽样到的概率比是8:2.
本文验算这个表达式是否正确
实验过程
首先用实验的方法测量n1
制作一个带一个3*3卷积核的神经网络,测试集是mnist的0和一张图片x,将28*28的图片缩小成9*9,隐藏层30个节点所以网络的结构是
这个网络分成两个部分左边的是让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但是让左右两边的权重实现同步更新,实现权重共享。前面大量实验表明这种效果相当于将两个弹性系数为k1,k2的弹簧并联成一个弹性系数为k的弹簧,并且让k1=k2=k/2的过程。
将上图简写成
S(mnist0)81-(con3*3)49-30-2-(1,0)
S(x)81-(con3*3)49-30-2-(0,1)
w=w,w1=w1,w2=w2
进一步简写成
d2(mnist0, x=1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
这个网络的收敛标准是
if (Math.abs(f2[0]-y[0])< δ && Math.abs(f2[1]-y[1])< δ )
本文尝试了δ从0.5到1e-6在内的26个值,训练集是mnist0
图片x就是一张二维数组,让x=1.
具体进样顺序 |
||||
进样顺序 |
迭代次数 |
|||
δ=0.5 |
||||
mnist 0-1 |
1 |
判断是否达到收敛 |
||
X |
2 |
判断是否达到收敛 |
||
梯度下降 |
||||
mnist 0-2 |
3 |
判断是否达到收敛 |
||
X |
4 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
mnist 0-4999 |
9997 |
判断是否达到收敛 |
||
X |
9998 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
如果4999图片内没有达到收敛标准再次从头循环 |
||||
mnist 0-1 |
9999 |
判断是否达到收敛 |
||
X |
10000 |
判断是否达到收敛 |
||
…… |
||||
达到收敛标准记录迭代次数,将这个过程重复199次 |
||||
δ=0.4 |
||||
…… |
用这个方法可以得到网络
d2(mnist0, x=1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
的迭代次数曲线n1。
第二步测量n0.1
用同样的办法制作另一个网络
d2(mnist0, x=0.1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但让x=0.1.得到迭代次数曲线n0.1
实验数据
在《测量一组对角矩阵的频率和质量》中已经将这两个迭代次数都测出来了
1 |
0.1 |
|
δ |
迭代次数n1 |
迭代次数n0.1 |
0.5 |
17.40201005 |
17.87437186 |
0.4 |
951.2110553 |
1408.577889 |
0.3 |
1144.577889 |
1720.517588 |
0.2 |
1313.633166 |
1995.110553 |
0.1 |
1505.824121 |
2243.834171 |
0.01 |
2362.115578 |
3001.552764 |
0.001 |
4129.020101 |
4007.532663 |
1.00E-04 |
10353.37186 |
5532.668342 |
9.00E-05 |
10653.93467 |
5683.753769 |
8.00E-05 |
11292.43719 |
6131.934673 |
7.00E-05 |
11761.11055 |
6106.919598 |
6.00E-05 |
12657.69347 |
6014.688442 |
5.00E-05 |
13305.44221 |
6455.321608 |
4.00E-05 |
15844.29648 |
6724.738693 |
3.00E-05 |
17291.77387 |
7055.80402 |
2.00E-05 |
20753.56281 |
7763.41206 |
1.00E-05 |
27708.19598 |
8749.050251 |
9.00E-06 |
29358.8593 |
8879.41206 |
8.00E-06 |
30689.87437 |
9387.150754 |
7.00E-06 |
33437.22111 |
9532.648241 |
6.00E-06 |
36960.63819 |
9957.683417 |
5.00E-06 |
40669.92462 |
10661.56281 |
4.00E-06 |
44594.04523 |
11025.0402 |
3.00E-06 |
51522.10553 |
11653.63317 |
2.00E-06 |
67583.53266 |
13076.9196 |
1.00E-06 |
107224.5276 |
15184.58794 |
现在做第3个网络
d2(mnist0 ; 80% x=1, 20%x=0.1)81-con(3*3)49-30-2-(2*k) ,k∈{0,1}
让mnist 0向1,0收敛,右边的是让x向 0,1收敛。但让x在1和0.1之间随机。
让1与0.1的比例是8:2.
具体进样顺序 |
||||
进样顺序 |
迭代次数 |
|||
δ=0.5 |
||||
mnist 0-1 |
1 |
判断是否达到收敛 |
||
80% x=1,20% x=0.1 |
2 |
判断是否达到收敛 |
||
梯度下降 |
||||
mnist 0-2 |
3 |
判断是否达到收敛 |
||
80% x=1,20% x=0.1 |
4 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
mnist 0-4999 |
9997 |
判断是否达到收敛 |
||
80% x=1,20% x=0.1 |
9998 |
判断是否达到收敛 |
||
梯度下降 |
||||
…… |
||||
如果4999图片内没有达到收敛标准再次从头循环 |
||||
mnist 0-1 |
9999 |
判断是否达到收敛 |
||
80% x=1,20% x=0.1 |
10000 |
判断是否达到收敛 |
||
…… |
||||
达到收敛标准记录迭代次数,将这个过程重复199次 |
||||
δ=0.4 |
||||
…… |
相当于分类两个图片集,一个图片集是mnist的0另一个图片集只有两张图片,两张图片被取样的概率是8:2
得到的数据
用0和x二分类 |
||||||||
1:0.1=8:2 |
||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时min/199次 |
最大准确率p-max |
0.50566328 |
0.497763951 |
17.31155779 |
0.505501503 |
0.5 |
921.0653266 |
183323 |
3.055383333 |
0.861938534 |
0.606609999 |
0.393211865 |
977.2964824 |
0.477251506 |
0.4 |
1112.351759 |
221358 |
3.6893 |
0.963120567 |
0.713338671 |
0.286631874 |
1244.819095 |
0.545928223 |
0.3 |
1166.467337 |
232127 |
3.868783333 |
0.992434988 |
0.814994506 |
0.184507552 |
1367.894472 |
0.579702294 |
0.2 |
1188.100503 |
236432 |
3.940533333 |
0.997163121 |
0.909871883 |
0.090147713 |
1622.60804 |
0.594867957 |
0.1 |
1234.457286 |
245672 |
4.094533333 |
0.995744681 |
0.991991547 |
0.008022444 |
2451.462312 |
0.606966273 |
0.01 |
1401.79397 |
278973 |
4.64955 |
0.997163121 |
0.999243349 |
7.56E-04 |
4189.592965 |
0.54157549 |
0.001 |
1755.160804 |
349277 |
5.821283333 |
0.996690307 |
0.999918398 |
8.18E-05 |
9589.763819 |
0.513579719 |
1.00E-04 |
2860.809045 |
569301 |
9.48835 |
0.992907801 |
0.999927347 |
7.27E-05 |
9769.472362 |
0.528847547 |
9.00E-05 |
2575.964824 |
512617 |
8.543616667 |
0.995271868 |
0.999937071 |
6.28E-05 |
10447.81407 |
0.520938023 |
8.00E-05 |
3024.321608 |
601840 |
10.03066667 |
0.993853428 |
0.999943494 |
5.65E-05 |
11190.78894 |
0.520569752 |
7.00E-05 |
3179.547739 |
632730 |
10.5455 |
0.995744681 |
0.999951392 |
4.86E-05 |
11462.45729 |
0.526839873 |
6.00E-05 |
3200.095477 |
636827 |
10.61378333 |
0.995271868 |
0.999960481 |
3.95E-05 |
12531.89447 |
0.509782957 |
5.00E-05 |
3412.919598 |
679175 |
11.31958333 |
0.987234043 |
0.999967762 |
3.23E-05 |
13652.90955 |
0.520239495 |
4.00E-05 |
3205.512563 |
637897 |
10.63161667 |
0.993853428 |
0.999975773 |
2.43E-05 |
15084.02513 |
0.516088718 |
3.00E-05 |
3937.758794 |
783620 |
13.06033333 |
0.997163121 |
0.999983453 |
1.65E-05 |
17850.52764 |
0.509438445 |
2.00E-05 |
4596.673367 |
914740 |
15.24566667 |
0.994326241 |
0.999991715 |
8.29E-06 |
25200.21608 |
0.516967818 |
1.00E-05 |
4941.844221 |
983443 |
16.39071667 |
0.989598109 |
0.99999284 |
7.16E-06 |
25605.17085 |
0.515739454 |
9.00E-06 |
4968.120603 |
988673 |
16.47788333 |
0.989598109 |
0.999993474 |
6.52E-06 |
28406.36683 |
0.524064768 |
8.00E-06 |
5459.522613 |
1086445 |
18.10741667 |
0.994326241 |
0.999994401 |
5.60E-06 |
28608.58794 |
0.521154234 |
7.00E-06 |
5223.728643 |
1039538 |
17.32563333 |
0.986761229 |
0.999995111 |
4.89E-06 |
32479.66332 |
0.509533483 |
6.00E-06 |
6074.311558 |
1208788 |
20.14646667 |
0.995271868 |
0.999995947 |
4.06E-06 |
36849.28141 |
0.495180394 |
5.00E-06 |
6820.743719 |
1357328 |
22.62213333 |
0.98250591 |
0.999996768 |
3.23E-06 |
36909.13065 |
0.504486974 |
4.00E-06 |
6836.849246 |
1360549 |
22.67581667 |
0.98392435 |
0.999997515 |
2.48E-06 |
43731.97487 |
0.494505625 |
3.00E-06 |
7944.974874 |
1581050 |
26.35083333 |
0.991962175 |
0.999998265 |
1.74E-06 |
62934.13568 |
0.491236323 |
2.00E-06 |
10640.96985 |
2117553 |
35.29255 |
0.990070922 |
0.999999125 |
8.74E-07 |
93680.26633 |
0.497100158 |
1.00E-06 |
16180.28141 |
3219876 |
53.6646 |
0.992907801 |
所以现在有了3个迭代次数分别是
x=1 |
n1 |
x=0.1 |
n0.1 |
0.8x=1||0.2x=0.1 |
n1-0.1 |
验算n1-0.1与n1和n0.1之间的关系
1 |
0.1 |
理论值 |
实测值 |
||
δ |
迭代次数n1 |
迭代次数n0.1 |
0.8*n1+0.2*n0.1 |
|
理论值/实测值 |
0.5 |
17.40201005 |
17.87437186 |
17.49648241 |
17.31155779 |
1.010682148 |
0.4 |
951.2110553 |
1408.577889 |
1042.684422 |
977.2964824 |
1.066906963 |
0.3 |
1144.577889 |
1720.517588 |
1259.765829 |
1244.819095 |
1.012007153 |
0.2 |
1313.633166 |
1995.110553 |
1449.928643 |
1367.894472 |
1.059971125 |
0.1 |
1505.824121 |
2243.834171 |
1653.426131 |
1622.60804 |
1.018992936 |
0.01 |
2362.115578 |
3001.552764 |
2490.003015 |
2451.462312 |
1.015721516 |
0.001 |
4129.020101 |
4007.532663 |
4104.722613 |
4189.592965 |
0.979742578 |
1.00E-04 |
10353.37186 |
5532.668342 |
9389.231156 |
9589.763819 |
0.979088884 |
9.00E-05 |
10653.93467 |
5683.753769 |
9659.898492 |
9769.472362 |
0.988784055 |
8.00E-05 |
11292.43719 |
6131.934673 |
10260.33668 |
10447.81407 |
0.982055827 |
7.00E-05 |
11761.11055 |
6106.919598 |
10630.27236 |
11190.78894 |
0.949912684 |
6.00E-05 |
12657.69347 |
6014.688442 |
11329.09246 |
11462.45729 |
0.988365076 |
5.00E-05 |
13305.44221 |
6455.321608 |
11935.41809 |
12531.89447 |
0.952403335 |
4.00E-05 |
15844.29648 |
6724.738693 |
14020.38492 |
13652.90955 |
1.026915536 |
3.00E-05 |
17291.77387 |
7055.80402 |
15244.5799 |
15084.02513 |
1.010644027 |
2.00E-05 |
20753.56281 |
7763.41206 |
18155.53266 |
17850.52764 |
1.017086611 |
1.00E-05 |
27708.19598 |
8749.050251 |
23916.36683 |
25200.21608 |
0.949054038 |
9.00E-06 |
29358.8593 |
8879.41206 |
25262.96985 |
25605.17085 |
0.986635473 |
8.00E-06 |
30689.87437 |
9387.150754 |
26429.32965 |
28406.36683 |
0.930401617 |
7.00E-06 |
33437.22111 |
9532.648241 |
28656.30653 |
28608.58794 |
1.001667981 |
6.00E-06 |
36960.63819 |
9957.683417 |
31560.04724 |
32479.66332 |
0.971686404 |
5.00E-06 |
40669.92462 |
10661.56281 |
34668.25226 |
36849.28141 |
0.940812166 |
4.00E-06 |
44594.04523 |
11025.0402 |
37880.24422 |
36909.13065 |
1.02631093 |
3.00E-06 |
51522.10553 |
11653.63317 |
43548.41106 |
43731.97487 |
0.995802526 |
2.00E-06 |
67583.53266 |
13076.9196 |
56682.21005 |
62934.13568 |
0.900659228 |
1.00E-06 |
107224.5276 |
15184.58794 |
88816.5397 |
93680.26633 |
0.948081631 |
从数值看
这个公式还是符合的很好的。
表明神经网络的迭代次数可以被看作是一个线性变量可以用概率矩阵和迭代次数矩阵的点积来计算。
实验参数
学习率 0.1 |
权重初始化方式 |
Random rand1 =new Random(); |
int ti1=rand1.nextInt(98)+1; |
int xx=1; |
if(ti1%2==0) |
{ xx=-1;} |
tw[a][b]=xx*((double)ti1/x); |
第一层第二层和卷积核的权重的初始化的x分别为1000,1000,200 |
用两个矩阵的点积计算神经网络的迭代次数 2-8相关推荐
- 用矩阵点积的办法构造神经网络的迭代次数1:0.6:0.1=1:1:1
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 一个二分类网络分类两个对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi,B中第i张图 ...
- 由神经网络的迭代次数计算输出值并评价网络性能
在<用共振频率去理解神经网络-将乙烯模型运行300次的数据>文中将乙烯模型运行了300次,得到了300组输出与迭代次数的数据.这次计算只用了其中的150组数据,其中的6组明显不合理被剔除了 ...
- 计算多列迭代次数的一种平均列近似方法
比较多列训练集的迭代次数,把多列训练集用单列近似,再通过计算单列的斥力比较迭代次数的大小顺序. ( A, B )---3*30*2---( 1, 0 )( 0, 1 ) 让网络的输入有3个节点,AB各 ...
- 动画演示:两个矩阵的欧式距离计算
文章目录 1. 动画演示 2. 计算公式 1. 动画演示 A−(a,b)A - (a,b)A−(a,b)和B−(c,d)B - (c,d)B−(c,d)的欧氏距离矩阵C−(a,c)C - (a,c)C ...
- 用矩阵内积的办法构造迭代次数受控的神经网络1:0.6:0.1=4:3:2
每个神经网络对应每个收敛标准δ都有一个特征的迭代次数n,因此可以用迭代次数曲线n(δ)来评价网络性能. 一个二分类网络,分类两个对象A和B,B中有K张图片,B的第i张图片被取样的概率为pi,B中第i张 ...
- 决定迭代次数的两种效应
由于对称导致的空间结构耦合的不规则效应,和等位点数值差导致的线性效应共同决定了神经网络的迭代次数.而增加训练集图片数量和扩大图片的尺寸都可能弱化对称性,并同时弱化结构耦合的不规则效应,使得线性效应占优 ...
- 决定神经网络迭代次数的两个因素
假设1:完全相同的两个对象无法被分成两类,与之对应的分类迭代次数为无穷大. 推论:相等收敛误差下迭代次数越大表明二者差异越小. 如果完全相同的两个对象可以被分成两类,则表明这不是完全相同的两个对象,这 ...
- python矩阵的平方_NumPy之计算两个矩阵的成对平方欧氏距离
问题描述 设 (; 表示纵向连接) 和 , 计算矩阵 中每一个行向量和矩阵 中每一个行向量的平方欧氏距离 (pairwise squared Euclidean distance), 即计算: (这是 ...
- 使用Kronecker积计算手眼标定矩阵AX=XB
使用Kronecker积计算AX=XB 构造 A B 矩阵 求解AX=XB 求解 RX 构造线性方程组Ax=0 SVD值分解求解线性方程组Ax=0 求解tX平移矩阵 X 误差计算 MATLAB代码 使 ...
最新文章
- java图片文件字符串jsp_将图片转成base64字符串并在JSP页面显示的Java代码
- token 生成有哪几种常用方式_实现一个线程有哪几种方式,各有什么优缺点,比较常用的是那种?...
- Android 切换系统语言源码分析
- 和鸿蒙系统合作品牌,华为:明年将有超40家主流品牌、1亿台设备成为鸿蒙系统新入口...
- html中字体响应式怎么写,css字体单位之间的区分以及字体响应式实现_html/css_WEB-ITnose...
- 下载不了java应用程序_Java 7u45 - java webstart不会下载我的jar并执行应用程序,除非我显示java控制台...
- 程序员的幸福感和颈椎病
- 即时通讯成为热门传播媒体
- paip.账务系统的安全性
- 实例88:构建InfoGAN生成MNIST模拟数据
- 安卓按键命令库教程(紫猫版)
- 本科生学习的一些心得
- pytorch-tenor-细节
- Django中select_related的作用和用法
- Java8增加功能--Effectively final 功能
- 股市中上涨下跌天数统计
- 嵌入式入门学习笔记2
- 用 VeraCrypt 加密闪存盘
- SQL Server 2012 下载与安装
- re:从零开始的Qt世界冒险生活
热门文章
- dataframe筛选数据根据某一个列的数据在另外的一个数组中
- matlab条件判断配合输出
- 判断电离层是否存在自由电子
- 第一章:1.2.2系统分类(一)
- 5.Multil-task lasso(多任务lasso回归分析)
- 指数哥伦布编码 java_H.264学习笔记6——指数哥伦布编码
- [BZOJ5249][九省联考2018]IIIDX(线段树)
- perl unload gbk oracle 数据库
- ajax 跨域 headers JavaScript ajax 跨域请求 +设置headers 实践
- javac环境变量配置(转)