(0,3)-81*n*2-(1,0)(0,1)

制作一个二分类的网络分类mnist的0和3,收敛标准1e-6,收敛次数是1999次,隐藏层节点数从3到1000共实验了79组值。统计每次收敛的迭代次数,观察分辨准确率和迭代次数对同一收敛标准的对应规律。

隐藏层节点数

迭代次数的均值

平均分类准确率

δ

耗时ms/次

最大峰值占比%

不同峰值数量

3

225528.8639

0.99216191

1E-06

1017.794397

3.2

920

4

180492.6073

0.992873572

1E-06

874.8694347

1

977

5

153176.2796

0.993332093

1E-06

849.8394197

2.5

701

6

140841.2446

0.993333601

1E-06

823.3416708

2.9

505

7

132496.8744

0.993346673

1E-06

850.7328664

3.7

376

8

127019.8734

0.993389157

1E-06

890.1555778

6

292

9

121743.1321

0.993315502

1E-06

855.1110555

6.4

245

10

117795.6293

0.99328609

1E-06

869.6633317

5.6

205

20

91179.56428

0.992468345

1E-06

1202.25913

14.3

87

30

71645.70185

0.990856735

1E-06

1283.252626

34.9

47

40

52466.62381

0.98786001

1E-06

1286.266133

40.5

21

50

28288.04652

0.985970372

1E-06

844.4602301

35.3

10

60

14117.54027

0.984868816

1E-06

533.1965983

53.1

7

70

10979.98449

0.985028192

1E-06

445.3021511

62

6

80

10638.81541

0.984156903

1E-06

524.6763382

69.6

8

90

9757.722361

0.982007335

1E-06

570.4182091

29.2

7

100

8878.603802

0.977207951

1E-06

648.2546273

90.6

7

110

7560.581791

0.970227073

1E-06

551.4747374

50.2

7

120

6046.066533

0.961413621

1E-06

571.1925963

89.1

3

130

5021.085543

0.970240899

1E-06

508.1095548

53.1

3

140

4089.464732

0.980966865

1E-06

427.3106553

91.8

3

150

3914.265133

0.982963341

1E-06

450.4702351

99.2

3

160

3897

0.983089283

1E-06

538.0455228

100

1

200

3871.009005

0.977139575

1E-06

639.2601301

93.1

4

210

3696.18009

0.974980204

1E-06

671.5392696

72.3

6

215

3286.678339

0.94333423

1E-06

641.4507254

38

4

220

2702.929465

0.853601172

1E-06

567.7673837

86.5

4

240

2596

0.814743804

1E-06

601.4292146

100

1

260

2596

0.795055317

1E-06

640.7138569

100

1

280

2595.533267

0.783086015

1E-06

722.8294147

99.9

2

290

2566.129065

0.782319803

1E-06

765.3481741

96.8

2

295

2482.834417

0.797667929

1E-06

762.1890945

87.4

4

300

2293.785393

0.837000661

1E-06

730.7393697

66

5

301

2244.909955

0.847812097

1E-06

655.6713357

60.3

4

302

2177.41921

0.864338451

1E-06

677.3711856

51.4

6

305

2022.012006

0.899884113

1E-06

695.0115058

57.8

5

310

1803.558779

0.944903105

1E-06

659.4802401

81.1

6

320

1673.505253

0.96343071

1E-06

611.7878939

98.2

5

340

1663

0.962203715

1E-06

685.9094547

100

1

360

1663

0.960327903

1E-06

733.4092046

100

1

380

1663

0.958766821

1E-06

717.7158579

100

1

400

1663

0.957284421

1E-06

859.5852926

100

1

420

1662.861931

0.955882967

1E-06

817.0575288

99.9

2

440

1646.682341

0.951288207

1E-06

834.7243622

93.9

3

460

1472.213607

0.915313938

1E-06

897.7098549

68.3

5

480

1389.0005

0.89510509

1E-06

824.6728364

83.7

5

500

1385.537269

0.880267772

1E-06

932.2776388

100

1

520

1378.798899

0.854598153

1E-06

778.1770885

79.2

3

540

1353.688344

0.779361037

1E-06

839.8534267

97.8

2

560

1352.927464

0.767775345

1E-06

756.9969985

99.9

2

580

1346.689345

0.766967906

1E-06

854.7538769

95.6

2

590

1332.218609

0.784895966

1E-06

824.3956978

85.8

3

595

1315.088044

0.810554775

1E-06

887.1685843

74.1

3

600

1297.293647

0.833875983

1.00E-06

864.6323162

62.6

3

610

1251.265133

0.884327842

1E-06

799.5957979

58

3

620

1202.116558

0.909436879

1E-06

847.2341171

67.3

3

630

1148.246623

0.891357236

1E-06

868.3021511

56.9

3

640

1102.215608

0.847185402

1E-06

830.2316158

62.9

5

650

1062.614307

0.797253149

1E-06

859.0775388

85.6

5

660

1042.4007

0.755573515

1E-06

810.5287644

88.6

5

670

1018.533767

0.671164728

1E-06

832.953977

65.4

4

680

993.12006

0.563521208

1E-06

856.5077539

74.2

3

690

978.7268634

0.510132453

1E-06

848.3081541

94.9

3

700

968.6573287

0.512699314

1E-06

877.2486243

96

3

720

920.2506253

0.606602045

1E-06

815.4517259

74.1

2

740

850.9024512

0.746866901

1E-06

827.106053

57.6

2

760

792.8514257

0.86296314

1E-06

873.7658829

83.1

4

780

604.5072536

0.741864148

1E-06

758.8714357

55.1

4

800

405.188094

0.516227209

1E-06

690.7433717

95.1

2

820

387

0.493433651

1E-06

728.7133567

100

1

840

387

0.493246623

1E-06

749.058029

100

1

860

387

0.493043758

1E-06

766.5687844

100

1

880

386.877939

0.492933401

1E-06

820.8094047

99.9

2

900

379.066033

0.492794136

1E-06

797.971986

93.5

2

920

349.4052026

0.492643055

1E-06

743.5397699

69.2

2

940

303.2661331

0.492528676

1E-06

793.4982491

68.6

2

960

275.1310655

0.492479908

1E-06

792.1855928

91.7

2

980

266.5837919

0.492474378

1E-06

800.042021

98.5

3

1000

264.821911

0.492487953

1E-06

819.8394197

98.8

3

一个很意外的发现,网络的平均分辨准确率随着隐藏层节点数n的增加并不是简单的线性变化的,在3-1000这个区段至少发现了5个精细结构

分别是n=100,290,580,690.在这个4个节点数分辨准确率对隐藏层节点数有明确的拐点,也就表明隐藏层节点数对网络的分辨准确率不存在简单的线性关系。当n=6时pave=0.993389156890011是最大值,也就是在3-1000这个区段上至少有1个峰,4个谷。

峰值占比

当n=6时网络pave取得最大值,这个网络收敛了1999次产生了505个不同的峰值,其中最大峰136347也只不过占了总数的2.9%,综合所有实验数据表明pave比较大的网络峰值占比都显著的比较低.

峰值占比低于10的网络的pave都显著的更高。当n>800以后峰值占比接近100,也就是只有一个特征主峰。这时的pave约为0.5.如果不同的峰值越多表明网络的不同特征越多,则这个实验表明随着n的增加网络的特征反而降低了。或者说隐藏层节点数越小网络可以表现出越多的特征,不同的特征越多越有利分类。

不同峰值数量

当n=4时不同峰值数量为977是实验的79组数据中不同峰值数量最大的。

特别是当n大于10以后不同峰值数量就已经下降到个位数。表明网络随着n的增加正变得更加特征单一,而单一的特征却不利于分类。

观察不同峰值数量表格

隐藏层节点数 n

峰值占比%

不同峰值数量

1/n^2

不同峰值数量/(1/n^2)

3

3.2

920

   

4

1

977

0.0625

15632

5

2.5

701

0.04

17525

6

2.9

505

0.027778

18180

7

3.7

376

0.020408

18424

8

6

292

0.015625

18688

9

6.4

245

0.012346

19845

10

5.6

205

0.01

20500

20

14.3

87

0.0025

34800

30

34.9

47

0.001111

42300

40

40.5

21

0.000625

33600

50

35.3

10

0.0004

25000

60

53.1

7

0.000278

25200

70

62

6

0.000204

29400

80

69.6

8

0.000156

51200

90

29.2

7

0.000123

56700

100

90.6

7

0.0001

70000

110

50.2

7

8.26E-05

84700

120

89.1

3

6.94E-05

43200

130

53.1

3

5.92E-05

50700

140

91.8

3

5.1E-05

58800

可以非常明确的观察到不同峰值数量与1/n^2有非常明显的对应关系。

由此可以假设一个关系式

num是不同峰值数量

C03是mnist的0和3之间的特征差异总量

假设C03是一个定值,而将一次收敛理解成是一次跃迁,有n*n种可能的跃迁路径也就是能级,如n=4则共有4*4个能级,这个假设可以解释特征峰数量随着n的增加而减小的现象。

平均分辨准确率对网络隐藏层节点数的非线性变化关系03相关推荐

  1. 由隐藏层节点数引起的网络准确率的不规则变化02

    (0,2)-81*n*2-(1,0)(0,1) 做一个分类mnist 0,2的二分类三层网络,隐藏层节点数由3-1000共实验了59组值.固定收敛标准δ=1e-6,每组值迭代1999次,统计平均分类准 ...

  2. 深度学习DL调参隐藏层节点数对网络性能的影响

    这次用于实验隐藏层节点数对网络性能的影响,训练集用的是mnist的训练集的0和1,测试集用的mnist的测试集的0和1,学习率固定位0.1,batchsize=20,训练集不加噪音.得到的数据 网络结 ...

  3. 隐藏层节点数对迭代次数分布规律的影响

    制作一个二分类网络 (mnist 0 ,2)-81*n*2-(1,0)(0,1) 让n分别等于3,5,10,20,30,40,50,60,70,80,90,100,100,110,120,130, 让 ...

  4. 神经网络隐藏层节点数效率最优值

    本文通过调节神经网络隐藏层节点数观察隐藏层节点数对神经网络性能的影响,并通过实验找到隐藏层节点数的收敛效率最优值. 首先构造一个二分类网络区分minst数据集的0和2,实验将28*28的图片缩小到9* ...

  5. 计算神经网络隐藏层节点数极小值

    神经网络的隐藏层的节点数越少网络的速度越快,那么神经网络的隐藏层的节点数是否有一个可以保证性能的极小值,本文用mnist数据集做了实验. 首先制作一个784*n*2的神经网络,用于测试0-9中的任意两 ...

  6. 神经网络隐藏层节点个数

    根据经验公式,逐步试验法确定隐层节点数.,逐步试验得到隐层节点数就是先设置一个初始值,然后在这个值的基础上逐渐增加,比较每次网络的预测性能,选择性能最好的对应的节点数作为隐含层神经元节点数. 在确定隐 ...

  7. BP神经网络隐藏层单元数的选择--(1)

    1. 参考文献1-08年,沈花玉等 1.1 简述 隐含层单元的数目与问题的要求.输入.输出单元的数目都有直接关系,数目太少,所获取的信息太少,出现欠拟合.数目太多,增加训练时间,容易出现过拟合,泛化能 ...

  8. BP神经网络隐含层节点数的确定

    BP神经网络隐含层节点数的确定 (1)构造法 首先运用三种确定隐含层层数的方法得到三个隐含层层数,找到最小值和最大值,然后从最小值开始逐个验证模型预测误差,直到达到最大值.最后选取模型误差最小的那个隐 ...

  9. java 二叉树第n层节点数及层序遍历

    层序遍历简化代码 import java.util.LinkedList;public class TreeBi {TreeBi leftTree;TreeBi rightTree;int data; ...

最新文章

  1. [转]后期-快速消除痘痘,完美修复MM肌肤
  2. edittext 监听无效_Android中EditText 设置 imeOptions 无效问题的解决方法
  3. WCF NetTcpBinding Transport安全模式(6) ClientCredentialType证书验证模式---- PeerTrust验证模式...
  4. 美团产品顾问马占凯:关于育儿,你需要知道的一切
  5. 「第二篇」全国一等奖,经验帖。
  6. Oracle入门(十三A)之Select
  7. github 公钥 私钥_搭建自己的技术博客系列 2:把 Hexo 博客部署到 GitHub 上
  8. 主机与虚拟机桥接出现ping不通解决方案
  9. linux中mysql导入文件,linux下mysql导入sql文件命令
  10. iQOO Neo6双色官方图公布:云阶三摄 辨识度十足
  11. js通过FormData对象 异步提交文件 实现文件上传(附带参数)
  12. 刨根系列 之 Unity3D UGUI 背后的工作原理
  13. 三重积分的轮换对称性及极坐标形式确定上下限
  14. 判断是手机还是平板html,“吃鸡”用平板好还是手机好?大神给出了答案,不同理解不同格局...
  15. 源码编译安装LAMP
  16. 全世界最好的编辑器VIM之Windows配置(gvim)
  17. Python-高级:多任务-协程 案例:图片下载器
  18. 关于fstream的flush
  19. 微信小程序元素节点滚到某位置后固定
  20. 【转】期限结构Carry收益 期货多品种对冲模型

热门文章

  1. PHP多选题怎么弄,php多选题评分算法求指导解决方法
  2. 【学习总结】数学-欧拉函数
  3. java的设计模式 - Builder模式
  4. Win7(64位)下安装Anaconda+Tensorflow(cpu)
  5. [转]linux tar 解压命令总结
  6. Java反射 - 2(对象复制,父类域,内省)
  7. 颜色代码对照表、网页颜色选择器
  8. pydev eclipse插件安装
  9. UA MATH564 概率分布1 二项分布下
  10. powershell 查看WMI信息和几个WMI类示例