制作4个网络,分别是3层,5层,7层,9层在迭代终止标准相同的前提下统计分类准确率比较增加网络层数是否一定可以改善网络性能?

3层网络的结构是

(mnist 0 ,mnist 2)81-30-2-(1,0) || (0,1)

分类mnist的0和2,将28*28的图片压缩到9*9,三层网络的节点数量分别是81,30,2。让0向(1,0)收敛,让2向(0,1)收敛,网络的迭代停止的标准是

|输出函数-目标函数|<δ

让δ=0.5到1e-6的34个值,每个δ重复收敛199次,统计迭代次数平均值,分类准确率平均值,分类准确率最大值,迭代时间平均值。

与之对应的5层,7层,9层网络的结构是

(mnist 0 ,mnist 2)81-30-49-30-2-(1,0) || (0,1)

(mnist 0 ,mnist 2)81-30-49-30-49-30-2-(1,0) || (0,1)

(mnist 0 ,mnist 2)81-30-49-30-49-30-49-30-2-(1,0) || (0,1)

首先比较平均准确率

 

9

7

5

3

δ

平均准确率p-ave

平均准确率p-ave

平均准确率p-ave

平均准确率p-ave

0.5

0.504318

0.499258

0.5048

0.527528

0.4

0.628378

0.65161

0.650711

0.559235

0.3

0.717866

0.751404

0.781075

0.685667

0.2

0.768787

0.798975

0.841833

0.797262

0.1

0.822365

0.855835

0.90255

0.911606

0.01

0.885606

0.914883

0.940618

0.960129

0.001

0.964507

0.968176

0.962292

0.975169

9.00E-04

0.958186

0.964025

0.962399

0.975409

8.00E-04

0.957866

0.966742

0.962297

0.976148

7.00E-04

0.959747

0.965081

0.964744

0.976238

6.00E-04

0.961562

0.967584

0.96621

0.976875

5.00E-04

0.96402

0.970022

0.966013

0.977357

4.00E-04

0.964397

0.970069

0.967576

0.977389

3.00E-04

0.974038

0.972639

0.96951

0.979382

2.00E-04

0.976892

0.976308

0.973973

0.97974

1.00E-04

0.981266

0.979532

0.979585

0.981728

9.00E-05

0.98216

0.98187

0.979785

0.981758

8.00E-05

0.983049

0.980691

0.980499

0.982055

7.00E-05

0.98484

0.980884

0.982065

0.982707

6.00E-05

0.985354

0.980816

0.981708

0.982557

5.00E-05

0.985219

0.981823

0.982092

0.982902

4.00E-05

0.984175

0.9817

0.982372

0.983454

3.00E-05

0.986453

0.982784

0.98149

0.983354

2.00E-05

0.987093

0.986064

0.983061

0.983821

1.00E-05

0.991136

0.990072

0.983126

0.983631

9.00E-06

0.990132

0.990562

0.983663

0.983736

8.00E-06

0.990996

0.990649

0.98411

0.984148

7.00E-06

0.991066

0.991853

0.98446

0.983961

6.00E-06

0.991611

0.991803

0.985444

0.9844

5.00E-06

0.992417

0.99206

0.985239

0.984138

4.00E-06

0.989972

0.9923

0.985756

0.984478

3.00E-06

0.992362

0.992355

0.985749

0.9849

2.00E-06

0.992375

0.992392

0.988336

0.98498

1.00E-06

0.992412

0.99231

0.98973

0.985886

这4组数据还是比较清晰的体现了在迭代停止标准相同的前提下网络的层数越多网络的平均准确率越大

9>7>5>3

再比较最大性能

 

9

7

5

3

δ

最大值p-max

最大值p-max

最大值p-max

最大值p-max

0.5

0.76839

0.717197

0.880716

0.804672

0.4

0.946322

0.935388

0.928926

0.818588

0.3

0.949304

0.95825

0.951789

0.917992

0.2

0.960239

0.959245

0.959742

0.963718

0.1

0.964712

0.966203

0.965209

0.968688

0.01

0.979622

0.976143

0.977634

0.977634

0.001

0.989066

0.987575

0.985586

0.982604

9.00E-04

0.988569

0.988072

0.987078

0.983101

8.00E-04

0.989066

0.989563

0.99006

0.983101

7.00E-04

0.99006

0.988569

0.988569

0.985586

6.00E-04

0.990557

0.989066

0.989563

0.986581

5.00E-04

0.99006

0.988569

0.988072

0.986581

4.00E-04

0.991054

0.990557

0.988072

0.985089

3.00E-04

0.992545

0.991054

0.989066

0.986083

2.00E-04

0.99503

0.992048

0.99006

0.985089

1.00E-04

0.99503

0.994036

0.992545

0.987078

9.00E-05

0.994533

0.994533

0.991054

0.987078

8.00E-05

0.994533

0.993539

0.992048

0.987575

7.00E-05

0.995527

0.994036

0.992545

0.988072

6.00E-05

0.994533

0.994036

0.992048

0.987575

5.00E-05

0.995527

0.994036

0.993042

0.988072

4.00E-05

0.995527

0.994036

0.992545

0.988072

3.00E-05

0.995527

0.994533

0.993042

0.988569

2.00E-05

0.99503

0.995527

0.994036

0.987575

1.00E-05

0.994533

0.99503

0.994533

0.988569

9.00E-06

0.99503

0.99503

0.994533

0.989066

8.00E-06

0.99503

0.994533

0.994036

0.988569

7.00E-06

0.995527

0.995527

0.994036

0.988072

6.00E-06

0.994533

0.99503

0.994533

0.989066

5.00E-06

0.99503

0.99503

0.994036

0.988072

4.00E-06

0.99503

0.994533

0.994533

0.989563

3.00E-06

0.994533

0.995527

0.994036

0.989066

2.00E-06

0.995527

0.995527

0.994533

0.988569

1.00E-06

0.995527

0.994533

0.995527

0.99006

这组数据再次清晰的体现了随着网络层数的增加网络的性能随之增加,特别是网络由3层加至5层以后性能提升非常明显。但7层和9层的网络当δ比较小的时候曲线已经高度重合,表明7层或9层的网络在δ比较小的区间的性能差异已经很难体现。

9>7>5>3

比较迭代次数

 

9

7

5

3

δ

迭代次数n

迭代次数n

迭代次数n

迭代次数n

0.5

8.291457

7.628141

5.728643

4.824121

0.4

334.3869

136.5377

47.92965

10.60302

0.3

445.608

223.8141

105.6432

32.92462

0.2

500.1307

275.8442

155.2563

68.78894

0.1

612.9146

369.5226

248.9497

155.2965

0.01

1085.503

754.2462

596.3015

492.8593

0.001

9882.784

8027.377

2793.01

1295.281

9.00E-04

10881.03

8691.206

2924.266

1368.503

8.00E-04

11977.38

9745.246

3438.271

1426.709

7.00E-04

14072.29

10714.58

4023.141

1494.201

6.00E-04

16406.42

12371.1

4890.673

1667.829

5.00E-04

20385.63

15137.29

5992.065

1749.307

4.00E-04

24298.51

17785.58

7844.638

1875.171

3.00E-04

32696.08

22253.22

11235.22

2184.286

2.00E-04

44724.82

31035.44

15313.87

2582.925

1.00E-04

89078.6

56299.69

25407.06

3498.412

9.00E-05

95407.9

63010.57

27220.85

3645.025

8.00E-05

104874.4

68325.11

29562.66

3840.156

7.00E-05

116214.4

78167.16

32122.32

4077.126

6.00E-05

131232.3

89236.13

34942.84

4212.678

5.00E-05

149461.3

102580.9

39240.9

4589.568

4.00E-05

166924.9

117010.6

42965.2

5167.663

3.00E-05

204507.9

149188.4

52871.19

5821.111

2.00E-05

274629

212703

64717.94

6976.513

1.00E-05

439076.3

360851.1

90076

9615.879

9.00E-06

473836.4

386946.7

91610.54

9692.05

8.00E-06

514704.1

429464.9

99462.98

10012.85

7.00E-06

550991.1

455372.7

105727.8

10419.32

6.00E-06

616058.6

535610.7

110838.9

11089.11

5.00E-06

742561

608267.8

118164.4

12141.85

4.00E-06

892665.6

729212.1

138541.7

12888.37

3.00E-06

1155870

930735.7

155032.7

13944.59

2.00E-06

1.69E+06

1390712

189751.4

16152.7

1.00E-06

3.35E+06

2727215

318306.6

20551.51

随着网络层数的增加迭代次数大比例的增加,比较当δ=1e-6时的数据

 

9

7

5

3

δ

迭代次数n

迭代次数n

迭代次数n

迭代次数n

1.00E-06

3.35E+06

2727215

318306.6

20551.51

         
 

1.228442

8.567887

15.48824

 

对比数据n9/n7=1.22,n7/n5=8.56,n5/n3=15.48

可以明显观察到随着层数的增加迭代次数是增加的,但随着层数的增加迭代次数增加的速度是减慢的。

9>7>5>3

最后比较收敛时间

 

9

7

5

3

δ

耗时 min/199

耗时 min/199

耗时 min/199

耗时 min/199

0.5

0.409583

0.297767

0.191367

0.0586

0.4

0.547117

0.333867

0.192717

0.05605

0.3

0.592417

0.3599

0.203

0.057967

0.2

0.6182

0.375717

0.219817

0.0597

0.1

0.664517

0.404467

0.23055

0.063883

0.01

0.865933

0.52845

0.299283

0.084767

0.001

4.660217

2.794767

0.72315

0.134933

9.00E-04

5.107717

3.0043

0.748283

0.136217

8.00E-04

5.547917

3.32935

0.849567

0.140483

7.00E-04

6.4496

3.633417

0.961167

0.144367

6.00E-04

7.462333

4.14635

1.127583

0.154583

5.00E-04

9.166217

5.0117

1.344267

0.158483

4.00E-04

10.83363

5.847867

1.699267

0.166983

3.00E-04

14.45065

7.23295

2.354367

0.186433

2.00E-04

18.27553

9.96255

3.1458

0.209817

1.00E-04

38.97403

17.8287

5.095617

0.279333

9.00E-05

40.24977

19.8958

5.439967

0.27905

8.00E-05

44.66172

20.44067

5.888667

0.2912

7.00E-05

50.07025

25.11477

6.383417

0.307417

6.00E-05

56.32692

28.81148

6.927333

0.311583

5.00E-05

64.26778

33.43728

7.758767

0.3372

4.00E-05

71.88765

35.4373

8.501183

0.37535

3.00E-05

87.45185

46.21853

9.577633

0.415583

2.00E-05

117.4416

66.7971

13.08162

0.481717

1.00E-05

188.3502

111.3974

18.13227

0.642817

9.00E-06

205.6579

119.7637

18.41502

0.646617

8.00E-06

221.6506

133.2785

19.11077

0.6669

7.00E-06

236.5716

139.6939

21.95412

0.688267

6.00E-06

267.6226

168.1909

20.1341

0.7378

5.00E-06

318.1124

188.6062

24.30287

0.796267

4.00E-06

381.6106

227.9598

27.94432

0.84375

3.00E-06

492.3802

290.9228

29.18535

0.9145

2.00E-06

724.5874

431.3575

37.93767

1.047

1.00E-06

1420.324

839.3905

62.56628

1.3132

这个规律也是无比明显的,收敛时间随着层数的增加而增加。

 

9

7

5

3

δ

耗时 min/199

耗时 min/199

耗时 min/199

耗时 min/199

1.00E-06

1420.324

839.3905

62.56628

1.3132

 

1.692089

13.41602

47.64414

 

当δ=1e-6时t9/t7=1.69,t7/t5=13.41,t5/t3=47.64

9>7>5>3

总结这4个表格

平均准确率,最大准确率,迭代次数,收敛时间的顺序都是

9>7>5>3

网络层数越多网络分类能力越强,需要的迭代次数越多,时间越长。

但是考虑到在δ比较小的区间7层和9层网络的性能差异已经不大,所以对于这道题一个比较经济的参数设置方案是用7层网络,收敛标准δ=5e-6,或者设定迭代次数n=608267.预估收敛时间为56秒,68%的概率准确率在99.011%-99.401%之间。有不小于0.5025%的概率拿到99.503%。

3层,5层,7层,9层网络性能比较-0-2相关推荐

  1. 接入层的流程和非接入层

    所谓接入层的流程和非接入层的流程,实际是从协议栈的角度出发的.在协议栈中,RRC和RANAP层及其以下的协议层称为接入层,它们之上的MM.SM.CC.SMS 等称为非接入层.简单地说,接入层的流程,也 ...

  2. java domain层_java框架中的controller层、dao层、domain层、service层、view层

    1.Controller层:接口层,用户访问请求时对接. Controller层负责具体的业务模块流程的控制,在此层里面要调用Serice层的接口来控制业务流程,控制的配置也同样是在Spring的配置 ...

  3. 神经网络结构设计指导原则——输入层:神经元个数=feature维度 输出层:神经元个数=分类类别数,默认只用一个隐层 如果用多个隐层,则每个隐层的神经元数目都一样...

    神经网络结构设计指导原则 原文   http://blog.csdn.net/ybdesire/article/details/52821185 下面这个神经网络结构设计指导原则是Andrew NG在 ...

  4. jpadao层继承什么_ABP框架领域层

    领域层 •实体 •仓储 •领域服务 •工作单元(下期) •领域事件(事件总线)(下期) •实体是DDD(领域驱动设计)的核心概念之一. •Eirc Evans是这样描述的实体的:"它根本上不 ...

  5. 深度学习DL调参隐藏层节点数对网络性能的影响

    这次用于实验隐藏层节点数对网络性能的影响,训练集用的是mnist的训练集的0和1,测试集用的mnist的测试集的0和1,学习率固定位0.1,batchsize=20,训练集不加噪音.得到的数据 网络结 ...

  6. TF之CNN:CNN实现mnist数据集预测 96%采用placeholder用法+2层C及其max_pool法+隐藏层dropout法+输出层softmax法+目标函数cross_entropy法+

    TF:TF下CNN实现mnist数据集预测 96%采用placeholder用法+2层C及其max_pool法+隐藏层dropout法+输出层softmax法+目标函数cross_entropy法+A ...

  7. 卷积神经网络(卷积层,激活函数Relu,池化层,计算公式及API解释)

    1. 卷积神经网络 (卷积层,激活函数,池化层,全连接层) (1)  把神经网络的隐藏层分为卷积层和池化层(又叫下采样层) · 卷积层 :  通过在原始图像上平移来提取特征 ·  池化层 : 通过特征 ...

  8. Keras.layers各种层介绍,网络层、卷积层、池化层 等

    [转载]Keras.layers各种层介绍 - 心冰之海 - bk园 https://www.cnblogs.com/lhxsoft/p/13534667.html 文章导航 一.网络层 1.常用网络 ...

  9. 理解OSI七层模型(了解OSI七层模型,数据如何传输,封装,解封装)

    文章目录 理解OSI七层模型 什么是OSI七层模型 理解OSI七层模型 举例子 七层协议,分析过程: 数据传输过程 封装数据 解封装数据 数据是如何封装和解封装 理解OSI七层模型 第一层:物理层. ...

最新文章

  1. 使用java理解程序逻辑 第十二章_Java弱引用的理解与使用
  2. Spring配置数据源(连接池)
  3. linux中iptable中端口,Linux如何打开iptables中的端口
  4. 小程序日历插件的使用
  5. 拷贝归档到achivelog目录下_Linux下查看压缩文件内容的 10 种方法
  6. 摩托罗拉投资Android社交游戏拓荒商Moblyng
  7. wxpython grid设置字体颜色_Ext grid改变行背景颜色 和改变行字体颜色
  8. html显示emoji表情,在web页面显示emoji表情
  9. mysql评论回复表设计_数据库设计——评论回复功能
  10. Python:RSA秘钥生成与加密解密整理
  11. Nuxt入门到打包部署 Vue-SSR项目
  12. C# 常用Excel导出的几种常见方式及实现步骤
  13. [高数][高昆轮][高等数学上][第一章-函数与极限]06.极限存在法则 两个重要极限...
  14. elsearch mysql实时索引_MySQL和Lucene(Elasticsearch)索引对比分析
  15. 第五章 全连接神经网络
  16. 211工科计算机专业大学排名,这所211大学曾痛失985资格,工科专业实力强劲
  17. - 并查集详解(第二节)
  18. 苹果微信更新不了最新版本_微信最新版本可以更改微信号了!还有大量功能更新!...
  19. cocos2dx android 接入爱贝支付平台sdk记录
  20. 上有政策,下有对策——如何继续下载VeryCD资源

热门文章

  1. 2.2.1 mini-batch
  2. Gui系统之View体系(2)---View的setContent
  3. HDU 5703 Desert 水题 找规律
  4. Leetcode 102. Binary Tree Level Order Traversal(二叉树的层序遍历)
  5. hdoj1176【DP】
  6. WP7应用《OOK随心系列》字体和电子书上传方法说明
  7. wtl重载 CListViewCtrl,及其用法。
  8. VC++图片框控件静态和动态加载位图
  9. Directx 顶点和顶点缓存
  10. C++ 11 新特性 nullptr 学习