北京 上海巡回站 | NVIDIA DLI深度学习培训
2018年1月26/1月12日

NVIDIA 深度学习学院 带你快速进入火热的DL领域
阅读全文                                                
>

正文共1791个字,12张图,预计阅读时间6分钟。

是不是觉得神经网络不够形象,概念不够清晰,如果你是新手,来玩玩PlayGround就知道,大神请绕道。

PlayGround是一个在线演示、实验的神经网络平台,是一个入门神经网络非常直观的网站。这个图形化平台非常强大,将神经网络的训练过程直接可视化。同时也能让我们对Tensorflow有一个感性的认识。

PlayGround的网址是:http://playground.tensorflow.org/

PlayGround页面如图所示,主要分为DATA(数据),FEATURES(特征),HIDDEN LAYERS(隐含层),OUTPUT(输出层)。

PlayGround主页面

DATA一栏里提供了4种不同形态的数据,分别是圆形、异或、高斯和螺旋。平面内的数据分为蓝色和黄色两类。

四种数据形态

我们的目标就是通过神经网络将这两种数据分类,可以看出螺旋形态的数据分类是难度最高的。除此之外,PlayGround还提供了非常灵活的数据配置,可以调节噪声、训练数据和测试数据的比例和Batch size的大小。

噪声的影响

训练数据和测试数据的比例

Batch size大小

Batch size就是每批进入神经网络数据点的个数。

FEATURES一栏包含了可供选择的7种特征:X1、X2、X1X1、X2X2、X1X2、sin(X1)、sin(X2)。

7种特征

X1可以看成以横坐标分布的数据特征,X2是以纵坐标分布的数据特征,X1X1和X2X2是非负的抛物线分布,X1X2是双曲抛物面分布,sin(X1)和sin(X2)正弦分布。我们的目标就是通过这些特征的分布组合将两类数据(蓝色和黄色)区分开,这就是训练的目的。

HIDDEN LAYERS一栏可设置多少隐含层。一般来讲,隐含层越多,衍生出的特征类型也就越丰富,对于分类的效果也会越好,但不是越多越好,层数多了训练的速度会变慢,同时收敛的效果不一定会更好,后面也会提到。

隐含层结构

因为在这里是一个分类的问题,隐含层设置为两层,刚好对应输出的类型。层与层之间的连线粗细表示权重的绝对值大小,我们可以把鼠标放在线上查看权值,也可以点击修改。

OUTPUT一栏将输出的训练过程直接可视化,通过test loss和training loss来评估模型的好坏。

输出模型

除了主要的四个部分外,在界面上还有一列控制神经网络的参数,从左到右分别是,训练的开关、迭代次数、学习速率、激活函数、正则化、正则化率和问题的类型。

神经网络控制参数

我们接下来尝试了几个例子,考虑到图片太多,直接讲一些结论,读者可以自行去摸索。

首先考虑的是激活函数的影响,比较了一下Sigmoid函数和ReLU函数:

1、选择Sigmoid函数作为激活函数,明显能感觉到训练的时间很长,ReLU函数能大大加快收敛速度,这也是现在大多数神经网络都采用的激活函数。

2、当把隐含层数加深后,会发现Sigmoid函数作为激活函数,训练过程loss降不下来,这是因为Sigmoid函数反向传播时出现梯度消失的问题(在sigmoid接近饱和区时,变换太缓慢,导数趋于0,这种情况会造成信息丢失)。

接着我们选用ReLU函数作为激活函数,比较一下隐含层数量对结果的影响:

1、我们选用了3层隐含层,每层特征个数为8,8,2的模型和6层隐含层,每层特征个数为8,8,8,8,8,2的模型。3层隐含层模型大概200步就达到了test loss为0.005,training loss为0.005,而6层隐含层模型跑了700步,test loss为0.015,training loss为0.005,有点过拟合。

8,8,2模型

8,8,8,8,8,2模型

隐含层的数量不是越多越好,层数和特征的个数太多,会造成优化的难度和出现过拟合的现象。

如果你感兴趣,很多测试你都可以尝试一下。通过神经网络,我们的系统自己就能学习到哪些特征是有效的,哪些特征是无效的,通过自己学习这些特征,然后判断问题。值得一提的是,最近很热的AlphaGo zero通过自我学习的过程,从无到有,打败了参照人类知识学习的AlphaGo,可见机器自我学习,自我进化的速度太快了,远远超越了人类历史经验的总结。人生苦短,快用Tensorflow!

原文链接:https://www.jianshu.com/p/5f83defc7615

查阅更为简洁方便的分类文章以及最新的课程、产品信息,请移步至全新呈现的“LeadAI学院官网”:

www.leadai.org

请关注人工智能LeadAI公众号,查看更多专业文章

大家都在看


LSTM模型在问答系统中的应用

基于TensorFlow的神经网络解决用户流失概览问题

最全常见算法工程师面试题目整理(一)

最全常见算法工程师面试题目整理(二)

TensorFlow从1到2 | 第三章 深度学习革命的开端:卷积神经网络

装饰器 | Python高级编程

今天不如来复习下Python基础

Tensorflow新手通过PlayGround可视化初识神经网络相关推荐

  1. 卷积神经网络的可视化(二)(可视化卷积神经网络的过滤器)

    总结自<Python 深度学习>(François Chollet)第5章. 可视化卷积神经网络的过滤器 想要观察卷积神经网络学到的过滤器,另一种简单的方法是显示每个过滤器所响应的视觉模 ...

  2. Tensorflow命名空间与计算图可视化

    Tensorflow命名空间与计算图可视化 觉得有用的话,欢迎一起讨论相互学习~ 参考文献 强烈推荐Tensorflow实战Google深度学习框架 实验平台: Tensorflow1.4.0 pyt ...

  3. 使用Python可视化卷积神经网络方法汇总

    介绍 深入学习中最具争议的话题之一是如何解释和理解一个经过训练的模型--特别是在医疗等高风险行业的背景下."黑匣子"一词经常与深度学习算法联系在一起,如果我们不能解释模型是如何工作 ...

  4. P6:可视化卷积神经网络

    子豪兄YYDS https://www.bilibili.com/video/BV1K7411W7So?p=6 一.什么是卷积神经网络的可视化 卷积神经网络可以看作一个黑箱子,打破黑箱子就需要处理中间 ...

  5. 可视化卷积神经网络的过滤器

    可视化卷积神经网络的过滤器 #想要观察卷积神经网络学到的过滤器,另一种简单的方法是显示每个过滤器所响应的视觉模式. #通过在输入空间中进行梯度上升来实现:空白图像开始,将梯度下降应用于卷积神经网络输入 ...

  6. 二、ZFNet可视化卷积神经网络——可解释性机器学习(DataWhale组队学习)

    目录 引言 ZFNet的网络结构 可视化反卷积 反池化 反激活 反卷积 训练细节 特征可视化 特征演化 特征不变性 局部遮挡测试 敏感性分析 相关性分析 消融实验 宽度影响 深度影响 迁移学习能力 有 ...

  7. TensorFlow学习--函数逼近(RBF神经网络)

    目录 主体代码参照: 1.RBF网络相关知识 知识概述 2.K-means聚类最优k值的选取 2.1手肘法:SSE(sum of the squared errors,误差平方和) 2.2 轮廓系数法 ...

  8. 新手上路C语言初识C语言(其二)

    文章目录 新手上路C语言初识C语言(其二) 导入 一.变量的作用域和生命周期 二.常量 字面常量 const修饰的常变量 #define定义的标识符常量 枚举常量 三.字符串 四.转义字符 五.注释 ...

  9. 12、理解与可视化卷积神经网络

    目录 12.1 可视化卷积神经网络学习到的东西 12.1.1可视化激活和第一层权重 12.1.2 找到对神经元有最大激活的图像 12.1.3 用 t-SNE 嵌入代码 12.1.4 遮挡部分图像 12 ...

最新文章

  1. java性能权威指南中文_Java性能权威指南读书笔记--之一
  2. Cocoa touch(六):UIViewController
  3. Office 365 批量创建用户步骤
  4. 崩溃!Win10 强制更新导致电脑无限重启
  5. 欢乐纪中A组赛【2019.8.7】
  6. 清华大学《操作系统》(六):非连续内存分配 段式、页式、段页式存储管理
  7. OJ1036: 某年某月有多少天
  8. 常用Linux网络/内存/磁盘分析工具
  9. 【操作系统】处理机调度与死锁(三)
  10. 外链平台怎么找?什么形式的外链最好?
  11. 设计师的“通天塔”—浅谈设计沟通
  12. 出租分数 20作者 陈越单位 浙江大学
  13. POJ题目分类---计算几何
  14. h5压缩图片 亲测有效
  15. LJN数理化生信奥队自传
  16. 一种打印机控制电路及打印机的制作方法
  17. 办公用计算机的配置,各取所需硬道理 办公用电脑配置如何选
  18. 「 MalabSimulink 」X0 returned by MATLAB S-function ‘NLSEF‘ in ‘ADRC_NN/S-Function1‘ must be a vector
  19. 高通Android智能平台开发总结
  20. Python登录邮箱,并回复邮件

热门文章

  1. 武汉大学计算机控制考试卷子,武汉大学计算机学院微机接口0809试题及答案.doc...
  2. asp.net 获取全部在线用户_这款手绘风格的在线制图软件超棒
  3. html 图片防盗链,配置.htaccess文件实现图片防盗链
  4. dbus PHP,安装dbus-python的简要教程
  5. redis主从配置及无法连接处理
  6. 删除oracle怎么快,如何快速删除Oracle的好方法
  7. 西安工业大学计算机全国排名,西安工业大学北方信息工程学院排名2018年下滑14名 在独立学院中实力排全国第138名...
  8. ASP.NET MVC Controller Overview摘录
  9. HTTP之缓存 Cache-Control
  10. 【转】jsp+servlet和SSM分别是如何实现文件上传(示例)