Deep Learning近些年来吸引到了很多的关注,并且横跨多领域、横跨多种产品,有非常非常多的应用

深度学习的历史、步骤

1958年,一开始perception的提出引起了轰动, 有人说可以利用perception来分辨坦克和卡车,但结果是拍摄坦克卡车的日子不同,一天是雨天一天是晴天,perception只能够抓到亮度而已

1980年,把多个perception接在一起

1986年,发现超过3个hidden layer的效果是不好的

1989年,认为1个hidden layer就足够好了,multi—layer perception的名字臭掉了

2006年, 利用RBM(受限玻尔兹曼机)找初始的值,这是一个重大的突破

2009年,知道要用GPU来加速

2011年,开始得到认可

2012年,赢得了一个比赛

在机器学习中,执行一个算法通常要经过遵循以下三个步骤:(1)定义一个函数集;(2)定义函数的好坏;(3)训练参数,得到不同的函数,并选择最好的函数

Deep Learning同样遵循这三个步骤。具体来说,在第一步中,定义的函数集为一个神经网络(neuron network) 。

定义一个函数集

深度学习的结构

如图所示展示了一个神经网络,它是由许多神经元(neuron)组成的一个系统。每一个神经元的参数为:为每个输入分配一个权重wi,一个常数b,一个函数在运算中,每个神经元执行这样的操作:将每个输入xi乘以权重wi后求和,将得到的值加上b作为函数的输入,输出得到的函数值。将这个神经元的输出将作为下个神经元的输入,依次将这些神经元之间进行连接即得到一个神经网络。定义了这些神经元之间的连接方式,也就定义了函数集。

不同的连接方式会形成不同的网络结构

举一个例子来说明神经网络是如何运作的。下图展示了一个简单的神经网络,神经网络的输入为1和-1,第一个神经元对两个输入的权重分别为1和-2,计算1*1+(-1)*(-2)+1=4,将4作为sigmoid函数的输入,输出(4)=0.98。同理计算其他神将元,最后整个神经网络得到的输出为0.62和0.83.

输入——>蓝色——>红色——<绿色——>输出

全连接前馈网络

最常见的连接方式——Fully Connect Feedforward Network(全连接前馈网络)

全连接前馈神经网络是一种常见的神经网络连接方式,指的是层与层的神经元之间使用全连接的方式连接,即一层中每个神经元的输出会参与到下一层每个神经元的输入。它的输入是一个N维向量,输出是一个M维向量。输入称为Input Layer,输出结果的一层神经元称为Output Layer,中间其他的层称为Hidden Layer,通常将使用了很多Hidden Layer的方法称为Deep Learing。

 

实际上一个neural network在做的事情就是,一个vector乘上matrix+vector,一连串的矩阵运算,gpu可以加速矩阵运算

特征提取取代了特征工程,上图是多分类的问题

举一个小例子(手写数字识别)

input是每一个小方块是否图颜色了,output是不同数字的几率

中间有几个layer,每个layer有多少个neuron是不收到限制的,那么该如何决定它们呢?

通过经验+试错+直觉

从机器学习转化为深度学习,重点从特征工程(抽好的feature)转变成了如何design network structure

语音辨识、影像辨识最早使用深度学习

定义函数的好坏

loss是y和y_hat的cross entropy

(1)在function set找一个function来minimizes total loss

(2)找network的参数来minimizes total loss

并选择最好的函数

依然是使用梯度下降的办法

 

有这些方法来算微分,具体不需要知道

为什么要用Deep Learning(多层Hidden  Layer)

一个已经被证实的理论是,一层Hidden Layer就足以模拟出任何函数,那么为什么还要使用Deep Learning呢?当然是因为Deep Learning的效果更好。如图,同一行的数据使用参数的个数是相似的。可以看出,使用多层Layer的效果明显好于只使用一层的。

只要hidden neurons够多,可以表示成任何一个function

李宏毅深度学习——深度学习介绍相关推荐

  1. 基础 | 深度学习与神经网络-介绍

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|深度学习自然语言处理 导读 深度学习 深度学习改变了搜索. ...

  2. camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)

    深度学习图像数据集介绍(MSCOCO) MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detectio ...

  3. [深度学习] 分布式Horovod介绍(四)

    [深度学习] 分布式模式介绍(一) [深度学习] 分布式Tensorflow介绍(二) [深度学习] 分布式Pytorch 1.0介绍(三) [深度学习] 分布式Horovod介绍(四) 实际应用中, ...

  4. [深度学习] 分布式Pytorch介绍(三)

    [深度学习] 分布式模式介绍(一) [深度学习] 分布式Tensorflow介绍(二) [深度学习] 分布式Pytorch介绍(三) [深度学习] 分布式Horovod介绍(四)  一  Pytorc ...

  5. [深度学习] 分布式模式介绍(一)

    [深度学习] 分布式模式介绍(一) [深度学习] 分布式Tensorflow介绍(二) [深度学习] 分布式Pytorch 1.0介绍(三) [深度学习] 分布式Horovod介绍(四) 一  分布式 ...

  6. 深度学习主流框架介绍(PyTorch、TensorFlow、Keras、Caffe、Theano、MXNET)

    深度学习主流框架介绍(PyTorch.TensorFlow.Keras.Caffe.Theano.MXNET) 1.Theano Theano是最早的深度学习框架之一,由 Yoshua Bengio ...

  7. 吴恩达《深度学习》课程介绍

    吴恩达<深度学习>(Andrew Ng <Deep Learning>)专业课程主要有五门课组成: 1.神经网络和深度学习(Neural Networks and Deep L ...

  8. 深度强化学习主流算法介绍(二):DPG系列

    之前的文章可以看这里 深度强化学习主流算法介绍(一):DQN系列 相关论文在这里 开始介绍DPG之前,先回顾下DQN系列 DQN直接训练一个Q Network 去估计每个离散动作的Q值,使用时选择Q值 ...

  9. 动手学深度学习——深度学习介绍及软件安装

    动手学深度学习是李沐教授在哔哩哔哩上发布的专栏视频,专栏链接如下: https://space.bilibili.com/1567748478/channel/seriesdetail?sid=358 ...

  10. 《深度学习实战》第1章 深度学习的发展介绍

    参考书籍<深度学习实战>杨云.杜飞著 第1章 深度学习的发展介绍 介绍 python是一种非常简单易学的解释性语言.由于强大的开源库支持(numpy,scipy,matplotlib),其 ...

最新文章

  1. 利用Windows Server Backup备份数据进行域控裸机还原
  2. AMD yes!拿下Meta后发布新芯片,FP64性能是A100 4.9倍,面向高性能计算和机器学习...
  3. [转]C#多线程学习(四) 多线程的自动管理(线程池)
  4. 菜鸟学Linux 第090篇笔记 corosync+drbd+mysql
  5. open_links_per_instance 和 open_links 参数说明
  6. gettext 国际化_如何使用Gettext在Phoenix应用程序中执行本地化
  7. 【Kafka】Failed to send data to Kafka: Expiring 30 record(s) for xxx 732453 ms has passed since last a
  8. linux 用户及权限管理
  9. iOS __strong __weak @Strongify @Weakify
  10. 获取含有class为某个值的a标签或img标签
  11. thinkphp5 return 返回空_杨丞琳演唱会意外踩空,从两层楼高的舞台掉落,李荣浩心疼发文...
  12. 今天迈出第一步,开始了解iphone开发
  13. android入门级智能手表产地,从全球智能手表市场来看,Android智能手表只在中国卖得好...
  14. 标准模板库中的优先队列(priority_queue)
  15. [libtorrent] tracker 逻辑及源码解析(调试)
  16. js监听手机横竖屏事件
  17. 计算机考研854题型,2020哈尔滨工业大学计算机考研854真题回忆版
  18. 判断二极管导通例题_几种二极管的检测方法(普通,稳压,双向触发)
  19. 健康调查系统c语言代码大全,C语言问卷调查(示例代码)
  20. 国际短信系统平台软件源码开发路由功能—移讯云短信系统

热门文章

  1. tcp连接多久会自动断开_苹果M1 Mac用户报告蓝牙连接问题:外设经常会断开
  2. C#中类的属性(Property)
  3. python计算最大公约数和最小公倍数_python怎么求最大公约数和最小公倍数
  4. python递归详解_python基于递归解决背包问题详解
  5. mysql join大小表顺讯_MySQL优化器join顺序
  6. mvc创建连接mysql_MVC+EF6-CodeFirst 连接MySQL并创建数据库和表_Demo
  7. php语言三个数从小到大排序,求教输入5个数,从小到大排序 的C语言程序?
  8. C++继承时的名字遮蔽(一)
  9. torch 的 unsqueeze用法
  10. 深度学习基础知识(一): 概述-神经网络起源和发展