0.前言

为了在暑假能更好的发展自己,鉴于对深度学习的浓厚兴趣,楼主开始学习深度学习的相关知识。本系列内容是在楼主学习吴恩达老师的深度学习课程后进行的总结,使用的程序软件为python。如有纰漏还请各位大佬指出,我将虚心接受。

1.深度学习概念

深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。 深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。

2.深度学习基本知识

在深度学习开始前,我们不妨先了解一下图片在计算机的存储方式。一般来说,一个图片在计算机内是由3个64*64矩阵构成(RGB描述),如果将其以一维形式展现,则x一共有3*64*64=12288个元素构成集合,我们称之为X,其中12288为特征向量x的维度。

一般深度学习过程是指通过输入特征向量到神经网络,神经网络经过内部代码的运行后,输出我们所需要的结果。与普通的程序不同的是,神经网络的规模更为庞大,可以更快速地处理大量的数据得出结果,从而实现单个程序无法做到的事,但神经网络的使用前提需要大量的数据进行训练,即创造神经网络所需要的时间更长。

下面我们以二分分类为例子来介绍一下深度学习。

在深度学习中我们用(x,y)来表示一个通过神经网络的样品,其中x为输入的特征向量,y为输出的结果,有时我们会在x,y各上标(1)来表示样品1,上标(2)来表示样品2。

由于在大多数情况下,输出y的量会比较多,我们一般以^y——输出y的概率分布,来作为我们的输出结果,^y=w^T(w的转置矩阵)*x+b,其中w为逻辑回归参数,x为输入的特征参数,b为修正用实数。但这样结果不准确,我们还要用激活函数来进行再次修正,开始我们用的是sigmoid函数,即sigmoid(z)=1/(1+e^(-z)),后面我们会发现用ReLU或Leaky ReLU函数作为激活函数效果会更好,这个之后再介绍。这样我们得到的结果相对会比较准确,但依旧会有一定误差。为了得到误差,我们设L(^y,y)=-(ylog^y+(1-y)log(1-^y)),即我们的误差函数。同时为了得到所有样本的误差,我们设J(w,b)=1/m*各样品误差函数之和,其中m为样品个数,作为我们的成本函数。

接下来我们在介绍一下梯度下降法,通俗来说,梯度下降法是指从起始点开始,沿最陡路线走,直至接近或到达最低点的方法,运用梯度下降法,我们可以在神经网络的运行过程中更新我们的w,即逻辑回归参数,来使我们的输出结果更为准确。

2.神经网络

在一个神经网络中,通常会有输入层、隐藏层、输出层,其中隐藏层就是对输入的特征向量进行处理的层,一般神经网络的层数就是指隐藏层与输出层的层数之和,即n+1层,n为隐藏层的层数,每一个隐藏层的输入均为前一个隐藏层的输出,以迭代的方式来进行神经网络数据的传递与处理。每一层均有多个单元,即输入多个数据至单元,经过不同的隐藏单元处理后,最终得到一个输出。

双层神经网络具体如图

 每层运行过程

神经网络的使用分为正向传播与反向传播,即我们可以从输入得到输出,也可以从输出得到输入。为了防止隐藏单元相同,从而出现对称性问题,我们一般要进行随机初始化函数的处理,即对w、b进行随机初始化后进行测试,再进行适当调整得到我们所需要的w、b。

上图为正向传播与反向传播公式,其中均将样品组合成为矩阵后代入计算,其中A为预测^y矩阵,g为激活函数。   

后续楼主将总结卷积神经网络

深度学习理论总结(1)相关推荐

  1. 深度学习理论与实战:基础篇电子书

    出版社:电子工业出版社 出版时间:2019-07-01 ISBN:9787121365362 包装:平装 字数:537000 页数:424 版次:1 开本:16开 用纸:胶版纸 正文语种:中文 字数: ...

  2. 【深度学习理论】一文看懂卷积神经网络

    [深度学习理论]一文看懂卷积神经网络 https://mp.weixin.qq.com/s/wzpMtMFkVDDH6scVcAdhlA 选自Medium 作者: Pranjal Yadav 经机器之 ...

  3. 【干货51页PPT】深度学习理论理解探索

    来源:专知 普林斯顿大学计算机科学系教授Sanjeev Arora做了深度学习理论理解探索的报告,包括三个部分: Why overparametrization and or overprovisio ...

  4. 深度强化学习_深度学习理论与应用第8课 | 深度强化学习

    本文是博雅大数据学院"深度学习理论与应用课程"第八章的内容整理.我们将部分课程视频.课件和讲授稿进行发布.在线学习完整内容请登录www.cookdata.cn 深度强化学习是一种将 ...

  5. 【深度学习】陶大程等人编写!最新41页深度学习理论综述

    作者单位:悉尼大学(陶大程等人) 论文 https://arxiv.org/pdf/2012.10931.pdf 最近,悉尼大学陶大程等人发布了一个41页的最新深度学习理论的综述,对深度学习理论的最新 ...

  6. 【深度学习理论】一文搞透pytorch中的tensor、autograd、反向传播和计算图

    转载:https://zhuanlan.zhihu.com/p/145353262 前言 本文的主要目标: 一遍搞懂反向传播的底层原理,以及其在深度学习框架pytorch中的实现机制.当然一遍搞不定两 ...

  7. 斯坦福大学秋季课程《深度学习理论》STATS 385开讲

    转载:http://mp.weixin.qq.com/s?timestamp=1510210312&src=3&ver=1&signature=qmn1IsRtGkSXORGK ...

  8. 关于深度学习理论和架构的最新综述(part3)

    关于深度学习理论和架构的最新综述-part3 递归神经网络(RNN) 介绍 长短期记忆(LSTM) 门控循环单元(GRU) 卷积LSTM(ConvLSTM) RNN架构的变体及其应用 基于注意力的RN ...

  9. 神经网络与深度学习理论,tensorflow2.0教程,cnn

    *免责声明: 1\此方法仅提供参考 2\搬了其他博主的操作方法,以贴上路径. 3* 场景一:神经网络与深度学习理论 场景二:tensorflow的安装 场景三:numpy包介绍 场景四:机器学习基础 ...

  10. 深度学习理论(李宏毅

    2022 - 再探宝可梦.数码宝贝分类器 - 浅谈机器学习原理_哔哩哔哩_bilibili more parameters, easier to overfit, why? 但是怎么定这个有未知数的f ...

最新文章

  1. java实现zip与unzip
  2. kubernetes的安装
  3. axios捕获401 赋值token
  4. hashMap和hashTable的区别(个人总结)
  5. java循坏_Java的坏功能是什么
  6. C++学习之路 | PTA乙级—— 1076 Wifi密码 (15 分)(精简)
  7. linux 启动启动服务_更快地启动Linux
  8. Hadoop数据目录迁移
  9. asp.net中的窗体身份验证(完整篇之六:登出后不能通过后退回来面来的页面)...
  10. 奇门对接需求设计_奇门格局详解_-_么学声_张志春
  11. python获取服务器端的时间
  12. java中tab键_Java 9中的JShell中Tab键的用途是什么?
  13. 计算机在化学中论文3000字,化学论文范文3000字_化学论文发表
  14. 华为大数据客户端安装步骤
  15. windows下如何用python控制打印机打印_巧用win32print来控制windows系统打印机并推送打印任务...
  16. 什么是意志力?如何提高意志力?
  17. win10如何设置锁屏时间
  18. ORB-SLAM2源码阅读(四)—LoopClosing线程SIM3变换
  19. android app排行榜 易观智库,易观发布4月移动App月活增幅排行榜
  20. ArcGIS克里金插值ERROR999999解决办法汇总

热门文章

  1. java绘制五角星_java画各种五角星
  2. 远程网络教学系统功能(用例图)
  3. EVOLAB | 再度解析共识机制:POW
  4. RIP --- 路由信息协议
  5. pythonarcgis插件_【直播】基于Python开发ArcGIS插件:Python Add-in丨城市数据派
  6. 小程序转uni-app——引入组件显示问题
  7. Python 批量下载SIGMOD,VLDB的论文 Mac OS
  8. 三种方式让 Android WebView 支持文件下载
  9. Python基础7:文件操作
  10. 一键合并多个Excel文档