深度学习的三个步骤

  • Step1:神经网络(Neural network)
  • Step2:模型评估(Goodness of function)
  • Step3:选择最优函数(Pick best function)

2.1 神经网络(Neural network)


神经网络(Neural network)里面的节点,类似我们的神经元。神经网络也可以有很多不同的连接方式,这样就会产生不同的结构(structure)在这个神经网络里面,我们有很多逻辑回归函数,其中每个逻辑回归都有自己的权重和自己的偏差,这些权重和偏差就是参数。

2.2 模型评估(Goodness of function)

损失示例:

对于模型的评估,我们一般采用损失函数来反应模型的好差,所以对于神经网络来说,采用交叉熵(cross entropy)函数来对y yy和y ^​\hat{y}​y^​​的损失进行计算。
总体损失:

对于损失,我们不单单要计算一笔数据的,而是要计算整体所有训练数据的损失,然后把所有的训练数据的损失都加起来,得到一个总体损失L。

2.3 选择最优函数(Pick best function)

我们使用梯度下降法去找最优函数和最好的一组参数。

三、反向传播

四、总结

通过本节的学习,我学会了:

本文参考:【DataWhale-李宏毅深度学习】

《深度学习》李宏毅 -- task4深度学习介绍和反向传播机制相关推荐

  1. 【李宏毅机器学习2021】Task04 深度学习介绍和反向传播机制

    [李宏毅机器学习2021]本系列是针对datawhale<李宏毅机器学习-2022 10月>的学习笔记.本次是对深度学习介绍和反向传播机制的学习总结.本节针对上节课内容,对batch.梯度 ...

  2. Datawhale 7月学习——李弘毅深度学习:深度学习介绍和反向传播机制

    前情回顾 机器学习简介 回归 误差与梯度下降 1 深度学习简介 1.1 深度学习的历史 李宏毅老师带我们简要回顾了深度学习的历史. 1958: Perceptron (linear model) 19 ...

  3. 深度学习与计算机视觉教程(4) | 神经网络与反向传播(CV通关指南·完结)

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/37 本文地址:https://www.showmeai.tech/article-d ...

  4. 深度学习的数学-卷积神经网络的误差反向传播

    文章目录 前言 正文 卷积神经网络中的关系式 卷积层 池化层 输出层 平方误差(损失函数) 梯度下降法 卷积层和输出层的神经单元误差(重点) 输出层的神经单元误差计算 输出层的神经单元与其权重偏置的关 ...

  5. 深度学习的数学-神经单元误差和反向传播

    文章目录 前言 正文 神经单元误差 梯度下降算法在实际应用中的难点 神经单元误差的定义和含义 神经单元误差关于权重和偏置的偏导数(重点) 关于权重的偏导数推导 偏置的偏导数推导 公式一般化 误差反向传 ...

  6. 深度学习 --- BP算法详解(误差反向传播算法)

    本节开始深度学习的第一个算法BP算法,本打算第一个算法为单层感知器,但是感觉太简单了,不懂得找本书看看就会了,这里简要的介绍一下单层感知器: 图中可以看到,单层感知器很简单,其实本质上他就是线性分类器 ...

  7. 深度学习笔记--pytorch从梯度下降到反向传播BP到线性回归实现,以及API调用和手写数据集的实现

    梯度下降和反向传播 目标 知道什么是梯度下降 知道什么是反向传播 1. 梯度是什么? 梯度:是一个向量,导数+变化最快的方向(学习的前进方向) 回顾机器学习 收集数据 x x x ,构建机器学习模型 ...

  8. java lstm_人人都能看懂的LSTM介绍及反向传播算法推导(非常详细)

    来自 | 知乎 地址 | https://zhuanlan.zhihu.com/p/83496936 作者 | 陈楠 编辑 | 机器学习算法与自然语言处理公众号 本文仅作学术分享,若侵权,请联系后台删 ...

  9. 收藏 | 人人都能看懂的LSTM介绍及反向传播算法推导

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者:陈楠 来源:知乎 链接:https://zhuanla ...

最新文章

  1. Redhat 5 配置DHCP服务器
  2. three.js写的游戏
  3. TPU3.0今日上岗!谷歌AI芯片甩竞争对手好几条街!
  4. mit risc-v 资料
  5. 设计模式之四(抽象工厂模式第一回合)
  6. matlab常用命令参考
  7. 覆盖所有面试知识点,送大厂面经一份!
  8. 短作业优先算法的缺点
  9. ES6_proxy_note
  10. 训练作用_感觉统合是什么意思,感觉统合训练有什么作用
  11. Kaldi(A1)语音识别原理
  12. 也谈USB重定向的方式
  13. 大学计算机信息技术课程评价,信息技术课程学习心得体会精选范文
  14. python中ospathjoin_python-在Windows上与os.path.join混合斜杠
  15. Cisco WAN的概念考试答案
  16. 最新版Eclipse2020创建项目红叉问题(“Failed to init ct.sym ...\jrt-fs.jar )
  17. 【SaaS播客】onboard4. 连线硅谷顶尖Product-Led Growth公司产品经理,聊聊如何打造一流PLG产品
  18. 华为依然执5G手机市场牛耳,不得不感叹它的强大
  19. 2-快速攻破vuex五大核心-附案例源码
  20. 网络工程——软科中国大学专业排名

热门文章

  1. 创业记-我的技术选型
  2. 程序员应该具备哪些素质
  3. 网站前端和后台性能优化的34条经验和方法
  4. git add/commit/pull之间的关系
  5. Tensor的Broadcasting操作
  6. CVPR2021论文整理
  7. python sklearn: 模型(如 SVM,PCA等)的保存与加载调用
  8. 二叉树先序、中序、后序的递归算法---《数据结构》
  9. 【转】Objective-C语法property详解
  10. Struts2的OGNL标签详解