深度学习入门笔记(8)——optim

其实,我们在看过深度学习相关文章后,都会明白所说的训练其实就是在让预测结果和标签贴合,而评价贴合过程必采用损失函数,我们通过修改层级权重使得损失最小,而我们这部分要说的optim就是一种参数优化策略。
这里我们讲两种传统的优化方式,主要介绍一下一阶optim:
(1)一阶optim
这种方法使用各个参数的梯度值来更新参数 ,最常用的一阶优化算法是梯度下降所谓的梯度就是导数的多变量表达式,函数的梯度形成了各个向量场 ,同时也是一个方向,这个方向上方向导数最大,且等于梯度。梯度下降的功能是通过寻找最小值,控制方差,更新模型参数,最终使模型收敛。
(2)二阶optim
二阶使用的时Hessian方法(二阶导数)来最小化损失函数,但是计算太过复杂而不被推广。

优化算法的调用方式如下

optimizer = optim.Adam(fcn.parameters(), lr=1e-3)

这里是在搭建fcn时的调用,选取的adam学习策略,学习率初始取1e-3

深度学习入门笔记(8)——什么是optim?相关推荐

  1. pytorch深度学习入门笔记

    Pytorch 深度学习入门笔记 作者:梅如你 学习来源: 公众号: 阿力阿哩哩.土堆碎念 B站视频:https://www.bilibili.com/video/BV1hE411t7RN? 中国大学 ...

  2. 深度学习入门笔记系列(三)——感知器模型和 tensorboard 的使用方法

    本系列将分为 8 篇 .今天是第三篇 .主要讲讲感知器模型和 tensorboard 的基本使用方法 . 1. 感知器模型 因为小詹之前写过一篇感知器模型的介绍 ,这里就不赘述了 .有需要巩固的点击如 ...

  3. 深度学习入门笔记系列 ( 二 )——基于 tensorflow 的一些深度学习基础知识

    本系列将分为 8 篇 .今天是第二篇 .主要讲讲 TensorFlow 框架的特点和此系列笔记中涉及到的入门概念 . 1.Tensor .Flow .Session .Graphs TensorFlo ...

  4. 深度学习入门笔记(六):误差反向传播算法

    专栏--深度学习入门笔记 推荐文章 深度学习入门笔记(一):机器学习基础 深度学习入门笔记(二):神经网络基础 深度学习入门笔记(三):感知机 深度学习入门笔记(四):神经网络 深度学习入门笔记(五) ...

  5. 深度学习入门笔记(五):神经网络的学习

    专栏--深度学习入门笔记 推荐文章 深度学习入门笔记(一):机器学习基础 深度学习入门笔记(二):神经网络基础 深度学习入门笔记(三):感知机 深度学习入门笔记(四):神经网络 深度学习入门笔记(五) ...

  6. 深度学习入门笔记(四):神经网络

    专栏--深度学习入门笔记 推荐文章 深度学习入门笔记(一):机器学习基础 深度学习入门笔记(二):神经网络基础 深度学习入门笔记(三):感知机 深度学习入门笔记(四):神经网络 深度学习入门笔记(五) ...

  7. 深度学习入门笔记(十六):计算机视觉之边缘检测

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  8. 深度学习入门笔记(二):神经网络基础

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  9. 深度学习入门笔记(十五):深度学习框架(TensorFlow和Pytorch之争)

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  10. 深度学习入门笔记(五):神经网络的编程基础

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

最新文章

  1. Spring框架的灵魂IOC和AOP
  2. 【Linux开发】linux设备驱动归纳总结(七):2.内核定时器
  3. Python的压缩文件处理 zipfile tarfile
  4. SQL模糊查询 LIKE
  5. 图论--一般图带花树匹配--模板
  6. 决定c++语言中函数的返回值类型的是,全国2009年10月高等教育自学考试C++程序设计试题及部分参考答案...
  7. Java Web学习总结(26)——Servlet不同版本之间的区别
  8. python不用中间变量交换值_不使用中间变量,交换int型的 a, b两个变量的值。
  9. mysql增删改查大全_MySQL数据库增删改查SQL语句(2018整理集合大全)
  10. bat复制文件到指定目录同名_利用bat让文件在指定时间自动进行备份
  11. 记一次 JAVA 的内存泄露分析 1
  12. 【Caffe安装】ImportError: No module named caffe 的解决方案
  13. 关于android中的armeabi、armeabi-v7a、arm64-v8a及x86等用splits用指定打包
  14. 如何修改ssh端口号
  15. fpga如何约束走线_FPGA入门之我见- 布局布线(place route,PAR)
  16. 玩头条整整20天了,发的内容只有头条,已有差不多250元的收益了
  17. opencv去除照片红眼
  18. 福州大学计算机学院李敏,福州大学厦门工艺美术学院
  19. Kubernetes 150 个操作练习 (中)
  20. 施耐德电气:以服务和数字化推动可持续落地

热门文章

  1. [137]win10想开测试模式,提示“设置元素数据时出错
  2. win10无线断开无法连接服务器,简单几步解决win10wifi一直断开连接不上的问题
  3. win10升级补丁_win10教育版有什么优缺点
  4. OpenHarmony学习笔记——编辑器访问Linux服务器进行编译
  5. 微信小程序计算三角形面积和三棱锥体积
  6. 每日单词20110606
  7. 为什么红黑树的时间复杂度为lgn——渐进边界的证明
  8. navicat本地同步到navicat cloud
  9. 【MDT】iPhone XS 系列屏幕素质报告
  10. 短视频剪辑的九大技巧分享