↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

Datawhale推荐

作者:李沐,CMU,亚马逊首席科学家

1.要有目标。你需要有目标。短的也好,长的也好。认真定下的也好,别人那里捡的也好。就跟随机梯度下降需要有个目标函数一样。

2.目标要大。不管是人生目标还是目标函数,你最好不要知道最后可以走到哪里。如果你知道,那么你的目标就太简单了,可能是个凸函数。你可以在一开始的时候给自己一些小目标,例如期末考个80分,训练一个线性模型。但接下来得有更大的目标,财富自由也好,100亿参数的变形金刚也好,得足够一颗赛艇。

3.坚持走。不管你的目标多复杂,随机梯度下降都是最简单的。每一次你找一个大概还行的方向(梯度),然后迈一步(下降)。两个核心要素是方向和步子的长短。但最重要的是你得一直走下去,能多走几步就多走几步。

4.痛苦的卷。每一步里你都在试图改变你自己或者你的模型参数。改变带来痛苦。但没有改变就没有进步。你过得很痛苦不代表在朝着目标走,因为你可能走反了。但过得很舒服那一定在原地踏步。需要时刻跟自己作对。

5.可以躺平。你用你内心的激情来迈步子。步子太小走不动,步子太长容易过早消耗掉了激情。周期性的调大调小步长效果挺好。所以你可以时不时休息休息。

6.四处看看。每一步走的方向是你对世界的认识。如果你探索的世界不怎么变化,那么要么你的目标太简单,要么你困在你的舒适区了。随机梯度下降的第一个词是随机,就是你需要四处走走,看过很多地方,做些错误的决定,这样你可以在前期迈过一些不是很好的舒适区。

7.快也是慢。你没有必要特意去追求找到最好的方向和最合适的步子。你身边当然会有幸运之子,他们每一步都在别人前面。但经验告诉我们,随机梯度下降前期进度太快,后期可能乏力。就是说你过早的找到一个舒适区,忘了世界有多大。所以你不要急,前面徘徊一段时间不是坏事。成名无需太早。

8.赢在起点。起点当然重要。如果你在终点附近起步,可以少走很多路。而且终点附近的路都比较平,走着舒服。当你发现别人不如你的时候,看看自己站在哪里。可能你就是运气很好,赢在了起跑线。如果你跟别人在同一起跑线,不见得你能做更好。

9.很远也能到达。如果你是在随机起点,那么做好准备前面的路会非常不平坦。越远离终点,越人迹罕见。四处都是悬崖。但随机梯度下降告诉我们,不管起点在哪里,最后得到的解都差不多。当然这个前提是你得一直按照梯度的方向走下去。如果中间梯度炸掉了,那么你随机一个起点,调整步子节奏,重新来。

10.独一无二。也许大家有着差不多的目标,在差不多的时间毕业买房结婚生娃。但每一步里,每个人内心中看到的世界都不一样,导致走的路不一样。你如果跑多次随机梯度下降,在各个时间点的目标函数值可能都差不多,但每次的参数千差万别。不会有人关心你每次训练出来的模型里面参数具体是什么值,除了你自己。

11.简单最好 。当然有比随机梯度下降更复杂的算法。他们想每一步看想更远更准,想步子迈最大。但如果你的目标很复杂,简单的随机梯度下降反而效果最好。深度学习里大家都用它。关注当前,每次抬头瞄一眼世界,快速做个决定,然后迈一小步。小步快跑。只要你有目标,不要停,就能到达。

干货学习,三连

李沐:用随机梯度下降来优化人生!相关推荐

  1. 李沐:用随机梯度下降来优化人生

    作者 | 李沐 整理 | NewBeeNLP 知乎上刷到沐神的新作,非常有趣,分享给大家~ 第一次听到『用随机梯度下降来优化人生』这个说法还是几年前和一家NLP创业公司CEO的聊天,当时就非常印象深刻 ...

  2. 用随机梯度下降来优化人生

    用随机梯度下降来优化人生 >>>> 本文转自知乎 要有目标.你需要有目标.短的也好,长的也好.认真定下的也好,别人那里捡的也好.就跟随机梯度下降需要有个目标函数一样. 目标要大 ...

  3. NeurIPS'18 | 种群进化随机梯度下降深度神经网络优化算法框架

    ,欢迎关注公众号:论文收割机(paper_reader) 因为排版问题,很多图片和公式无法直接显示,欢迎关注我们的公众号点击目录来阅读原文. 原文点击 ↓ 种群进化随机梯度下降深度神经网络优化算法框架 ...

  4. 深度学习必备:随机梯度下降(SGD)优化算法及可视化

    补充在前:实际上在我使用LSTM为流量基线建模时候,发现有效的激活函数是elu.relu.linear.prelu.leaky_relu.softplus,对应的梯度算法是adam.mom.rmspr ...

  5. 机器学习算法(优化)之一:梯度下降算法、随机梯度下降(应用于线性回归、Logistic回归等等)...

    本文介绍了机器学习中基本的优化算法-梯度下降算法和随机梯度下降算法,以及实际应用到线性回归.Logistic回归.矩阵分解推荐算法等ML中. 梯度下降算法基本公式 常见的符号说明和损失函数 X :所有 ...

  6. 深度学习(31)随机梯度下降九: Himmelblau函数优化实战

    深度学习(31)随机梯度下降九: Himmelblau函数优化实战 1. Himmelblau函数 2. 函数优化实战 1. Himmelblau函数 Himmelblau函数是用来测试后话算法的常用 ...

  7. 【深度学习】——梯度下降优化算法(批量梯度下降、随机梯度下降、小批量梯度下降、Momentum、Adam)

    目录 梯度 梯度下降 常用的梯度下降算法(BGD,SGD,MBGD) 梯度下降的详细算法 算法过程 批量梯度下降法(Batch Gradient Descent) 随机梯度下降法(Stochastic ...

  8. 深度学习系列之随机梯度下降(SGD)优化算法及可视化

    补充在前:实际上在我使用LSTM为流量基线建模时候,发现有效的激活函数是elu.relu.linear.prelu.leaky_relu.softplus,对应的梯度算法是adam.mom.rmspr ...

  9. 线性收敛的随机优化算法之 SAG、SVRG(随机梯度下降)

    原文出处:https://zhuanlan.zhihu.com/p/22402784?utm_source=tuicool&utm_medium=referral 这篇文章回顾了基于梯度的随机 ...

最新文章

  1. Keepalived — VRRP 的 Linux 软件实现
  2. [ActionScript 3.0] AS3.0 简单封装Socket的通信
  3. python从入门到精通学习笔记_Python从入门到精通之基础概念
  4. 截取指定内容/截取用逗号隔开的各个关键字
  5. 使用split进行分割时遇到特殊字符的问题
  6. SAP后台执行大数据量报表(鹦鹉学舌篇)
  7. gd-flags |= GD_FLG_RELOC; 问题遗留
  8. 信息学奥赛一本通(1011:甲流疫情死亡率)
  9. JavaScript正则表达式的坑很深
  10. Linux 命令(99)—— dirname 命令
  11. 简单的php cms,30个很棒的PHP开源CMS内容管理系统
  12. 流程图神器——代码转流程图软件、在线流程图绘制软件
  13. c语言实验报告4结构体,c语言实验报告结构体.doc
  14. 应用层下的人脸识别(三):人脸比对
  15. 竟可监控员工离职倾向!一系统引发大争议
  16. 小程序自定义日期组件,不显示今日之后的日期
  17. anaconda下载python的库_Anaconda下载及安装及查看安装的Python库用法
  18. 致远项目管理SPM系统之合同评审
  19. 那些从技术岗转变到管理岗,可能踩过的坑
  20. Python中的print()函数

热门文章

  1. 关于字符串的分割问题
  2. PHP拿到别人项目如何修改为自己
  3. [置顶] 单例模式lua实现
  4. Task02:青少年软件编程(Scratch)等级考试模拟卷(一级)
  5. Python程序设计 第六章 函数(续
  6. Python 办公自动化,一键给PDF文件加密,超方便
  7. Go modules基础精进,六大核心概念全解析(下)
  8. 网易有道词典笔 —— 73 岁“人类高质量”奶奶梅耶马斯克的中文学习之选
  9. 没有熙熙攘攘,百度VR在世界大会的一场奇妙之旅
  10. 2020年企业业务营收同比增长23.0%,华为的数字化转型实践之道