与其他人工设计的如Adam、AdaGrad等算法不同,VeLO完全基于AI构造,能够很好地适应各种不同的任务。

设计

基于元学习的思路(从相关任务上学习经验,来帮助学习目标任务),VeLO会吸收梯度并自动输出参数更新,无需任何超参数调优,并自适应需要优化的各种任务。

架构

VeLO优化器整体由LSTM(长短期记忆网络)和超网络MLP(多层感知机)构成。其中每个LSTM负责设置多个MLP的参数,各个LSTM之间则通过全局上下文信息进行相互协作。

训练

VeLO优化器采用元训练的方式,以参数值和梯度作为输入,输出需要更新的参数。经过4000个TPU月(一块TPU运行4000个月的计算量)的训练,集各种优化任务之所长后,VeLO横空出世。

和人工调参优化器相比

结果表明,VeLO在83个任务上的加速效果超过了一系列当前已有的优化器。与Adam相比,VeLO在所有任务上训练加速都更快,其中50%以上的任务比Adam快4倍以上,14%以上的任务中,VeLO甚至快上16倍。

如何使用VeLO

此 colab 演示了如何加载 VeLO 并将其用于一些常见任务。

GitHub地址:
https://github.com/google/learned_optimization/tree/main/learned_optimization/research/general_lopt

论文地址:
https://arxiv.org/abs/2211.09760

VeLO:让AI自己调整参数的新优化器相关推荐

  1. 谷歌大脑新优化器VeLO火了!让AI自己调整超参数,自适应不同任务,83个任务训练加速比经典Adam更快!...

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 萧箫 发自 凹非寺 转载自:量子位(QbitAI) 还在苦恼怎么给 ...

  2. 让AI自己调整超参数,谷歌大脑新优化器火了,自适应不同任务,83个任务训练加速比经典Adam更快...

    萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 还在苦恼怎么给优化器调整更好的参数吗? 现在,谷歌大脑搞出了一个新的优化器VeLO,无需手动调整任何超参数,直接用就完事了. 与其他人工设计的如A ...

  3. 谷歌推出新优化器Lion:优化算法的符号发现

    文章目录 谷歌推出新优化器Lion:优化算法的符号发现 Lion VS AdamW 论文实验 1.图像分类 2.视觉语言对比学习 3.扩散模型 4.语言建模和微调 5.与其他流行优化器的比较 超参数设 ...

  4. 2学习率调整_Keras的Adam优化器参数理解及自适应学习率

    Adam优化器是目前应用最多的优化器. optimizer--adam_小笨熊~~走向程序猿的~~历程~~专栏-CSDN博客​blog.csdn.net 在训练的过程中我们有时会让学习率随着训练过程自 ...

  5. 训练ViT和MAE减少一半计算量!Sea和北大提出新优化器Adan:深度模型都能用!

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 转载自:新智元  |  编辑:LRS 好困 [导读]换个优化器,计 ...

  6. 揭秘 TiDB 新优化器:Cascades Planner 原理解析

    作者:MingCong Han 在<十分钟成为 Contributor 系列 | 为 Cascades Planner 添加优化规则>中,我们简单介绍了 Cascades 的相关背景知识, ...

  7. 谷歌大脑提出VeLO优化器,无需调参,最高比Adam快16倍!

    文 | 萧箫 发自 凹非寺 源 | 量子位 还在苦恼怎么给优化器调整更好的参数吗? 现在,谷歌大脑搞出了一个新的优化器VeLO,无需手动调整任何超参数,直接用就完事了. 与其他人工设计的如Adam.A ...

  8. pytorch优化器学习率调整策略以及正确用法

    优化器 optimzier优化器的作用:优化器就是需要根据网络反向传播的梯度信息来更新网络的参数,以起到降低loss函数计算值的作用. 从优化器的作用出发,要使得优化器能够起作用,需要主要两个东西: ...

  9. 【torch.optim】优化器的使用 / 学习率的调整 / SWA策略

    torch.optim torch.optim是实现各种优化算法的包.大多数常用的方法都已得到支持,而且接口足够通用,因此将来还可以轻松集成更复杂的方法. 优化器 使用优化器 为了使用一个优化器,必须 ...

最新文章

  1. td里面的内容加了br不起作用_刀圈TD黑暗游侠,最容易打金之一!!
  2. PCM设备E1保护切换功能介绍
  3. mysql+tushare搭建本地数据库
  4. java面试手写单链表_(转)面试大总结之一:Java搞定面试中的链表题目
  5. myeclipse 10.7安装过程与初次启动
  6. 收到“此应用程序正在从后台线程修改自动布局引擎”错误?
  7. matlab2c使用c++实现matlab函数系列教程-wilkinson函数
  8. mysql临时表如何分页_sql server 与 mysql 分页查询以及创建临时表的区别
  9. ​关于技术变现的几点思考
  10. 机房收费系统---概要设计说明书
  11. 建议Mac M1关闭虚拟内存(交换内存 swap memory)
  12. KGB知识图谱开创技术应用新渠道
  13. 帝国cms 会员中心2.0
  14. 抽卡游戏的随机机制(转载)
  15. LinkTrack UWB定位系统NLink协议解析方法
  16. rx.xxx 和 io.reactivex.xxx RxJava1 和 RxJava2 和 RxJava3
  17. WIN7下使用iis搭建php环境(上)
  18. accept()函数说明
  19. 通过经纬度坐标计算距离
  20. mac系统下不用u盘怎么装win7系统

热门文章

  1. Johnson-Trotter算法求全排列
  2. 每个人表面上都想改变自己,但内心却都抗拒改变,这仅仅是人性的懒惰和矛盾?
  3. 设计师必备的30款好看的手写字体免费下载
  4. windows任务栏透明_如何使Windows 10任务栏完全透明
  5. 微信运动刷步数html前端源码,悦动圈步数提交协议漏洞分析实现微信运动刷步数...
  6. SVN:将分支合并到主干
  7. Metabase新一代自助数据探索型开源BI
  8. 【ArcGIS Pro二次开发】(5):UI管理_自定义控件的位置
  9. Web自动化测试(Selenium自动化测试框架)
  10. android模拟器自动化测试,安卓模拟器自动化测试工具