在自己配置训练网络时的solver文件中这个参数选择有好多种策略。

接下来看看caffe.proto文件的这个参数:

[cpp] view plaincopy
  1. // The learning rate decay policy. The currently implemented learning rate
  2. // policies are as follows:
  3. //    - fixed: always return base_lr.
  4. //    - step: return base_lr * gamma ^ (floor(iter / step))
  5. //    - exp: return base_lr * gamma ^ iter
  6. //    - inv: return base_lr * (1 + gamma * iter) ^ (- power)
  7. //    - multistep: similar to step but it allows non uniform steps defined by
  8. //      stepvalue
  9. //    - poly: the effective learning rate follows a polynomial decay, to be
  10. //      zero by the max_iter. return base_lr (1 - iter/max_iter) ^ (power)
  11. //    - sigmoid: the effective learning rate follows a sigmod decay
  12. //      return base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))
  13. //
  14. // where base_lr, max_iter, gamma, step, stepvalue and power are defined
  15. // in the solver parameter protocol buffer, and iter is the current iteration.

如果安装digists的话,可以按照here 进行选。

没装,按matlab实现:

[cpp] view plaincopy
  1. iter=1:50000;
  2. max_iter=50000;
  3. base_lr=0.01;
  4. gamma=0.0001;
  5. power=0.75;
  6. step_size=5000;
  7. % - fixed: always return base_lr.
  8. lr=base_lr*ones(1,50000);
  9. subplot(2,3,1)
  10. plot(lr)
  11. title('fixed')
  12. % - step: return base_lr * gamma ^ (floor(iter / step))
  13. lr=base_lr .* gamma.^(floor(iter./10000));
  14. subplot(2,3,2)
  15. plot(lr)
  16. title('step')
  17. % - exp: return base_lr * gamma ^ iter
  18. lr=base_lr * gamma .^ iter;
  19. subplot(2,3,3)
  20. plot(lr)
  21. title('exp')
  22. % - inv: return base_lr * (1 + gamma * iter) ^ (- power)
  23. lr=base_lr.*(1./(1+gamma.*iter).^power);
  24. subplot(2,3,4)
  25. plot(lr)
  26. title('inv')
  27. % - multistep: similar to step but it allows non uniform steps defined by
  28. % stepvalue
  29. % - poly: the effective learning rate follows a polynomial decay, to be
  30. % zero by the max_iter. return base_lr (1 - iter/max_iter) ^ (power)
  31. lr=base_lr *(1 - iter./max_iter) .^ (power);
  32. subplot(2,3,5)
  33. plot(lr)
  34. title('poly')
  35. % - sigmoid: the effective learning rate follows a sigmod decay
  36. % return base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))
  37. lr=base_lr *( 1./(1 + exp(-gamma * (iter - step_size))));
  38. subplot(2,3,6)
  39. plot(lr)
  40. title('sigmoid')

结果:

Caffe傻瓜系列(11):caffe中的lr_policy选择相关推荐

  1. Caffe学习系列(11):图像数据转换成db(leveldb/lmdb)文件

    在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,jpeg,png,tif等格式的,而且有可能图片的大小还不一致.而在caffe中经常使用的数据类型是lmdb或leveldb,因此就 ...

  2. javascript学习系列(11):数组中的findIndex方法

    最好的种树是十年前,其次是现在.歌谣 每天一个前端小知识 提醒你改好好学习了 知乎博主 csdn博主 b站博主  放弃很容易但是坚持一定很酷     我是歌谣 喜欢就一键三连咯 你得点赞是对歌谣最大的 ...

  3. 机器学习系列(11)_Python中Gradient Boosting Machine(GBM)调参方法详解

    原文地址:Complete Guide to Parameter Tuning in Gradient Boosting (GBM) in Python by Aarshay Jain 原文翻译与校对 ...

  4. Caffe新手教程傻瓜系列(9):训练和测试自己的图片

    在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,jpeg,png,tif等格式的,而且有可能图片的大小还不一致.而在caffe中经常使用的数据类型是lmdb或leveldb,因 ...

  5. Caffe学习系列(12):训练和测试自己的图片

    学习caffe的目的,不是简单的做几个练习,最终还是要用到自己的实际项目或科研中.因此,本文介绍一下,从自己的原始图片到lmdb数据,再到训练和测试模型的整个流程. 一.准备数据 有条件的同学,可以去 ...

  6. Caffe 学习系列

    学习列表: Google protocol buffer在windows下的编译 caffe windows 学习第一步:编译和安装(vs2012+win 64) caffe windows学习:第一 ...

  7. 【12】Caffe学习系列:训练和测试自己的图片

    一.准备数据 有条件的同学,可以去imagenet的官网http://www.image-net.org/download-images,下载imagenet图片来训练.验证码始终出不来需要翻墙(是g ...

  8. Caffe学习系列(7):solver及其配置

    solver算是caffe的核心的核心,它协调着整个模型的运作.caffe程序运行必带的一个参数就是solver配置文件.运行代码一般为 # caffe train --solver=*_slover ...

  9. Caffe学习系列(8):solver优化方法

    Caffe学习系列(8):solver优化方法 上文提到,到目前为止,caffe总共提供了六种优化方法: Stochastic Gradient Descent (type: "SGD&qu ...

  10. Caffe学习系列(17):模型各层特征和过滤器可视化

    转载自: Caffe学习系列(17):模型各层特征和过滤器可视化 - denny402 - 博客园 http://www.cnblogs.com/denny402/p/5105911.html cif ...

最新文章

  1. 实战:使用 OpenCV 和 PyTesseract 对文档进行OCR
  2. asmlib方式管理oracle asm环境下,新加存储需特别注意
  3. STM32 进阶教程 14 - 程序加密之FLASH读写保护
  4. dbgrid的最小高度设置。否则出现滚动条。
  5. ubuntu设置自启动服务程序
  6. SQL2008R2的 遍历所有表更新统计信息 和 索引重建
  7. matlab the installer cannot read,MATLAB安装 The installer cannot read the mwinstall.dll… | 学步园...
  8. php中id如何与删除关联,ThinkPHP查询语句与关联查询用法实例
  9. C++学习之路 | PTA(天梯赛)—— L2-010 排座位 (25分)(带注释)(并查集)(精简)
  10. 【Python】pyCryptodome模块实现AES加密、解密
  11. 2.Java 面试题整理(基础篇二)
  12. LogSegment分析
  13. CTF__(1)Web之SQL手工注入
  14. WebLogic简单的备份和恢复
  15. 如何生成PSSM矩阵
  16. 毕业设计开发板-基于C20S单片机恒温开发板
  17. 像《王者荣耀》一样红过
  18. 微信小程序使用iconfont图标 微信小程序上传图片
  19. python读取stl文件三维坐标_python vtk 读取三维raw数据存为stl
  20. 多位点序列分型_bionumerics应用16-全基因多位点序列分型(wgMLST)

热门文章

  1. Python 中的几种矩阵乘法 np.dot, np.multiply, *【转】
  2. 【JAVA笔记——术】JAVA LIST DEL遍历方式研究
  3. 常用iOS游戏开发工具与SDK
  4. SQL Server 2005 技术内幕之T-SQL查询——逻辑查询处理(上)
  5. 深入理解JavaScript系列
  6. MASM32编程将TimeStamp/UTC转换为具体日期时间的几个有用函数代码
  7. 我的航拍直升机 控制基站软件的编写历程(2.1)
  8. 【漫画】兔子,胡萝卜和屎
  9. 第2章 JSP数据交互(一)
  10. 遍历结构体内部元素和值(Name and Value)