在训练或者微调网络时我们需要设置一些参数,在caffe中这些参数保存在sovler.prototxt文件中(当然这只是一个文件名,你也可以随意换成其他的名称)。在下面的代码中以注释的形式解释每一个参数的意义。

net: "train.prototxt" #需要训练的网络名称
test_iter: 100 #测试时的迭代次数
test_interval: 500 #每迭代500次测试一次网络
#注意,test_iter和test_interval的设置与网络文件中data层的batch_size有关,具体设置如下:
#test_iter*batch_size(测试)=测试数据量
#test_interval*batch_size(训练)>>训练数据量
base_lr: 0.001 #学习率初始值0.01=1e-2(lr即learning rate)
momentum: 0.9 #动量
weight_decay: 0.0001
lr_policy: "step"#学习率成阶梯式递减
gamma: 0.1 #multiply the lr by a factor of gamma for each stepsize iteration
stepsize: 100000 #每迭代100,000次降低一次学习率 lr=lr/gamma
display: 500 #每500次显示一次结果
max_iter: 150000 #一共迭代150,000次
snapshot: 10000 #每10,000次向caffemodel/文件夹内存放一个model
snapshot_prefix: "./caffemodel/"
solver_mode: GPU #GPU方式运行
device_id: 7 #7号GPU运行

learning_rate有四种设置方式,具体可参见文章:[learning rate的四种改变方式] http://blog.csdn.net/cheese_pop/article/details/52024479)

有一些参数还不是很清楚意义,有待补充。

caffe中solver.prototxt文件参数解释相关推荐

  1. [转]caffe中solver.prototxt参数说明

    https://www.cnblogs.com/denny402/p/5074049.html solver算是caffe的核心的核心,它协调着整个模型的运作.caffe程序运行必带的一个参数就是so ...

  2. caffe中通过prototxt文件查看神经网络模型结构的方法

    在修改propotxt之前我们可以对之前的网络结构进行一个直观的认识: 可以使用http://ethereon.github.io/netscope/#/editor 这个网址. 将propotxt文 ...

  3. caffe 中solver.prototxt

    关于cifar-10和mnist的weight_decay和momentum也是相当的重要:就是出现一次把cifar-10的两个值直接用在mnist上,发现错误很大. 转载于:https://www. ...

  4. 浅谈caffe中train_val.prototxt和deploy.prototxt文件的区别

    浅谈caffe中train_val.prototxt和deploy.prototxt文件的区别 标签: caffe深度学习CaffeNet 2016-11-02 16:10 1203人阅读 评论(1) ...

  5. 【视频相关】视频中常出现的参数解释——2018年6月16日

    视频中常出现的参数解释 [帧 Frame] 帧速率(FPS,frame per second 帧率):每秒钟出现的帧数 由胶片概念的产生而出现,把静态的连续画面进行播放以达到动态影像需要每秒出现8格, ...

  6. x264中重要结构体参数解释,参数设置,函数说明

    x264中重要结构体参数解释 http://www.usr.cc/thread-51995-1-3.html x264参数设置 http://www.usr.cc/thread-51996-1-3.h ...

  7. linux——ifcfg-ens33文件参数解释

    早上在用ifconfig命令的时候得到的IP是192.168.137.132,但是看ifcfg-ens33文件里面IP配置的是192.168.137.129,通过请教大神和百度得知,是与ifcfg-e ...

  8. solver.prototxt文件里面参数含义及其设置

    solver 是caffe的核心之重,它是整个模型运行的参数配置文件.运行代码一般为: #caffe train --solver=*_solver.prototxt 在DL中,损失函数(loss f ...

  9. yolov5 detect文件参数解释(部分)

    detect.py中参数解释 default默认值 def parse_opt(): parser = argparse.ArgumentParser() parser.add_argument('– ...

最新文章

  1. SaltStack(五) SaltStack与ZeroMQ
  2. 字符串的全排列(字典序排列)
  3. SecureCRT脚本之WaitForString函数
  4. Android 抓包工具r0capture使用
  5. 泰坦尼克号 数据分析_第1部分:泰坦尼克号-数据分析基础
  6. 对于一颗完全二叉树,要求给所有节点加上一个pNext指针,指向同一层的相邻节点;如果当前节点已经是该层的最后一个节点,则将pNext指针指向NULL;给出程序实现,并分析时间复杂度和空间复杂度。
  7. 什么叫缺位_一位父亲能够给予孩子的最好礼物是什么?看看这部电影给出的答案...
  8. codeforces166E - Tetrahedron DP
  9. python开发图片_python实现图片上添加图片
  10. 【序列化与反序列化流】
  11. io 流 txt本地生成
  12. vue mysql交互_几种vue的数据交互形式
  13. python字符串及基本运算
  14. 微信群机器人管理系统源码
  15. 人体颈椎神经分布图高清,颈椎神经系统分布图片
  16. Python语言:散修笔记
  17. html在线打印插件,jQuery简单易用的网页内容打印插件
  18. 科普达人丨漫画图解什么是eRDMA?
  19. [论文笔记]Maiter:一种基于Delta的累积迭代计算的异步图处理框架
  20. 主板下有螺母垫板的拧螺丝的CPU散热器,螺母垫板的固定一法

热门文章

  1. IPv6网络协议的安全疑云
  2. Eclipse(STS) 初次搭建Spring Cloud项目之断路器Hystrix(五)
  3. shell和linux的认识
  4. React.Fragment 包裹标签
  5. shell基础之if语句
  6. Codeforces Round #325 (Div. 2) Laurenty and Shop 模拟
  7. 安卓开发实现画廊效果
  8. flex制作swc文件
  9. java多线程------实现多线程两种方式
  10. Ural 1207. Median on the Plane(计算几何)