• 最近想写的东西有点多,先随便写点吧,也让我屡屡思路——说白了就是太懒
model {faster_rcnn {num_classes: 3  //获取要识别的类数image_resizer {keep_aspect_ratio_resizer {min_dimension: 128  //最小的图片像素max_dimension: 1024  //最大的图片像素}}feature_extractor {  // 特征提取的配置type: "faster_rcnn_resnet101"first_stage_features_stride: 16  //rpn特征图的输出}first_stage_anchor_generator {  //构建Anchorgrid_anchor_generator {  //构建过程二选一,是使用grid_anchor_generator还是ssd_anchor_generator 使用传入的参数对grid_anchor_generator进行初始化height_stride: 16  //锚点的高度 default = 16width_stride: 16  //锚点的高度 default = 16scales: 0.1scales: 0.25scales: 0.5scales: 0.75scales: 1.0scales: 2.0aspect_ratios: 0.5aspect_ratios: 1.0aspect_ratios: 1.5aspect_ratios: 2.0}}first_stage_box_predictor_conv_hyperparams {  //卷积神经网络的参数op: CONVregularizer {l2_regularizer {  //选择一种归一化方法weight: 0.00002}}initializer {truncated_normal_initializer { //选择一种初始化方法stddev: 0.00999999977648}}}first_stage_nms_score_threshold: 0.0 //用于第一层的nms的值 default=0.0first_stage_nms_iou_threshold: 0.66  //第一层中重叠率的阈值  default=0.7first_stage_max_proposals: 100  //多少个rpn提出的nms进入第二阶段 default=300first_stage_localization_loss_weight: 2.0  //第一阶段的定位的损失权重在反向中的比例  default=1.0first_stage_objectness_loss_weight: 1.0  第一阶段总物品判断的损失比例 default=1.0initial_crop_size: 14  //ROI 池化层上切取的输出的大小maxpool_kernel_size: 2  //在ROI pooling上切取的feature map上进行池化是的核的大小maxpool_stride: 2  // 上面的有了核的大小,现在是步长second_stage_box_predictor {  //第二个识别阶段的参数mask_rcnn_box_predictor {fc_hyperparams {op: FCregularizer {l2_regularizer {weight: 0.0000012}}initializer {  //初始化权重的方式variance_scaling_initializer {  //选择一种初始化方法factor: 1.0uniform: truemode: FAN_AVG}}}use_dropout: truedropout_keep_probability: 1.0}}second_stage_post_processing {  //在第二阶段的box的预测上的预处理batch_non_max_suppression {score_threshold: 0.300000011921  //前景box的最低阈值 default = 0.0iou_threshold: 0.600000023842  //进行融合是的IOU阈值 default = 0.6max_detections_per_class: 40  //每一个类别最多返回多少个检测 default = 100max_total_detections: 40  // 总共最多返回多少个 default = 100}score_converter: SOFTMAX  // Score converter to use}second_stage_localization_loss_weight: 2.0  //第二阶段定位的损失比例second_stage_classification_loss_weight: 1.0  //第二阶段的识别的损失比例}
}
train_config {batch_size: 1data_augmentation_options {  // 数据扩容的选项random_horizontal_flip {}}data_augmentation_options {random_crop_image {}}data_augmentation_options {random_adjust_brightness {}}optimizer {momentum_optimizer {learning_rate {manual_step_learning_rate {initial_learning_rate: 0.000300000014249schedule {step: 1learning_rate: 0.000300000014249}schedule {step: 900000learning_rate: 2.99999992421e-05}schedule {step: 1200000learning_rate: 3.00000010611e-06}}}momentum_optimizer_value: 0.8666625}use_moving_average: false  // default=false}gradient_clipping_by_norm: 10.0   如果大于0,在将梯度在这个值进行截断fine_tune_checkpoint: "/********/model.ckpt"// 如果是从一个检测(detection)模型进行恢复,则分类// 数量必须相等,如果不定则检查点要从一个识别(classification)模型恢复from_detection_checkpoint: true  //default=false
}

 num_classes: 该参数为必调项,与该模型设计需要检测的缺陷种类数量相同。
 image_resizer: 该参数为原始图像的缩放尺寸指示,通常有两种配置方式:
 keep_aspect_ratio_resizer:输入图像的大小是可变的,但是需要保持长宽比,
它有两个子参数:min_dimension和max_dimension,表示最小和最大维度,例如:
min_dimension :800
max_dimension:1000
image_resizer配置-固定长宽比
其含义是对于任一个图片,最短的边最小是800,最长的边最大是1024。举例:假设输入的图像尺寸是100 * 100,则会调整到800 * 800;输入为2000 * 2000,会调整为1024 * 1024,输入为900 * 1000,则首先会将短边调整到800,然后长边按比例调整到(800 / 900) * 1000。
 feature_extractor:表示用于特征提取的backbone网络的选型
First_stage_features_stride表示第一阶段特征提取步长,根据经验,训练时可以保持 16 不变,如果待检测目标比较密集且较小,则可以尝试将其修改为8,以降低特征提取步长,提高特征提取密度,从而提升模型效果。修改为4的话会导致及结算量巨大,而且容易导致训练的过度抖动,难以拟合,因此建议最小改成8。
 first_stage_anchor_generator:用于指示在RPN网络在feature map上生成锚点的策略。
对RPN的性能有较大影响,因为它直接影响着提取出来的候选框区域的数量、大小、密度等因素。如果生成的proposals太少,或者尺度不合理,则可能导致对于大小目标检测的失衡,或者对部分目标的漏检;而设置的太多,则又会增加训练难度,加大运算量,同时使得RPN网络拟合困难。因此,需要根据具体情况具体分析后,结合经验值进行合理的设定。
first_stage_anchor_generator {
grid_anchor_generator {
height_stride: 16
width_stride: 16
scales: 0.1
scales: 0.25
scales: 0.5
scales: 1.0
scales: 2.0
aspect_ratios: 0.5
aspect_ratios: 1.0
aspect_ratios: 1.5
aspect_ratios: 2.0
}
}
相邻的Anchor中心点横向间隔为16,纵向间隔也是16。
对于每一个anchor中心点,以它为中心围绕其生成20个anchor。这20个anchor的尺寸分别为0.1, 0.25,0.5,1.0,2.0;长宽比分别为0.5,1.0,1.5,2.0。也就是说,分别会以中心点坐标为中心,生成长0.1,宽0.10.5;长0.10.5,宽0.1 … … 的共20个anchor,所有的长宽分别是[scales] x [aspect_ratios]。
在模型训练时,可通过加密scales以及aspec_ratios来对RPN网络产生影响,但是要注意把握计算量、训练拟合难度、数据特征等因素质检的权衡,否则很容易导致模型的RPN网络不收敛,从而使得训练一直震荡。

faster-rcnn参数介绍相关推荐

  1. Faster RCNN参数详解

    1.首先是function model =ZF_for_Faster_RCNN_VOC2007(model)中的参数 % Stride in inputimage pixels at the last ...

  2. Faster R-CNN论文笔记——FR

    转载自:http://blog.csdn.net/qq_17448289/article/details/52871461 在介绍Faster R-CNN之前,先来介绍一些前验知识,为Faster R ...

  3. Faster RCNN解析

    在介绍Faster R-CNN之前,先来介绍一些前验知识,为Faster R-CNN做铺垫. 一.基于Region Proposal(候选区域)的深度学习目标检测算法 Region Proposal( ...

  4. 实例分割模型Mask R-CNN详解——从R-CNN,Fast R-CNN,Faster R-CNN再到Mask R-CNN

    转载自 jiongnima 原文链接 https://blog.csdn.net/jiongnima/article/details/79094159 Mask R-CNN是ICCV 2017的bes ...

  5. OCR:深度学习-目标检测-超详细图解Faster R-CNN

    版权声明:本文为博主原创文章,转载请标明原始博文地址: https://blog.csdn.net/yuanlulu/article/details/86769589 本文动机 说实话,介绍Faste ...

  6. 实例分割模型Mask R-CNN详解:从R-CNN,Fast R-CNN,Faster R-CNN再到Mask R-CNN

    Mask R-CNN是ICCV 2017的best paper,彰显了机器学习计算机视觉领域在2017年的最新成果.在机器学习2017年的最新发展中,单任务的网络结构已经逐渐不再引人瞩目,取而代之的是 ...

  7. R-CNN、Fast R-CNN、Faster R-CNN网络结构、框架原理详解

    一.基于Region Proposal(候选区域)的深度学习目标检测算法 Region Proposal(候选区域),就是预先找出图中目标可能出现的位置,通过利用图像中的纹理.边缘.颜色等信息,保证在 ...

  8. 经典目标检测算法:RCNN、Fast RCNN、 Faster RCNN 基本思想和网络结构介绍

    目录 一.目标检测的基本介绍 1.1 什么是目标检测? 1.2 目标检测算法的分类 二.RCNN 2.1 RCNN简介 2.2 RCNN算法流程 2.3 RCNN流程图 2.4 RCNN框架 2.5 ...

  9. DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Faster R-CNN算法的简介(论文介绍) 1.实验结果 2.三者架构对 ...

  10. 关于RPN中proposal的坐标回归参数的一点理解及Faster R-CNN的学习资料

    在Faster R-CNN的区域生成网络RPN中为了能够以目标真实框(Ground Truth box)为监督信号去训练RPN网络依据anchor预测proposal的位置,作者并不是直接回归prop ...

最新文章

  1. 从上往下 流式布局_教大家怎么写前端布局
  2. 一个可以卷起来的蓝牙键盘,简直是办公码字神器!
  3. mysql-atlas安装及使用教程
  4. python写小程序-用python编写一个闹钟小程序
  5. 01-iOS之wifi通讯开发简介
  6. 电源芯片选择DC/DC还是LDO?《转》
  7. 2013计算机系统导论,【精选】2013计算机系统导论-期末考卷-发布.pdf
  8. Linux-kernel网桥代码分析(二)
  9. 亚马逊分类目录_新版亚马逊分类目录v2.4程序源码官方分享下载
  10. 对称加密、非对称加密深度解析
  11. 三维点云学习(5)5-实现Deeplearning-PointNet-2-classfication
  12. C#类、方法的访问修饰符
  13. 华为ensp 交换机vlan配置
  14. ubuntu 下android设备找到fastboot驱动
  15. 神州数码c语言笔试题,神州数码笔试题,神州数码笔试题.doc
  16. a4在html中的尺寸,网页设立A4大小
  17. WebRTC之视频采集
  18. Linux XFS文件系统修复
  19. Vue2项目引入mars3d
  20. Codeforces Gym 100015G Guessing Game 差分约束

热门文章

  1. win10做好备份如何恢复系统
  2. 阳春三月来几个python基础吧
  3. Netflix公司Druid应用实践
  4. AE插件 镜头光晕插件 Optical Flares v1.3.8 (Win/Mac)
  5. 影响手机成像质量的因素
  6. 未来几年,谁能拯救手机拍照功能? 1
  7. 【Google Paper】对比学习用于解决推荐系统长尾问题
  8. 9367: 【动态规划】雷涛的小猫
  9. 小米手机通过USB连接电脑,共享使用电脑的网络
  10. 达人评测 i5 12490f和i7 12700f差距 酷睿i512490f和i712700f对比