faster-rcnn参数介绍
- 最近想写的东西有点多,先随便写点吧,也让我屡屡思路——说白了就是太懒
model {faster_rcnn {num_classes: 3 //获取要识别的类数image_resizer {keep_aspect_ratio_resizer {min_dimension: 128 //最小的图片像素max_dimension: 1024 //最大的图片像素}}feature_extractor { // 特征提取的配置type: "faster_rcnn_resnet101"first_stage_features_stride: 16 //rpn特征图的输出}first_stage_anchor_generator { //构建Anchorgrid_anchor_generator { //构建过程二选一,是使用grid_anchor_generator还是ssd_anchor_generator 使用传入的参数对grid_anchor_generator进行初始化height_stride: 16 //锚点的高度 default = 16width_stride: 16 //锚点的高度 default = 16scales: 0.1scales: 0.25scales: 0.5scales: 0.75scales: 1.0scales: 2.0aspect_ratios: 0.5aspect_ratios: 1.0aspect_ratios: 1.5aspect_ratios: 2.0}}first_stage_box_predictor_conv_hyperparams { //卷积神经网络的参数op: CONVregularizer {l2_regularizer { //选择一种归一化方法weight: 0.00002}}initializer {truncated_normal_initializer { //选择一种初始化方法stddev: 0.00999999977648}}}first_stage_nms_score_threshold: 0.0 //用于第一层的nms的值 default=0.0first_stage_nms_iou_threshold: 0.66 //第一层中重叠率的阈值 default=0.7first_stage_max_proposals: 100 //多少个rpn提出的nms进入第二阶段 default=300first_stage_localization_loss_weight: 2.0 //第一阶段的定位的损失权重在反向中的比例 default=1.0first_stage_objectness_loss_weight: 1.0 第一阶段总物品判断的损失比例 default=1.0initial_crop_size: 14 //ROI 池化层上切取的输出的大小maxpool_kernel_size: 2 //在ROI pooling上切取的feature map上进行池化是的核的大小maxpool_stride: 2 // 上面的有了核的大小,现在是步长second_stage_box_predictor { //第二个识别阶段的参数mask_rcnn_box_predictor {fc_hyperparams {op: FCregularizer {l2_regularizer {weight: 0.0000012}}initializer { //初始化权重的方式variance_scaling_initializer { //选择一种初始化方法factor: 1.0uniform: truemode: FAN_AVG}}}use_dropout: truedropout_keep_probability: 1.0}}second_stage_post_processing { //在第二阶段的box的预测上的预处理batch_non_max_suppression {score_threshold: 0.300000011921 //前景box的最低阈值 default = 0.0iou_threshold: 0.600000023842 //进行融合是的IOU阈值 default = 0.6max_detections_per_class: 40 //每一个类别最多返回多少个检测 default = 100max_total_detections: 40 // 总共最多返回多少个 default = 100}score_converter: SOFTMAX // Score converter to use}second_stage_localization_loss_weight: 2.0 //第二阶段定位的损失比例second_stage_classification_loss_weight: 1.0 //第二阶段的识别的损失比例}
}
train_config {batch_size: 1data_augmentation_options { // 数据扩容的选项random_horizontal_flip {}}data_augmentation_options {random_crop_image {}}data_augmentation_options {random_adjust_brightness {}}optimizer {momentum_optimizer {learning_rate {manual_step_learning_rate {initial_learning_rate: 0.000300000014249schedule {step: 1learning_rate: 0.000300000014249}schedule {step: 900000learning_rate: 2.99999992421e-05}schedule {step: 1200000learning_rate: 3.00000010611e-06}}}momentum_optimizer_value: 0.8666625}use_moving_average: false // default=false}gradient_clipping_by_norm: 10.0 如果大于0,在将梯度在这个值进行截断fine_tune_checkpoint: "/********/model.ckpt"// 如果是从一个检测(detection)模型进行恢复,则分类// 数量必须相等,如果不定则检查点要从一个识别(classification)模型恢复from_detection_checkpoint: true //default=false
}
num_classes: 该参数为必调项,与该模型设计需要检测的缺陷种类数量相同。
image_resizer: 该参数为原始图像的缩放尺寸指示,通常有两种配置方式:
keep_aspect_ratio_resizer:输入图像的大小是可变的,但是需要保持长宽比,
它有两个子参数:min_dimension和max_dimension,表示最小和最大维度,例如:
min_dimension :800
max_dimension:1000
image_resizer配置-固定长宽比
其含义是对于任一个图片,最短的边最小是800,最长的边最大是1024。举例:假设输入的图像尺寸是100 * 100,则会调整到800 * 800;输入为2000 * 2000,会调整为1024 * 1024,输入为900 * 1000,则首先会将短边调整到800,然后长边按比例调整到(800 / 900) * 1000。
feature_extractor:表示用于特征提取的backbone网络的选型
First_stage_features_stride表示第一阶段特征提取步长,根据经验,训练时可以保持 16 不变,如果待检测目标比较密集且较小,则可以尝试将其修改为8,以降低特征提取步长,提高特征提取密度,从而提升模型效果。修改为4的话会导致及结算量巨大,而且容易导致训练的过度抖动,难以拟合,因此建议最小改成8。
first_stage_anchor_generator:用于指示在RPN网络在feature map上生成锚点的策略。
对RPN的性能有较大影响,因为它直接影响着提取出来的候选框区域的数量、大小、密度等因素。如果生成的proposals太少,或者尺度不合理,则可能导致对于大小目标检测的失衡,或者对部分目标的漏检;而设置的太多,则又会增加训练难度,加大运算量,同时使得RPN网络拟合困难。因此,需要根据具体情况具体分析后,结合经验值进行合理的设定。
first_stage_anchor_generator {
grid_anchor_generator {
height_stride: 16
width_stride: 16
scales: 0.1
scales: 0.25
scales: 0.5
scales: 1.0
scales: 2.0
aspect_ratios: 0.5
aspect_ratios: 1.0
aspect_ratios: 1.5
aspect_ratios: 2.0
}
}
相邻的Anchor中心点横向间隔为16,纵向间隔也是16。
对于每一个anchor中心点,以它为中心围绕其生成20个anchor。这20个anchor的尺寸分别为0.1, 0.25,0.5,1.0,2.0;长宽比分别为0.5,1.0,1.5,2.0。也就是说,分别会以中心点坐标为中心,生成长0.1,宽0.10.5;长0.10.5,宽0.1 … … 的共20个anchor,所有的长宽分别是[scales] x [aspect_ratios]。
在模型训练时,可通过加密scales以及aspec_ratios来对RPN网络产生影响,但是要注意把握计算量、训练拟合难度、数据特征等因素质检的权衡,否则很容易导致模型的RPN网络不收敛,从而使得训练一直震荡。
faster-rcnn参数介绍相关推荐
- Faster RCNN参数详解
1.首先是function model =ZF_for_Faster_RCNN_VOC2007(model)中的参数 % Stride in inputimage pixels at the last ...
- Faster R-CNN论文笔记——FR
转载自:http://blog.csdn.net/qq_17448289/article/details/52871461 在介绍Faster R-CNN之前,先来介绍一些前验知识,为Faster R ...
- Faster RCNN解析
在介绍Faster R-CNN之前,先来介绍一些前验知识,为Faster R-CNN做铺垫. 一.基于Region Proposal(候选区域)的深度学习目标检测算法 Region Proposal( ...
- 实例分割模型Mask R-CNN详解——从R-CNN,Fast R-CNN,Faster R-CNN再到Mask R-CNN
转载自 jiongnima 原文链接 https://blog.csdn.net/jiongnima/article/details/79094159 Mask R-CNN是ICCV 2017的bes ...
- OCR:深度学习-目标检测-超详细图解Faster R-CNN
版权声明:本文为博主原创文章,转载请标明原始博文地址: https://blog.csdn.net/yuanlulu/article/details/86769589 本文动机 说实话,介绍Faste ...
- 实例分割模型Mask R-CNN详解:从R-CNN,Fast R-CNN,Faster R-CNN再到Mask R-CNN
Mask R-CNN是ICCV 2017的best paper,彰显了机器学习计算机视觉领域在2017年的最新成果.在机器学习2017年的最新发展中,单任务的网络结构已经逐渐不再引人瞩目,取而代之的是 ...
- R-CNN、Fast R-CNN、Faster R-CNN网络结构、框架原理详解
一.基于Region Proposal(候选区域)的深度学习目标检测算法 Region Proposal(候选区域),就是预先找出图中目标可能出现的位置,通过利用图像中的纹理.边缘.颜色等信息,保证在 ...
- 经典目标检测算法:RCNN、Fast RCNN、 Faster RCNN 基本思想和网络结构介绍
目录 一.目标检测的基本介绍 1.1 什么是目标检测? 1.2 目标检测算法的分类 二.RCNN 2.1 RCNN简介 2.2 RCNN算法流程 2.3 RCNN流程图 2.4 RCNN框架 2.5 ...
- DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Faster R-CNN算法的简介(论文介绍) 1.实验结果 2.三者架构对 ...
- 关于RPN中proposal的坐标回归参数的一点理解及Faster R-CNN的学习资料
在Faster R-CNN的区域生成网络RPN中为了能够以目标真实框(Ground Truth box)为监督信号去训练RPN网络依据anchor预测proposal的位置,作者并不是直接回归prop ...
最新文章
- 从上往下 流式布局_教大家怎么写前端布局
- 一个可以卷起来的蓝牙键盘,简直是办公码字神器!
- mysql-atlas安装及使用教程
- python写小程序-用python编写一个闹钟小程序
- 01-iOS之wifi通讯开发简介
- 电源芯片选择DC/DC还是LDO?《转》
- 2013计算机系统导论,【精选】2013计算机系统导论-期末考卷-发布.pdf
- Linux-kernel网桥代码分析(二)
- 亚马逊分类目录_新版亚马逊分类目录v2.4程序源码官方分享下载
- 对称加密、非对称加密深度解析
- 三维点云学习(5)5-实现Deeplearning-PointNet-2-classfication
- C#类、方法的访问修饰符
- 华为ensp 交换机vlan配置
- ubuntu 下android设备找到fastboot驱动
- 神州数码c语言笔试题,神州数码笔试题,神州数码笔试题.doc
- a4在html中的尺寸,网页设立A4大小
- WebRTC之视频采集
- Linux XFS文件系统修复
- Vue2项目引入mars3d
- Codeforces Gym 100015G Guessing Game 差分约束