官方文档:MMDetection–》点击进入

**

第一步 安装相关环境

**
1、MMDetection提供了GPU与CPU两个版本,但是cpu版本可用的算法会少很多。
2、参考我的前一篇博文安装好cuda等等环境
3、MMDetection所支持的最低依赖

Linux 和 macOS (Windows 理论上支持)Python 3.6+PyTorch 1.3+CUDA 9.2+ (如果基于 PyTorch 源码安装,也能够支持 CUDA 9.0)GCC 5+MMCV

4、开始安装MMDetection

  1. 使用 conda 新建虚拟环境,并进入该虚拟环境;
     conda create -n open-mmlab python=3.7 -yconda activate open-mmlab
  2.基于 PyTorch 官网安装 PyTorch 和 torchvision,例如:
    conda install pytorch torchvision -c pytorch
   3.我们建议使用 MIM 来安装 MMDetection:
pip install openmim
mim install mmdet

MIM 能够自动地安装 OpenMMLab 的项目以及对应的依赖包。

或者,可以手动安装 MMDetection:
安装 mmcv-full,我们建议使用预构建包来安装:

pip install mmcv-full -f https://download.openmmlab.com/mmcv/dist/{cu_version}/{torch_version}/index.html

需要把命令行中的 {cu_version} 和 {torch_version} 替换成对应的版本。例如:在 CUDA 11 和 PyTorch 1.7.0 的环境下,可以使用下面命令安装最新版本的 MMCV:

pip install mmcv-full -f https://download.openmmlab.com/mmcv/dist/cu110/torch1.7.0/index.html

请参考 MMCV 获取不同版本的 MMCV 所兼容的的不同的 PyTorch 和 CUDA 版本。同时,也可以通过以下命令行从源码编译 MMCV:

git clone https://github.com/open-mmlab/mmcv.git
cd mmcv
MMCV_WITH_OPS=1 pip install -e .  # 安装好 mmcv-full
cd ..

或者,可以直接使用命令行安装:

pip install mmcv-full

4.安装 MMDetection:

你可以直接通过如下命令从 pip 安装使用 mmdetection:

pip install mmdet

或者从 git 仓库编译源码

git clone https://github.com/open-mmlab/mmdetection.git
cd mmdetection
pip install -r requirements/build.txt
pip install -v -e .  # or "python setup.py develop"

5.安装额外的依赖以使用 Instaboost, 全景分割, 或者 LVIS 数据集

# 安装 instaboost 依赖
pip install instaboostfast
# 安装全景分割依赖
pip install git+https://github.com/cocodataset/panopticapi.git
# 安装 LVIS 数据集依赖
pip install git+https://github.com/lvis-dataset/lvis-api.git
# 安装 albumentations 依赖
pip install albumentations>=0.3.2 --no-binary imgaug,albumentations

验证

为了验证是否正确安装了 MMDetection 和所需的环境,我们可以运行示例的 Python 代码来初始化检测器并推理一个演示图像:

from mmdet.apis import init_detector, inference_detectorconfig_file = 'configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py'
# 从 model zoo 下载 checkpoint 并放在 `checkpoints/` 文件下
# 网址为: http://download.openmmlab.com/mmdetection/v2.0/faster_rcnn/faster_rcnn_r50_fpn_1x_coco/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth
checkpoint_file = 'checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth'
device = 'cuda:0'
# 初始化检测器
model = init_detector(config_file, checkpoint_file, device=device)
# 推理演示图像
inference_detector(model, 'demo/demo.jpg')

如果成功安装 MMDetection,则上面的代码可以完整地运行。




具体的内容可以点击传送门MODEL_ZOO库

第二步 正式进入学习

1、在已有的数据集上进行推理

MMDetection 在 Model Zoo 中提供了数以百计的检测模型,并支持多种标准数据集,包括 Pascal VOC,COCO,Cityscapes,LVIS 等。这份文档将会讲述如何使用这些模型和标准数据集来运行一些常见的任务,包括:

  • 使用现有模型在给定图片上进行推理
  • 在标准数据集上测试现有模型
  • 在标准数据集上训练预定义的模

2、使用现有模型进行推理

推理是指使用训练好的模型来检测图像上的目标。在 MMDetection 中,一个模型被定义为一个配置文件和对应的存储在 checkpoint 文件内的模型参数的集合。

首先,我们建议从 Faster RCNN 开始,其 配置 文件和 checkpoint 文件在此。 我们建议将 checkpoint 文件下载到 checkpoints 文件夹内。

3、推理的高层编程接口

MMDetection 为在图片上推理提供了 Python 的高层编程接口。下面是建立模型和在图像或视频上进行推理的例子。

from mmdet.apis import init_detector, inference_detector
import mmcv# 指定模型的配置文件和 checkpoint 文件路径
config_file = 'configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py'
checkpoint_file = 'checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth'# 根据配置文件和 checkpoint 文件构建模型
model = init_detector(config_file, checkpoint_file, device='cuda:0')# 测试单张图片并展示结果
img = 'test.jpg'  # 或者 img = mmcv.imread(img),这样图片仅会被读一次
result = inference_detector(model, img)
# 在一个新的窗口中将结果可视化
model.show_result(img, result)
# 或者将可视化结果保存为图片
model.show_result(img, result, out_file='result.jpg')# 测试视频并展示结果
video = mmcv.VideoReader('video.mp4')
for frame in video:result = inference_detector(model, frame)model.show_result(frame, result, wait_time=1)

异步接口-支持 Python 3.7+

对于 Python 3.7+,MMDetection 也有异步接口。利用 CUDA 流,绑定 GPU 的推理代码不会阻塞 CPU,从而使得 CPU/GPU 在单线程应用中能达到更高的利用率。在推理流程中,不同数据样本的推理和不同模型的推理都能并发地运行。

您可以参考 tests/async_benchmark.py 来对比同步接口和异步接口的运行速度。

import asyncio
import torch
from mmdet.apis import init_detector, async_inference_detector
from mmdet.utils.contextmanagers import concurrentasync def main():config_file = 'configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py'checkpoint_file = 'checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth'device = 'cuda:0'model = init_detector(config_file, checkpoint=checkpoint_file, device=device)# 此队列用于并行推理多张图像streamqueue = asyncio.Queue()# 队列大小定义了并行的数量streamqueue_size = 3for _ in range(streamqueue_size):streamqueue.put_nowait(torch.cuda.Stream(device=device))# 测试单张图片并展示结果img = 'test.jpg'  # or 或者 img = mmcv.imread(img),这样图片仅会被读一次async with concurrent(streamqueue):result = await async_inference_detector(model, img)# 在一个新的窗口中将结果可视化model.show_result(img, result)# 或者将可视化结果保存为图片model.show_result(img, result, out_file='result.jpg')asyncio.run(main())

演示样例

我们还提供了三个演示脚本,它们是使用高层编程接口实现的。
图片样例
这是在单张图片上进行推理的脚本,可以开启 --async-test 来进行异步推理。

python demo/image_demo.py \${IMAGE_FILE} \${CONFIG_FILE} \${CHECKPOINT_FILE} \[--device ${GPU_ID}] \[--score-thr ${SCORE_THR}] \[--async-test]

运行样例:

python demo/image_demo.py demo/demo.jpg \configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py \checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth \--device cpu

摄像头样例

这是使用摄像头实时图片的推理脚本。

python demo/webcam_demo.py \${CONFIG_FILE} \${CHECKPOINT_FILE} \[--device ${GPU_ID}] \[--camera-id ${CAMERA-ID}] \[--score-thr ${SCORE_THR}]

运行样例:

python demo/webcam_demo.py \configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py \checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth

视频样例

这是在视频样例上进行推理的脚本。

python demo/video_demo.py \${VIDEO_FILE} \${CONFIG_FILE} \${CHECKPOINT_FILE} \[--device ${GPU_ID}] \[--score-thr ${SCORE_THR}] \[--out ${OUT_FILE}] \[--show] \[--wait-time ${WAIT_TIME}]

运行样例:

python demo/video_demo.py demo/demo.mp4 \configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py \checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth \--out result.mp4

在标准数据集上测试现有模型

为了测试一个模型的精度,我们通常会在标准数据集上对其进行测试。MMDetection 支持多个公共数据集,包括 COCO , Pascal VOC ,Cityscapes 等等。 这一部分将会介绍如何在支持的数据集上测试现有模型。

数据集准备

一些公共数据集,比如 Pascal VOC 及其镜像数据集,或者 COCO 等数据集都可以从官方网站或者镜像网站获取。 注意:在检测任务中,Pascal VOC 2012 是 Pascal VOC 2007 的无交集扩展,我们通常将两者一起使用。 我们建议将数据集下载,然后解压到项目外部的某个文件夹内,然后通过符号链接的方式,将数据集根目录链接到 $MMDETECTION/data 文件夹下,格式如下所示。 如果你的文件夹结构和下方不同的话,你需要在配置文件中改变对应的路径。

mmdetection
├── mmdet
├── tools
├── configs
├── data
│   ├── coco
│   │   ├── annotations
│   │   ├── train2017
│   │   ├── val2017
│   │   ├── test2017
│   ├── cityscapes
│   │   ├── annotations
│   │   ├── leftImg8bit
│   │   │   ├── train
│   │   │   ├── val
│   │   ├── gtFine
│   │   │   ├── train
│   │   │   ├── val
│   ├── VOCdevkit
│   │   ├── VOC2007
│   │   ├── VOC2012

有些模型需要额外的 COCO-stuff 数据集,比如 HTC,DetectoRS 和 SCNet,你可以下载并解压它们到 coco 文件夹下。文件夹会是如下结构:

mmdetection
├── data
│   ├── coco
│   │   ├── annotations
│   │   ├── train2017
│   │   ├── val2017
│   │   ├── test2017
│   │   ├── stuffthingmaps

PanopticFPN 等全景分割模型需要额外的 COCO Panoptic 数据集,你可以下载并解压它们到 coco/annotations 文件夹下。文件夹会是如下结构:

mmdetection

├── data
│   ├── coco
│   │   ├── annotations
│   │   │   ├── panoptic_train2017.json
│   │   │   ├── panoptic_train2017
│   │   │   ├── panoptic_val2017.json
│   │   │   ├── panoptic_val2017
│   │   ├── train2017
│   │   ├── val2017
│   │   ├── test2017

Cityscape 数据集的标注格式需要转换,以与 COCO 数据集标注格式保持一致,使用 tools/dataset_converters/cityscapes.py 来完成转换:

pip install cityscapesscriptspython tools/dataset_converters/cityscapes.py \./data/cityscapes \--nproc 8 \--out-dir ./data/cityscapes/annotations

测试现有模型

我们提供了测试脚本,能够测试一个现有模型在所有数据集(COCO,Pascal VOC,Cityscapes 等)上的性能。我们支持在如下环境下测试:

  • 单 GPU 测试

  • 单节点多 GPU 测试

  • 多节点测试

根据以上测试环境,选择合适的脚本来执行测试过程。

# 单 GPU 测试
python tools/test.py \${CONFIG_FILE} \${CHECKPOINT_FILE} \[--out ${RESULT_FILE}] \[--eval ${EVAL_METRICS}] \[--show]# 单节点多 GPU 测试
bash tools/dist_test.sh \${CONFIG_FILE} \${CHECKPOINT_FILE} \${GPU_NUM} \[--out ${RESULT_FILE}] \[--eval ${EVAL_METRICS}]

可选参数:

RESULT_FILE: 结果文件名称,需以 .pkl 形式存储。如果没有声明,则不将结果存储到文件。

EVAL_METRICS: 需要测试的度量指标。可选值是取决于数据集的,比如 proposal_fast,proposal,bbox,segm 是 COCO 数据集的可选值,mAP,recall 是 Pascal VOC 数据集的可选值。Cityscapes 数据集可以测试 cityscapes 和所有 COCO 数据集支持的度量指标。

show: 如果开启,检测结果将被绘制在图像上,以一个新窗口的形式展示。它只适用于单 GPU 的测试,是用于调试和可视化的。请确保使用此功能时,你的 GUI 可以在环境中打开。否则,你可能会遇到这么一个错误 cannot connect to X server。

--show-dir: 如果指明,检测结果将会被绘制在图像上并保存到指定目录。它只适用于单 GPU 的测试,是用于调试和可视化的。即使你的环境中没有 GUI,这个选项也可使用。

--show-score-thr: 如果指明,得分低于此阈值的检测结果将会被移除。

--cfg-options: 如果指明,这里的键值对将会被合并到配置文件中。

--eval-options: 如果指明,这里的键值对将会作为字典参数被传入 dataset.evaluation() 函数中,仅在测试阶段使用。

MMDetection学习教程(一)相关推荐

  1. mmdetection 学习教程(一)mmdetection安装、最简示例、最简分析

    目录 一.mmdetection安装 二.mmdetection最简单示例 三.mmdetection demo最简单分析 easy_demo.py的github下载链接欢迎star 参考:mmdet ...

  2. MMDetection学习笔记(一):训练与测试

    MMDetection学习笔记(一):训练与测试 MMDetection介绍 Config配置文件 配置文件结构 配置文件命名 配置文件示例 自定义COCO格式数据 MMDetection使用 训练 ...

  3. Vyond制作2D动画学习教程

    Vyond为2D动画提供了极其简单的分解视频创建过程. 你会学到什么 课程获取:Vyond制作2D动画学习教程-云桥网 您将学习如何为2d动画制作画外音 您将学习如何使用Vyond轻松创建精彩的动画视 ...

  4. MAYA 2022基础入门学习教程

    流派:电子学习| MP4 |视频:h264,1280×720 |音频:AAC,48.0 KHz 语言:英语+中英文字幕(根据原英文字幕机译更准确)|大小解压后:3.41 GB |时长:4.5小时 包含 ...

  5. 3dmax Vray建筑可视化入门学习教程

    面向初学者的3Ds Max Vray最佳Archviz可视化课程 从安装到最终图像的一切都将从头开始教授,不需要任何经验 大小解压后:3.25G 时长4h 6m 1280X720 MP4 语言:英语+ ...

  6. Unity 创建2D平台游戏开发学习教程

    了解如何使用C#在Unity中创建您的第一款2D平台游戏 你会学到什么 使用Unity创建2D奥运会 使用可脚本化的对象和单一模式 使用良好的编程实践 创造武器和射弹 使用可脚本化的对象和委托模式创建 ...

  7. Blender 3.0基础入门学习教程 Introduction to Blender 3.0

    成为Blender通才,通过这个基于项目的循序渐进课程学习所有主题的基础知识. 你会学到什么 教程获取:Blender 3.0基础入门学习教程 Introduction to Blender 3.0- ...

  8. UE5废墟破坏游戏场景创建学习教程

    为游戏创建毁坏的资产–深入教程课程 了解一个专业的环境艺术家在为游戏创建毁坏的资产时是如何工作的.您将学习正确的资产规划.创建模块化资产.创建损坏的混凝土和柱子.创建损坏的木材/地板.创建碎石堆.模拟 ...

  9. Maya游戏角色绑定入门学习教程 Game Character Rigging for Beginners in Maya

    准备好开始为游戏制作自己的角色动画了吗? 你会学到什么 了解Maya的界面 优化并准备好你的模型,为游戏做准备 了解关节以及如何使用它们来构建健壮的角色骨骼,以便在任何游戏引擎中制作动画 了解IK和F ...

  10. UE4材质着色器全面学习教程

    你会学到什么 通过所有着色器类型和设计的实际演示,学习创建材质 要求 对虚幻的基本理解会有所帮助 了解纹理的一般知识(不仅限于UE4)也很有用 描述 在这个系列中,我将带你设置大量不同的材料,教你如何 ...

最新文章

  1. MySQL日志分类及性能分析你应该知道的知识
  2. MongoDB与Spring Data项目
  3. springboot多环境加载yml和logback配置
  4. 【Vue.js源码解析 一】-- 响应式原理
  5. 最新试客联盟JS逆向分析
  6. idea apollo启动VM参数设置
  7. 抽奖砍价之类以均值为基础的波动算法 demo版本
  8. ZOJ 1709 Oil Deposits
  9. 2018 终了,是时候秀出我的 Git 进化日志了!
  10. ROS的学习(十四)用C++写一个简单的接收者
  11. PY++ 自动将你的C++程序接口封装供python调用
  12. python如何制作一个任意列表_我要悄悄学Python之列表(一)
  13. 六维空间向量表示法公式笔记
  14. View基础知识---MotionEvent和TouchSlop
  15. 使用域控批量安装软件
  16. [笔记] 关于通过鼠标滚轮设置缩放的技巧
  17. Javascript中公有成员,私有成员,静态成员
  18. 利用动网论坛dvBBS漏洞上传webshell
  19. 安装缺少的python包
  20. 科目二连续失败的反思

热门文章

  1. 游戏开发论坛_《原神》称霸苹果「2020年度iPhone游戏奖」
  2. 超炫150套❤vue+Echarts❤ 大屏可视化数据平台实战项目分享 (附源码)
  3. 陶哲轩实分析 3.2 节 习题试解
  4. Ruby Rails开发资源
  5. php微信上传临时素材,PHP实战:php微信开发之上传临时素材
  6. 分享ZKEYS公有云分销系统部署详细教程
  7. 玩qq游戏提示计算机内存不足,玩QQ游戏内存不足如何解决?
  8. 12306抢票源码 java_最新版12306抢票程序源代码
  9. 考研政治|马克思主义基本原理
  10. 阿里云网盘内测申请_最新阿里云网盘官方申请地址,哪里可以获得阿里网盘内测码?9月23日截至...