点击我爱计算机视觉标星,更快获取CVML新技术


YOLACT 是ICCV 2019 接收的实时实例分割论文 YOLACT: Real-time Instance Segmentation 提出的算法,近期该文作者又对此进行了扩展,提出YOLACT++:Better Real-time Instance Segmentation,其 resnet50 模型在Titan Xp 上运行速度达 33.5 fps,在COCO 的test-dev数据集上达到34.1 mAP,并开源了代码。

论文作者/代码开发者来自加州大学戴维斯分校。

下图为YOLACT/YOLACT++ 与其他实例分割算法速度和精度的比较:

可见 YOLACT 系列具有较大的速度优势,YOLACT++ 则又在 YOLACT基础上精度提高不少。

以下视频为该文作者在ICCV 2019 公布的实例分割Demo:

这些结果并非后期处理的,而是在GPU上实时运行出来的。

YOLACT 网络架构:

在COCO数据集上与其他算法更详细的比较结果:

YOLACT / YOLACT++ 取得了速度最快的同时,取得了不错的分割精度。

作者已经开源了多个模型:

并提供了代码,可以很方便在COCO数据集上评测性能:

# Display qualitative results on COCO. From here on I'll use a confidence threshold of 0.15.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --display

以及对图像和视频上跑实例分割:

# Display qualitative results on the specified image.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=my_image.png# Process an image and save it to another file.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=input_image.png:output_image.png# Process a whole folder of images.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --images=path/to/input/folder:path/to/output/folder
# Display a video in real-time. "--video_multiframe" will process that many frames at once for improved performance.# If you want, use "--display_fps" to draw the FPS directly on the frame.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=my_video.mp4# Display a webcam feed in real-time. If you have multiple webcams pass the index of the webcam you want instead of 0.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=0# Process a video and save it to another file. This uses the same pipeline as the ones above now, so it's fast!python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=input_video.mp4:output_video.mp4

同时该代码也开放了训练程序,开发者可以很轻松在COCO 、Pascal SBD上训练模型,并添加 多GPU 支持。

如果开发者想要在自己的数据集上训练实例分割,只需要有COCO风格的目标检测标注JSON数据即可。

以下是分割结果示例:

论文地址:

https://arxiv.org/pdf/1912.06218.pdf

开源地址:

https://github.com/dbolya/yolact

目前该代码已经获得 2K+ 颗星,是近期最热门的实例分割开源库。


图像分割交流群

关注最新最前沿的语义分割、全景分割、实例分割技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:分割)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

coco 语义分割_YOLACT++:目前最热门的实时实例分割开源库相关推荐

  1. YOLACT++:目前最热门的实时实例分割开源库

    点击我爱计算机视觉标星,更快获取CVML新技术 YOLACT 是ICCV 2019 接收的实时实例分割论文 YOLACT: Real-time Instance Segmentation 提出的算法, ...

  2. 速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法 | 技术头条

    作者 | Daniel Bolya Chong Zhou Fanyi Xiao Yong Jae Lee 译者 | 刘畅 责编 | Jane 出品 | AI科技大本营(id:rgznai100) [导 ...

  3. 速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法

    这个带分割是25帧,有漏检. 速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法 原文:速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法 | 技术头条 https:/ ...

  4. 超Mask RCNN速度4倍,仅在单个GPU训练的实时实例分割算法

    点击我爱计算机视觉标星,更快获取CVML新技术 作者 | Daniel Bolya Chong Zhou Fanyi Xiao Yong Jae Lee 译者 | 刘畅 责编 | Jane 出品 | ...

  5. 170 FPS!YolactEdge:边缘设备上的实时实例分割,已开源!

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:AI人工智能初学者 论文:https://arxiv.org/abs/2012.1 ...

  6. YOLACT实时实例分割

    Abstract 我们提出了一个简单的.完全卷积的实时实例分割模型,在MS-COCO上达到29.8map,在单个Titan Xp上以33.5fps的速度进行评估,这比以往任何竞争方法都要快得多.而且, ...

  7. 实时实例分割的Deep Snake:CVPR2020论文点评

    实时实例分割的Deep Snake:CVPR2020论文点评 Deep Snake for Real-Time Instance Segmentation 论文链接:https://arxiv.org ...

  8. 在英特尔独立显卡上部署YOLOv5 v7.0版实时实例分割模型

    作者:贾志刚 英特尔物联网创新大使 目录 1.1 YOLOv5实时实例分割模型简介 1.2 英特尔®消费级锐炫™ A 系列显卡简介 1.3  在英特尔独立显卡上部署YOLOv5-seg模型的完整流程 ...

  9. YolactEdge:首个开源边缘设备上的实时实例分割(Jetson AGX Xavier: 30 FPS)

    YolactEdge 是第一个可在小型边缘设备上以实时速度运行的有竞争力的实例分割方法. 在550x550分辨率的图像上,以ResNet-101为主干网的YolactEdge 在Jetson AGX ...

最新文章

  1. 解题报告:Fake Maxpooling(单调队列求矩阵的和)
  2. 微信 小程序组件 分页传参
  3. VTK:演示调用数据的用法实战
  4. eplan单线原理图多线原理图_【原创分享】西门子PLC电路图高效设计——基于EPLAN与TIA Selection...
  5. 测试Windows Live Writer对cnBlog的支持
  6. logback 常用配置详解appender
  7. POJ 1236 Network of Schools(强连通 Tarjan+缩点)
  8. numpy教程:逻辑函数Logic functions
  9. e盾网络验证源码_趣味设计模式系列:代理模式JDK动态代理源码解析,一文便知
  10. Java SE基础教程——Eclipse开发工具的安装与使用
  11. abs绝对位置指令 三菱plc_三菱FX系列PLC方便指令的使用方法
  12. 2020年中国球墨铸管行业发展背景、竞争格局及政策环境分析,城市管道建设带来行业增量,新兴铸管是行业龙头「图」
  13. 【财富空间】曾国藩:三分精明,七分厚道,做人最高境界
  14. 多线程爬虫爬取电影天堂资源
  15. 计算机中scsi是什么翻译中文,SCSI命令概述(翻译)
  16. visiting a friend意念传送点
  17. 中小学信息学可以参加的比赛
  18. 小鱼征服鼠标宏—第一天—获取鼠标x,y坐标实时动态
  19. RBA认证咨询,认证三个等级分类只针对VAP审核
  20. html 栏目切换幻灯片效果,很酷的切换效果 纯CSS3幻灯片实现

热门文章

  1. 【CVPR 2020】Learning RoI Transformer for Oriented Object Detection in Aerial Images
  2. [转]tensorflow中的gather
  3. Tensorflow默认占满全部GPU的全部资源
  4. CleanCodeHandbook Chapter 7: Stack(39-41)
  5. maven的setting文件简单配置
  6. 求数组中k个数的所有组合
  7. Spring Boot加载指定属性文件
  8. Zookeeper基础使用
  9. bzoj2733 永无乡 splay树的启发式合并
  10. 设置 cookie过期时间