点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自:机器学习算法那些事

图像分割,作为计算机视觉的基础,是图像理解的重要组成部分,也是图像处理的难点之一。

那么,如何优雅且体面的图像分割?

5行代码、分分钟实现的库——PixelLib,了解一下。

当然,如此好用的项目,开源是必须的。

为什么要用到图像分割?

虽然计算机视觉研究工作者,会经常接触图像分割的问题,但是我们还是需要对其做下“赘述”(方便初学者)。

我们都知道每个图像都是有一组像素值组成。简单来说,图像分割就是在像素级上,对图像进行分类的任务。

图像分割中使用的一些“独门秘技”,使它可以处理一些关键的计算机视觉任务。主要分为2类:

  • 语义分割:就是把图像中每个像素赋予一个类别标签,用不同的颜色来表示。

  • 实例分割:它不需要对每个像素进行标记,它只需要找到感兴趣物体的边缘轮廓就行。

它的身影也经常会出现在比较重要的场景中:

  • 无人驾驶汽车视觉系统,可以有效的理解道路场景。

  • 医疗图像分割,可以帮助医生进行诊断测试。

  • 卫星图像分析,等等。

所以,图像分割技术的应用还是非常重要的。

接下来,我们就直奔主题,开始了解一下PixelLib,这个神奇又好用的库。

快速安装PixelLib

PixelLib这个库可以非常简单的实现图像分割——5行代码就可以实现语义分割和实例分割。

老规矩,先介绍一下安装环境

安装最新版本的TensorFlow、Pillow、OpenCV-Python、scikit-image和PixelLib:

pip3 install tensorflow
pip3 install pillow
pip3 install opencv-python
pip3 install scikit-image
pip3 install pixellib

PixelLib实现语义分割

PixelLib在执行语义分割任务时,采用的是Deeplabv3+框架,以及在pascalvoc上预训练的Xception模型。

用在pascalvoc上预训练的Xception模型执行语义分割:

import pixellib
from pixellib.semantic import semantic_segmentation
segment_image = semantic_segmentation()
segment_image.load_pascalvoc_model(“deeplabv3_xception_tf_dim_ordering_tf_kernels.h5”)
segment_image.segmentAsPascalvoc(“path_to_image”, output_image_name = “path_to_output_image”)

让我们看一下每行代码:

import pixellib
from pixellib.semantic import semantic_segmentation#created an instance of semantic segmentation class
segment_image = semantic_segmentation()

用于执行语义分割的类,是从pixellib导入的,创建了一个类的实例。

segment_image.load_pascalvoc_model(“deeplabv3_xception_tf_dim_ordering_tf_kernels.h5”)

调用函数来加载在pascal voc上训练的xception模型(xception模型可以从文末传送门链接处下载)。

segment_image.segmentAsPascalvoc(“path_to_image”, output_image_name = “path_to_output_image”)

这是对图像进行分割的代码行,这个函数包含了两个参数:

  • path_to_image:图像被分割的路径。

  • path_to_output_image:保存输出图像的路径,图像将被保存在你当前的工作目录中。

接下来,上图,实战

图像文件命名为:sample1.jpg,如下图所示。

执行代码如下:

import pixellib
from pixellib.semantic import semantic_segmentation
segment_image = semantic_segmentation()
segment_image.load_pascalvoc_model(“deeplabv3_xception_tf_dim_ordering_tf_kernels.h5”)
segment_image.segmentAsPascalvoc(“sample1.jpg”, output_image_name = “image_new.jpg”)

可以看到,在执行代码后,保存的图像中,所有对象都被分割了。

也可以对代码稍作修改,获取一张带有目标对象分割重叠(segmentation overlay)的图像。

segment_image.segmentAsPascalvoc(“sample1.jpg”, output_image_name = “image_new.jpg”, overlay = True)

添加了一个额外的参数,并设置为True,就生成了带有分隔叠加的图像。

可以通过修改下面的代码,来检查执行分割所需的推理时间。

import pixellib
from pixellib.semantic import semantic_segmentation
import time
segment_image = semantic_segmentation()
segment_image.load_pascalvoc_model(“pascal.h5”)
start = time.time()
segment_image.segmentAsPascalvoc(“sample1.jpg”, output_image_name= “image_new.jpg”)
end = time.time()
print(f”Inference Time: {end-start:.2f}seconds”)

输出如下:

Inference Time: 8.19seconds

可以看到,在图像上执行语义分割,只用了8.19秒。

这个xception模型是用pascalvoc数据集训练的,有20个常用对象类别。

对象及其相应的color map如下所示:

PixelLib实现实例分割

虽然语义分割的结果看起来还不错,但在图像分割的某些特定任务上,可能就不太理想。

在语义分割中,相同类别的对象被赋予相同的colormap,因此语义分割可能无法提供特别充分的图像信息。

于是,便诞生了实例分割——同一类别的对象被赋予不同的colormap。

PixelLib在执行实例分割时,基于的框架是Mask RCNN,代码如下:

import pixellib
from pixellib.instance import instance_segmentation
segment_image = instance_segmentation()
segment_image.load_model(“mask_rcnn_coco.h5”)
segment_image.segmentImage(“path_to_image”, output_image_name = “output_image_path”)

同样,我们先来拆解一下每行代码。

import pixellib
from pixellib.instance import instance_segmentation
segment_image = instance_segmentation()

导入了用于执行实例分割的类,创建了该类的一个实例。

segment_image.load_model(“mask_rcnn_coco.h5”)

这是加载 Mask RCNN 模型来执行实例分割的代码(Mask RCNN模型可以从文末传送门链接处下载)。

segment_image.segmentImage(“path_to_image”, output_image_name = “output_image_path”)

这是对图像进行实例分割的代码,它需要两个参数:

  • path_to_image:模型所要预测图像的路径。

  • output_image_name:保存分割结果的路径,将被保存在当前的工作目录中。

上图,实战第二弹!

图像文件命名为:sample2.jpg,如下图所示。

执行代码如下:

import pixellib
from pixellib.instance import instance_segmentation
segment_image = instance_segmentation()
segment_image.load_model(“mask_rcnn_coco.h5”)
segment_image.segmentImage(“sample2.jpg”, output_image_name = “image_new.jpg”)

上图便是保存到目录的图片,现在可以看到语义分割和实例分割之间的明显区别——在实例分割中,同一类别的所有对象,都被赋予了不同的colormap。

若是想用边界框(bounding box)来实现分割,可以对代码稍作修改:

segment_image.segmentImage(“sample2.jpg”, output_image_name = “image_new.jpg”, show_bboxes = True)

这样,就可以得到一个包含分割蒙版和边界框的保存图像。

同样的,也可以通过代码查询实例分割的推理时间:

import pixellib
from pixellib.instance import instance_segmentation
import time
segment_image = instance_segmentation()
segment_image.load_model(“mask_rcnn_coco.h5”)
start = time.time()
segment_image.segmentImage(“former.jpg”, output_image_name= “image_new.jpg”)
end = time.time()
print(f”Inference Time: {end-start:.2f}seconds”)

输出结果如下:

Inference Time: 12.55 seconds

可以看到,在图像上执行实例分割,需要12.55秒的时间。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

5 行代码实现图像分割相关推荐

  1. 图像分割技术语义分割代码_用5行代码对150类对象进行语义分割

    图像分割技术语义分割代码 It is now possible to perform segmentation on 150 classes of objects using ade20k model ...

  2. 简单粗暴,5行代码,快速实现图像分割

    点击上方"视学算法",选择"星标"公众号 重磅干货,第一时间送达 本文来自量子位 图像分割,作为计算机视觉的基础,是图像理解的重要组成部分,也是图像处理的难点之 ...

  3. 5行代码,快速实现图像分割,代码逐行详解,手把手教你处理图像 | 开源

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 图像分割,作为计算机视觉的基础,是图像理解的重要组成部分,也是图像处理的难点之一. 那么,如何优雅且体面的图像分割? 5行代码.分分钟实现的 ...

  4. 只需5行代码,手把手教你快速实现图像分割,代码逐行详解!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 转载自:量子位 图像分割,作为计算机视觉的基础,是图像理解的重要组成部分,也是图像 ...

  5. Github 3.4k星,200余行代码,让你实时从视频中隐身

    项目作者 | Jason Mayes 转自 | 机器之心    参与 | Oblivion Max.思 只需网页端,秒速消失不留痕. Jason Mayes 是一名在谷歌工作的资深网页工程师,他长期致 ...

  6. 100行代码搞定实时视频人脸表情识别(附代码)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|OpenCV学堂 好就没有写点OpenCV4 + Open ...

  7. 实战:使用 Python 用不到 10 行代码计算汽车数量

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 在这篇文章中,将教你如何使用 Python 用 10 行代码构建自 ...

  8. 【炫酷秀】仅用4行代码再现《黑客帝国》数字雨,可立即在终端实现!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 提到<黑客帝国>,字符雨可谓是让人印象深刻. 这种科技感爆棚的特效,你 ...

  9. 200余行代码,让你实时从视频中隐身

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 来源 | 机器之心 只需网页端,秒速消失不留痕. Jas ...

最新文章

  1. Scrum 项目 7.0
  2. 初识Mysql(part8)--我需要知道的5个关于计算字段的小知识
  3. Visual Studio将原生支持WSL 2
  4. SpringMVC的视图解析器
  5. birt报表的行隐藏和列隐藏以及分组显示
  6. Python 爬取 11 万 Java 程序员信息竟有这些重大发现!
  7. 值类型和引用类型和数据大小排名
  8. 6. Zend Studio
  9. matlab int 求定积分
  10. 微软surface屏幕测试软件,Soomal作品 - Microsoft 微软 Surface Book 笔记本电脑屏幕测评报告和色彩校正 [Soomal]...
  11. win10使用nssm注册服务
  12. CSS3实现八方向云台控制器器样式
  13. 尼尔机械纪元免安装中文 2B的姐姐单机游戏 NieR Automata +修改器解锁存档
  14. IPC进程间通信/跨进程通信
  15. 数据结构和算法学习网站
  16. 啊5G 你比4G多1G
  17. Python 自动化教程(2) : Excel自动化:使用pandas库
  18. access2007 mysql_Access2007基础教程:开始使用Access 2007
  19. SQL中DATEADD用法
  20. Google Drive文件共享链接在.sh中使用方法

热门文章

  1. 特斯拉全新自动驾驶芯片最强?英伟达回怼,投资者用脚投票
  2. 萌新养成 | AI科技大本营实习生招募计划
  3. 打一场AI竞赛,让你知道我的厉害
  4. 重磅 | 王劲被百度起诉后首露面:称打印机电脑已报废,赔了318块钱,没接到法院传票
  5. 观点 | 哈哈,TensorFlow被吐槽了吧
  6. Intellij IDEA 高效使用教程
  7. Web登录很简单?开玩笑!
  8. 两天标星2.2K!GitHub 开源自动刷喵币项目?
  9. JAVA多线程和并发基础面试问答
  10. 2021深度学习的研究方向推荐!Transformer、Self-Supervised、Zero-Shot和多模态