PaddleSeg快速开始：

通过本实例可以学习使用预训练好的图像分割模型进行预测（以常见的人像分割任务为例）

人像分割：

人像分割任务旨在识别图像中的人体轮廓，与背景进行分离，返回分割后的二值图、灰度图、前景人像图，适应多个人体、复杂背景、各类人体姿态。可应用于人像扣图、人体特效和影视后期处理等场景。

下面是结果图，左边是输入图像，右边是使用训练模型进行测试得到的人体分割图

下面进行具体演示：

Step1:PaddleSeg安装

PaddleSeg是基于PaddlePaddle生态下的语义分割库，可结合丰富的预训练模型更便捷高效地进行语义分割。

本实例已经挂载了paddleseg的安装包，可以直接解压即可。

#解压从https://github.com/PaddlePaddle/PaddleSeg下载好的压缩包
！unzip PaddleSeg-release-v0.1.0.zip#将PaddleSeg代码上移至当前目录
!mv PaddleSeg-release-v0.1.0/* ~#安装所依赖项
！pip install -r requirements.txt

结果如图所示

Step2:模型简介（这里使用的是DeepLabv3+xception网络检测人像）

DeepLabv3+介绍：它是DeepLab语义分割系列网络的最新作，通过encoder-decoder进行多尺度信息的融合，同时保留了原来的空洞卷积和ASSP层，其骨干网络使用了Xception模型，提高了语义分割的健壮性和运行速率。

Xception介绍：是DeepLabv3+原始实现的backbone网络，兼顾精度和性能，适用于服务端部署。

Step3:预训练模型下载：

下载预训练好的DeepLabv3+xception65模型

#下载预训练模型并放入./pretrained_model目录下
%cd /home/aistudio/pretrained_model/
!wget https://paddleseg.bj.bcebos.com/models/deeplabv3p_xception65_humanseg.tgz
!tar -xvf deeplabv3p_xception65_humanseg.tgz

Step4:数据准备

这里用少量数据集做模型测试。

# 将测试数据集放入./dataset目录下,其中data/data10908/humanseg.zip是测试数据集的位置
%cd ~
!cp data/data10908/humanseg.zip dataset/
!unzip -o dataset/humanseg.zip -d dataset/

结果如下所示

其中test_list.txt是测试数据集的路径及文件名

Step5:模型预测和可视化

pdseg/vis.py 是模型预测和可视化的脚本

模型配置说明：PaddleSeg中关于模型的配置记录在yaml文件里。configs文件夹存放各个模型的yaml文件。

#!/bin/bash#将配置文件humanseg.yaml复制到configs目录下
!cp work/humanseg.yaml configs/
# 模型预测
#--cfg ./configs/humanseg.yaml\是指定yaml配置文件路径
#--vis_dir ./visual \是指定测试结果存放路径
#---use_gpu是指是否使用gpu
#DATASET.DATA_DIR是指测试数据集存放位置
#DATASET.TEST_FILE_LIST是指测试数据集的测试列表
#TEST.TEST_MODEL是指测试模型路径
!python ./pdseg/vis.py  --cfg ./configs/humanseg.yaml\--vis_dir ./visual \--use_gpu \DATASET.DATA_DIR "/home/aistudio/dataset/humanseg" \DATASET.TEST_FILE_LIST "/home/aistudio/dataset/humanseg/test_list.txt" \TEST.TEST_MODEL "/home/aistudio/pretrained_model/deeplabv3p_xception65_humanseg"

实验结果如下所示：

/home/aistudio/pdseg/utils/collect.py:138: YAMLLoadWarning: calling yaml.load() without Loader=... is deprecated, as the default Loader is unsafe. Please read https://msg.pyyaml.org/load for full details.dic = yaml.load(file)
{'AUG': {u'AUG_METHOD': u'unpadding',u'FIX_RESIZE_SIZE': (513, 513),u'FLIP': True,u'FLIP_RATIO': 0.2,u'INF_RESIZE_VALUE': 513,u'MAX_RESIZE_VALUE': 400,u'MAX_SCALE_FACTOR': 2.0,u'MIN_RESIZE_VALUE': 513,u'MIN_SCALE_FACTOR': 0.5,u'MIRROR': True,'RICH_CROP': {u'ASPECT_RATIO': 0,u'BLUR': True,u'BLUR_RATIO': 0.1,u'BRIGHTNESS_JITTER_RATIO': 0.5,u'CONTRAST_JITTER_RATIO': 0.5,u'ENABLE': True,u'MAX_ROTATION': 45,u'MIN_AREA_RATIO': 0,u'SATURATION_JITTER_RATIO': 0.5},u'SCALE_STEP_SIZE': 0.25},u'BATCH_SIZE': 24,'DATALOADER': {u'BUF_SIZE': 256, u'NUM_WORKERS': 8},'DATASET': {u'DATA_DIM': 3,u'DATA_DIR': '/home/aistudio/dataset/humanseg',u'IGNORE_INDEX': 255,u'IMAGE_TYPE': 'rgb',u'NUM_CLASSES': 2,u'PADDING_VALUE': [104.00799749999999,116.66899995,122.67499965],u'SEPARATOR': '|',u'TEST_FILE_LIST': '/home/aistudio/dataset/humanseg/test_list.txt',u'TEST_TOTAL_IMAGES': 15,u'TRAIN_FILE_LIST': u'dataset/humanseg/test_list.txt',u'TRAIN_TOTAL_IMAGES': 15,u'VAL_FILE_LIST': u'dataset/humanseg/test_list.txt',u'VAL_TOTAL_IMAGES': 15,u'VIS_FILE_LIST': None},u'EVAL_CROP_SIZE': (513, 513),'FREEZE': {u'MODEL_FILENAME': u'model',u'PARAMS_FILENAME': u'params',u'SAVE_DIR': u'human_freeze_model'},u'MEAN': [0.4078745, 0.45752549, 0.48107843],'MODEL': {u'BN_MOMENTUM': 0.99,'DEEPLAB': {u'ASPP_WITH_SEP_CONV': True,u'BACKBONE': 'xception_65',u'DECODER_USE_SEP_CONV': True,u'DEPTH_MULTIPLIER': 1.0,u'ENABLE_DECODER': True,u'ENCODER_WITH_ASPP': True,u'OUTPUT_STRIDE': 16},u'DEFAULT_EPSILON': 1e-05,u'DEFAULT_GROUP_NUMBER': 32,u'DEFAULT_NORM_TYPE': u'bn',u'FP16': False,'ICNET': {u'DEPTH_MULTIPLIER': 0.5, u'LAYERS': 50},u'MODEL_NAME': 'deeplabv3p',u'MULTI_LOSS_WEIGHT': [1.0],'PSPNET': {u'DEPTH_MULTIPLIER': 1, u'LAYERS': 50},u'SCALE_LOSS': 1.0,'UNET': {u'UPSAMPLE_MODE': u'bilinear'}},'SOLVER': {u'BEGIN_EPOCH': 1,u'DECAY_EPOCH': [10, 20],u'GAMMA': 0.1,u'LR': 0.1,u'LR_POLICY': 'poly',u'MOMENTUM': 0.9,u'MOMENTUM2': 0.999,u'NUM_EPOCHS': 40,u'OPTIMIZER': 'sgd',u'POWER': 0.9,u'WEIGHT_DECAY': 4e-05},u'STD': [0.00392156, 0.00392156, 0.00392156],'TEST': {u'TEST_MODEL': '/home/aistudio/pretrained_model/deeplabv3p_xception65_humanseg'},'TRAIN': {u'MODEL_SAVE_DIR': 'snapshots/humanseg/aic_v2/',u'PRETRAINED_MODEL_DIR': u'pretrain/xception65_pretrained/',u'RESUME_MODEL_DIR': '',u'SNAPSHOT_EPOCH': 5,u'SYNC_BATCH_NORM': False},u'TRAIN_CROP_SIZE': (513, 513)}
W0602 10:05:15.773231   260 device_context.cc:259] Please NOTE: device: 0, CUDA Capability: 70, Driver API Version: 10.1, Runtime API Version: 9.0
W0602 10:05:15.776937   260 device_context.cc:267] device: 0, cuDNN Version: 7.3.
#1 visualize image path: ./visual/visual_results/56173ddd1ccb419e1efdeb5f5cb242ab160142cb.png
#2 visualize image path: ./visual/visual_results/aa611a0cf92ace38bd2d3b0fe0bc50b5235eea7e.png
#3 visualize image path: ./visual/visual_results/aa6300f76981dcf8701534dd1d3b2ec19b3dee02.png
#4 visualize image path: ./visual/visual_results/aa63d7e6db0d03137883772c246c6761fc201059.png
#5 visualize image path: ./visual/visual_results/aa645bc9cf23db7912a69309072cd9ab325f02cd.png
#6 visualize image path: ./visual/visual_results/aa65c231dbce73de1527101bf35b975b2c2e9d5a.png
#7 visualize image path: ./visual/visual_results/aa65dc40ae9713e4fe3e63b55a8fd10bd1320822.png
#8 visualize image path: ./visual/visual_results/aa65f5b4f85c37ce44dc48473150a16e652b6bc5.png
#9 visualize image path: ./visual/visual_results/aa662fb7540312c51f6e6870c0542c8035495b14.png
#10 visualize image path: ./visual/visual_results/aa67b2d074e00942191c4bd2472e7f77538ec113.png
#11 visualize image path: ./visual/visual_results/aa6b34b24414bafa7fab8393239c793587513ce6.png
#12 visualize image path: ./visual/visual_results/aa6bd3eaf471bea1cca7467a95fe93e69b006797.png
#13 visualize image path: ./visual/visual_results/aa6f23e6ac596962ee773e4eea0560fb0e4522ac.png
#14 visualize image path: ./visual/visual_results/aa6ff076c7360b8dabc30edd05ebafb65bba9343.png
#15 visualize image path: ./visual/visual_results/20200602093501.png

结果进行显示

import matplotlib.pyplot as plt# 定义显示函数
def display(img_dir):plt.figure(figsize=(15, 15))title = ['Input Image', 'Predicted Mask']for i in range(len(title)):plt.subplot(1, len(img_dir), i+1)plt.title(title[i])img = plt.imread(img_dir[i])plt.imshow(img)plt.axis('off')plt.show()# 显示分割效果
# 注：仅显示其中一张图片的效果。
image_dir = "dataset/humanseg/20200602093501.jpg"
mask_dir = "visual/visual_results/20200602093501.png"
imgs = [image_dir, mask_dir]
display(imgs)