基于图片内容的处理任务,主要包括目标检测、图片分割两大任务。

1 目标检测

目标检测任务的精度相对较高,主要是以检测框的方式,找出图片中目标物体所在的位置。目标检测任务的模型运算量相对较小,速度相对较快。

1.1 目标检测任务概述

目标检测任务要求模型能检测出图片中特定的目体,并获得这一目标物体的类别信息和位置信息。

在目标检测任务中,模型的输出是一个列表,列表的每一项用一个数组给出检测出的标物体的类别和位置(常用检测框的坐标表示)。

1.2 目标检测任务模型的分类

1.2.1 单阶段(1-stage)检测模型:

主要指直接从图片获得预测结果,也被称为Region-free法。相关的模型有YOLO、SSD、RetinaNet。

1.2.2 两阶段(2-stage)检测模型:

主要指先检测包含实物的区域,再对该区域内的实物进行分类识别,相关模型有R-CNN、Faster R-CNN,Mask R-CNN。

1.2.3 两种分类的对比

单阶段检测模型在分类方面表现出的精度高。

两阶段检测模型在检测框方面表现出的精度高。

2 图片分割:其模型大多数是两阶段

图片分割是指对图中的每个像素点进行分类,适用于对像素理解要求较高的场景。

2.1 图片分割的分类

2.1.1 语义分割

能将图片中具有不同语义的部分分开。

2.1.2 实例分割

能描述出目标物体的轮廓(比检测框更为精细)。

2.2 目标检测+语义分割=实例分割

【Pytorch神经网络理论篇】 33 基于图片内容处理的机器视觉:目标检测+图片分割+非极大值抑制+Mask R-CNN模型相关推荐

  1. 【Pytorch神经网络理论篇】 31 图片分类模型:ResNet模型+DenseNet模型+EffcientNet模型

    1 ResNet模型 在深度学习领域中,模型越深意味着拟合能力越强,出现过拟合问题是正常的,训练误差越来越大却是不正常的. 1.1 训练误差越来越大的原因 在反向传播中,每一层的梯度都是在上一层的基础 ...

  2. 【Pytorch神经网络理论篇】 25 基于谱域图神经网络GNN:基础知识+GNN功能+矩阵基础+图卷积神经网络+拉普拉斯矩阵

    图神经网络(Graph Neural Network,GNN)是一类能够从图结构数据中学习特征规律的神经网络,是解决图结构数据(非欧氏空间数据)机器学习问题的最重要的技术. 1 图神经网络的基础知识 ...

  3. 【Pytorch神经网络理论篇】 26 基于空间域的图卷积GCNs(ConvGNNs):定点域+谱域+图卷积的操作步骤

    图卷积网络(Graph Convolutional Network,GCN)是一种能对图数据进行深度学习的方法.图卷积中的"图"是指数学(图论)中用顶点和边建立的有相关联系的拓扑图 ...

  4. 【Pytorch神经网络理论篇】 27 图神经网络DGL库:简介+安装+卸载+数据集+PYG库+NetWorkx库

    DGL库是由纽约大学和亚马逊联手推出的图神经网络框架,支持对异构图的处理,开源相关异构图神经网络的代码,在GCMC.RGCN等业内知名的模型实现上也取得了很好的效果. 1 DGL库 1.1 DGL库的 ...

  5. 【Pytorch神经网络理论篇】 20 神经网络中的注意力机制

    注意力机制可以使神经网络忽略不重要的特征向量,而重点计算有用的特征向量.在抛去无用特征对拟合结果于扰的同时,又提升了运算速度. 1 注意力机制 所谓Attention机制,便是聚焦于局部信息的机制,比 ...

  6. 【Pytorch神经网络理论篇】 34 样本均衡+分类模型常见损失函数

    同学你好!本文章于2021年末编写,获得广泛的好评! 故在2022年末对本系列进行填充与更新,欢迎大家订阅最新的专栏,获取基于Pytorch1.10版本的理论代码(2023版)实现, Pytorch深 ...

  7. 【Pytorch神经网络理论篇】 39 Transformers库中的BERTology系列模型

    同学你好!本文章于2021年末编写,获得广泛的好评! 故在2022年末对本系列进行填充与更新,欢迎大家订阅最新的专栏,获取基于Pytorch1.10版本的理论代码(2023版)实现, Pytorch深 ...

  8. 【Pytorch神经网络理论篇】 37 常用文本处理工具:spaCy库+torchtext库

    在NLP的发展过程中,人们也开发了很多非常实用的工具,这些工具可以帮助开发人员快速地实现自然语言相关的基础处理,从而可以更好地将精力用在高层次的语义分析任务中下面详细介绍该领域中比较优秀的工具. 1 ...

  9. 【Pytorch神经网络理论篇】 35 GaitSet模型:步态识别思路+水平金字塔池化+三元损失

    代码: [Pytorch神经网络实战案例]28 GitSet模型进行步态与身份识别(CASIA-B数据集)_LiBiGor的博客-CSDN博客1 CASIA-B数据集本例使用的是预处理后的CASIA- ...

最新文章

  1. ie下的placeholder原生js实现方法
  2. [学习笔记]树上莫队
  3. Cisco mode键的作用详解
  4. Spring常用的的注解对应xml配置详解
  5. firefox addons
  6. 如何查看一个组件的 classid是多少_如何查看iphone电池使用次数?6s电池容量多少需要更换?...
  7. 面试官系统精讲Java源码及大厂真题 - 02 String、Long 源码解析和面试题
  8. 变频器说明书_图解变频器接线方法
  9. 深入剖析Redis事件驱动
  10. 读书节第三日丨产品大咖荐读直播齐上阵,学院超级会员限时开抢!
  11. java常用类实验报告总结_【Java基础】java常用类实验总结
  12. ubuntu 10.10 安装google拼音输入法 并实现光标跟随
  13. 海康威视-海康门禁设备对接SDK-已完成完整封装调用
  14. 哪一类功率放大电路效率最高_让我们来复习一下功率放大电路与集成运算放大电路...
  15. page fault
  16. Scipy-kmeans聚类
  17. History 和 Hash 路由模式
  18. 机器学习——线性回归、房价预测案例【正规方案与梯度下降】
  19. 计算机类中级职称论文,计算机中级职称论文.docx
  20. 外贸推广方式有哪些,外贸推广怎么做

热门文章

  1. Socket的getInputStream()方法
  2. 学成在线--11.RabbitMQ快速入门
  3. ubuntu之ufw防火墙
  4. 如何让梯形变成平行四边形_开放的课堂 创新的天地——平行四边形的面积教学片段与反思...
  5. android oreo 开机动画,Android O添加了一个 Splash Screen API帮助简化启动屏制作
  6. java服务器向客户端发消息_java一个简单的客户端向服务端发送消息
  7. 锐浪报表数据源access_kylin+SuperSet实现实时大数据报表的快速开发
  8. php 字符串的比较大小,php怎么比较两个字符串的大小
  9. Splay初步【bzoj1503】
  10. 在Java中正确使用注释