物体的识别,检测,和分割

1:物体检测

  • 输入图像 -> 特征 -> 分类器 -> 物体类别

    • 我们生成图片的时候,他的大小,长宽比都是不一样的,有些还是躺着的
    • 我们可以生成很多的框框,但是这些框框绝大多数可能都是背景,此时我们可以做一个二分类
    • 二分类的问题:类间不够紧凑(天空,草地,大海),类和类之间差别不大
    • 解决这个问题,我们使用似物性估计,我们可以不使用框框,直接来做
    • **ECCV 2014 Edge Boxes: Locating Object Proposals from Edges **,我们物体都是有边界的,有一个边界组成的,但是大海,天空可能边界不是那么的明朗或者说就没有边界
    • https://link.springer.com/content/pdf/10.1007/978-3-319-10602-1_26.pdf
    • 我们采用边缘检测的技术,找到各个物体的边缘,从而能够对有效的物体进行框起来
    • 两个像素点,如果差值越大,那么说明这两点的内容发生了很大的变化,那么就不属于同一个物体
    • 数字图像处理:边缘检测(Edge detection):https://zhuanlan.zhihu.com/p/59640437
    • 滤波提取图像特征,简化信息;适应图像处理的需求,通过滤波消除图像数字化时所混入的噪声
    • 滤波器从上到下,从左到右的遍历,
    • (其中 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y4EQcx8k-1621872413398)(https://www.zhihu.com/equation?tex=R_%7B5%7D)] 表示当前像素点, [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iTieLfk1-1621872413410)(https://www.zhihu.com/equation?tex=R_%7Bi%7DG_%7Bi%7D)] 表示当前像素与滤波器对应值相乘的值,n为滤波器大小,举例来说如若此滤波器值全为1,则此公式计算的是当前像素点的8连通像素点的平均值,因此滤波完后的图像应表现为模糊的效果,模糊程度取决于滤波器的大小,滤波器大小(size)越大,模糊效果越明显)
    • 边缘检测算子
      • Sobel
      • Prewitt
      • Roberts
  • 物体检测

    • 目标:找到图像中的已经直到类别的物体,属于CV中的图像理解
    • 图像处理,图像分析,图像理解:三个大的方向
    • 输入:一张图片
    • 输出:一个或者是多个物体(包含类别和边界框)
    • 挑战:物体定位和物体识别,识别出来并且把他框出来
    • 两阶段的
      • 先从图像中选出若干个可能是物体的框框,然后再对这些框框做分类
      • RCNN;Fast RCNN;Faster RCNN
      • RCNN 是把selective search 和AlexNet 两项工作合起来了,有的人觉得没技术含量
      • 但是有时候把两项不那么相关的技术合起来,并且还有很好的效果,这就是一种创新
    • 单阶段的
      • 不需要预先检测出框框,直接由图像生成最后的结果
      • You Only Look Once
      • https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf
      • 关键技术
        • 在原图中划分为S X S的网格,如果一个目标的中心落入某个格子,这个格子就负责检测该目标
        • 每个网格要预测 B 个bound ing boxes,以及C 个类别概率,每个bounding box预测五个变量
        • 全连接层输出reshape成 SXSX(5*B+C)的多维矩阵,通过NMS得到输出框框
      • YOLO V3 放飞自我,写的和博客一样
      • https://arxiv.org/pdf/1804.02767.pdf
      • YOLO V3之后,原作者就不写了,4和5都不是原作者写的,所以5不一定比4好
    • 细粒度物体识别
      • 目标:对物体类别进行更加细致的分类
      • 输入:一张鸟
      • 输出:哪一个类别的物体
      • Fine Grained Recognition without Part Annotations
      • 需要学习到鸟类的领域知识

物体的识别,检测,和分割相关推荐

  1. 动作识别、检测、分割、解析相关数据集介绍

    文章目录 动作识别 UCF101(UCF101 Human Actions dataset) Kinetics (Kinetics Human Action Video Dataset) 动作检测 / ...

  2. 【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 1.内容概要 Mask R-CNN的框架是对Faster R-CNN的扩展,与BBox识别并行的增加一 ...

  3. 计算机视觉、图像分类、目标检测、人脸比对、人脸识别、语义分割、实例分割、图像搜索

    计算机视觉.图像分类.目标检测.人脸比对.人脸识别.语义分割.实例分割.图像搜索 目录

  4. vuforia的物体识别能识别大物体吗_衢州sensopart 物体识别检测视觉-灵测信息

    首页 > 新闻列表 > 浏览文章 发布时间:2020-11-03 12:07:00 浏览量: 6 导读:灵测信息为您提供衢州sensopart 物体识别检测视觉的相关知识与详情: 本文的关 ...

  5. 显著性物体检测与分割

    http://valse.mmcheng.net/salobj/ 显著性物体检测与分割 活动时间:2014年9月4日星期4,北京时间20:00开始. 主持人:山世光 主讲人:卢湖川,李寅,程明明,等 ...

  6. 四维图新:高精度地图构建的实时物体检测和分割

    四维图新在欧洲成立Advanced Research Lab,该实验室专家谈"高精度地图构建的实时物体检测和分割".

  7. 二维物体形状识别方法比较

    二维物体形状识别方法比较 摘  要  针对模式识别中二维物体的形状识别问题,以二值图像中的物体形状为主要研究对象,依次从特征提取.分类器设计两个主要层面对形状识别方法进行了全面综述,并分析了国内外研究 ...

  8. 腾讯优图10篇AAAI论文解析,涉及数学速算批改、视频识别和语义分割 | 附下载...

    点击上方↑↑↑"视学算法"关注我 来源:公众号 量子位 授权转 AI顶会AAAI开幕在即,入选论文悉数披露. 今日介绍10篇论文,来自腾讯旗下视觉研发平台腾讯优图,涉及数学速算批改 ...

  9. 【Pytorch神经网络理论篇】 33 基于图片内容处理的机器视觉:目标检测+图片分割+非极大值抑制+Mask R-CNN模型

    基于图片内容的处理任务,主要包括目标检测.图片分割两大任务. 1 目标检测 目标检测任务的精度相对较高,主要是以检测框的方式,找出图片中目标物体所在的位置.目标检测任务的模型运算量相对较小,速度相对较 ...

最新文章

  1. VMware Tools手动下载
  2. 你正在用的API网关,真的起到了它该有的作用?
  3. 脑电分析系列[MNE-Python-4]| MNE中数据结构Evoked及其对象创建
  4. python编程从入门到实践课后题答案-python编程:从入门到实践习题5-8~5-11
  5. JAVA Fork Join Demo 1
  6. djangoORM数据类型及基本操作
  7. [bzoj2242][SDOI2011]计算器
  8. matlab 英语怎么读,MATLAB SPTooL
  9. linux优盘驱动目录,Linux U盘加载阵列卡驱动步骤(.dd或img).doc
  10. linux可以用dos命令是什么意思,Linux系统常用命令与DOS命令的类似之处和本质区别各是什么?...
  11. Hibernate通用Dao实现
  12. 绿屏后再现“粉屏”门!大量网友投诉iPhone 13粉屏问题 客服:非硬件问题
  13. 1044. 火星数字(20)-PAT乙级真题
  14. 免疫算法的c语言,免疫算法(IA)
  15. Radasm 配置goasm
  16. Java图像识别技术:Test4J
  17. 计算机课代表中段考总结,第一学期中段考试总结
  18. vue watch首次不触发的解决方案
  19. 苹果终端date命令_mac终端常用命令
  20. 人工智能实战2019第七次作业(OpenPAI) 16721088 焦宇恒

热门文章

  1. CreateThread
  2. python程序编译之后、找不到生成的pyc文件_为什么主要的可运行的Python脚本没有被编译为pyc文件,如模块?...
  3. 并发量与RAID_RAID 技术全解 – RAID0、RAID1、RAID5、RAID10-宿主机磁盘阵列-香港母机...
  4. 直播报名 | 科技赋能零售金融业务转型
  5. linux内核杂记(3)-进程(2)
  6. C指针原理(14)-C指针基础
  7. 【机器学习】模型又线上线下不一致怎么办?
  8. 【NLP】哈工大|NLP数据增强方法?我有15种
  9. 【论文解读】比特币:一种点对点的点子支付系统
  10. 数据可视化的利器-Seaborn简易入门