点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达本文转自|深度学习这件小事

关系建模(relationship modeling)在许多视觉任务中显得越来越重要,这也符合人自身的认知习惯:通过物体与周围环境的联系去认知该物体。而图网络具备结构化表示节点关系的能力,似乎天然地适合应用于这类建模任务中。

所以这周调查了图网络在一些视觉任务中的应用,以期获得一点点有关的insight。

   Point Cloud Processing

Point Cloud是一个物体的3D数据,每个点的数据包括3D坐标、RGB值等信息,可以理解为是“3D版”的图像数据。

与image classification和image segmentation相对应,Point Cloud领域也有自己的classification和segmentation任务。

但3D的Point Cloud原始数据不像图像数据那样结构化,后者一般会在2D网格上整齐排列,点坐标的分布是离散的,而Point Cloud的点坐标却是连续分布的。早期的方法会将Point Cloud原始数据首先转化到结构化的3D网格中(想象点在立方体中的分布),然而却带来了量化失真(quantization artifacts)和内存消耗巨大等问题。

MIT 2018年的论文Dynamic Graph CNN for Learning on Point Clouds提出用图网络来建模每个点与其邻居点的关系,从而捕捉到Point Cloud的high-level信息。这个图网络被命名为EdgeConv,意思是对点之间的边进行卷积,其核心部件非常简单,一张图就可以解释得差不多了:

值得注意的是,整个模型建立起的图是稀疏的,每个点只与最近的k个邻居相连,否则带来的计算量将无比庞大。

而文章一个重要的创新点是令图具有动态性,即每次更新完点的特征后都会重新计算每个点的k个最近邻,从而建立新的图。这样的优势是,即便图是稀疏的,每个点也有机会成为其他任意一个点的邻居,可以说,每个点的感知域(receptive field)是整个Point Cloud,而不局限于局部。

文章提供的一些实验示例清楚地体现了动态图的作用。下图可视化了红点到其余点的距离,随着点特征的迭代更新,语义上相似的部件(如桌腿)之间的距离越来越近,说明模型通过动态图逐步学习到了各点的语义特性。

   Scene Graph Generation

Scene Graph是一个图像的结构化形式,其中的每个节点表示图上的一个物体,节点之间的边表示物体间的关系。

CVPR 2017的Scene Graph Generation by Iterative Message Passing也应用了图网络的基本思想来处理Scene Graph Generation问题,该文章比较吸引我的一点是,它将图的边也进行了特征表示,并且和节点的特征互相进行信息传递(message passing),经过几轮这样的互动,模型得以学习到图像蕴含的视觉关系。

这个建模方法很接近factor graph的形式,在很多图网络的应用中,边的特征表示总是遭到忽视,而在这样的框架中,图的边和节点具有同等的地位,模型也更能全面地捕捉到关系。

   Object Detection

原有的Object Detection模型往往只考虑了物体本身,而忽视了物体与上下文的联系。

例如,原有的模型会把河上的船误认为是车,因为如果仅仅根据物体的外表来识别的话,漂在河上的船确实长得有点像车。

显然,更加智能的Object Detection算法应当将上下文也纳入考量,这样一来,Object Detection就不再只是单纯的识别问题,而有了一些推理的意味,如,根据河水这个环境推理出河上物体是船的可能性更大。

CVPR 2018的Structure Inference Net: Object Detection Using Scene-Level Context and Instance-Level Relationships一文就采用了上述的思路,提出一种名为Structure Inference Network(SIN)的模型。该模型利用了两种上下文信息,分别是整个场景的信息和物体间的关系信息,并且应用图网络将这些信息结构化:

在具体的实现上,SIN主要用到了Scene GRU和edge GRU,分别用于聚合场景信息和物体关系信息,然后用来迭代式地更新节点特征。

   小结

浅尝辄止地了解了图网络在上述几个视觉任务中的应用后,我的感受是,在当前的计算机视觉领域,视觉理解应当更多地寻求high-level信息,而基于图网络的关系建模则是一种非常重要的工具。

—完—

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

浅谈图网络在视觉任务中的应用相关推荐

  1. 浅谈无线网络在未来工厂中应用的可能性

    工业设施中网络连接存在的问题 统计数据表明,由于升级更换设备所需的成本和人们"设备没坏旧无需更新"的观念等多种原因,很多普通工厂仍然在车间内使用传统旧设备和工艺流程,这使得工厂在现 ...

  2. 计算机网络在教学方面的作用是什么意思,浅谈发挥网络在教学中的作用

    浅谈发挥网络在教学中的作用 时间: 2007-04-01 栏目: 浅谈发挥网络在教学中的作用 蒋丽     新余市五一路小学 内容摘要: 随着科学技术的不断发展,网络技术也不断的更新,它在社会各领域都 ...

  3. 浅谈软件定义网络(SDN)技术研究现状和发展趋势

                       浅谈软件定义网络(SDN)技术研究现状和发展趋势 友情全文PDF链接:浅谈软件定义网络(SDN)技术研究现状和发展趋势.pdf-网络基础文档类资源-CSDN下载 ...

  4. 数学知识与计算机科学中的应用,浅谈计算机科学技术在数学思想中的应用

    浅谈计算机科学技术在数学思想中的应用 随着科学技术水平的不断提升和科学技术不断地影响着人们生活和工作的方方面面,计算机在我们生活中的普及度越来越高,对 (本文共1页) 阅读全文>> 随着互 ...

  5. 浅谈汽车轮胎匹配视觉防错检测应用

    前段时间都是分享到理论成果,今天看到一篇是结合车厂实际状况来进行的,可以从不同角度看看机器视觉在汽车行业中的应用. 1  前言 工业 4.0 的核心是数据.随着智能装备和智能终端的普及以及各种传感器的 ...

  6. 浅谈软件定义网络SDN

    浅谈软件定义网络SDN 前言 学习主要内容 一.SDN简介 二.SDN的三个主要特征 转控分离 集中控制 开放接口 三.SDN的工作原理 SDN网络架构的三层模型 SDN网络架构下的三个接口 SDN基 ...

  7. matlab社会统计学,浅谈MATLAB在统计学实验教学中的应用

    浅谈MATLAB在统计学实验教学中的应用 引言: 进入新世纪以来,我国的经济社会不断发展,科学技术水平不断提升.网络信息技术是现代技术的产物,其与教育领域相融合,形成了一系列的现代教育软件.MATLA ...

  8. 计算机网络技术对教学的作用,浅谈计算机网络技术在教学应用中的作用和发展趋势.docx...

    浅谈计算机网络技术在教学应用中的作用和发展趋势 乜大伟 (山东医学高等专科学校,山东临沂276000 ) [摘要]计算机网络技术在教学中应用的推广,新型教学模式对传统教育思想. 教学观念.教学方法产生 ...

  9. 计算机在小学音乐研修心得,浅谈信息技术在中小学音乐教学中的应用

    浅谈信息技术在中小学音乐教学中的应用 浅谈信息技术在中小学音乐教学中的应用 [摘要]信息技术的发展对传统的中小学音乐教学产生了较大冲击,目前,传统的音乐教学模式很难适应新课改的要求和信息技术的发展,如 ...

最新文章

  1. 布线时其他区域变黑、高亮Net时其他区域太黑
  2. 学习记录-交叉编译环境的设置
  3. Response.ContentType 详细列表
  4. 人工智障学习笔记——深度学习(3)递归神经网络
  5. h0152. 故事计算题(计蒜客——西邮K题)解析
  6. pandas dataframe随机采样
  7. 在ubuntu10.04安装java5和java6
  8. Attention Please
  9. 牛b硬件信息修改大师_比X大师更靠谱?一款真正良心的硬件检测工具
  10. 个人作业week7——前端开发感想总结
  11. 自动化专业向往硬件方面靠,有什么好的建议?
  12. android 考勤界面,一种android终端实时考勤记录统计展现方法和装置与流程
  13. 显示器间歇性黑屏问题排查
  14. [渝粤教育] 江西财经大学 中国会计准则(全英文) 参考 资料
  15. 引领新未来SOA服务框架,未来发展的方向
  16. excel怎么合并表格
  17. 如何简单粗暴解决echars大数据量渲染卡顿问题
  18. flutter 自定义 Toast
  19. Variable Selection via Nonconcave PenalizedLikelihood and its Oracle Properties 论文解析-特征选择的Oracle特性-1
  20. RSA非对称加密传输---前端加密解密(VUE项目)

热门文章

  1. “安利”一款debug神器:在AI面前,bug都不是事儿
  2. AI芯片的“战国时代”:计算力将会驶向何方?
  3. 2018机器阅读理解技术竞赛,奇点机智获第一名
  4. AI一分钟 | Yann LeCun怒批机器人Sophia:招摇撞骗;李嘉诚:我比较保守,只投了1亿港币到比特币终端市场
  5. 这次性能优化, QPS 翻倍了
  6. 面霸:Redis 为什么这么快?
  7. 强大:MyBatis 流式查询
  8. Mysql4种方式避免重复插入数据!
  9. 【廖雪峰python入门笔记】if语句
  10. 官宣!这些北京高校,去雄安!