https://www.toutiao.com/a6674769574212141579/

何恺明大神的团队又有新研究了!

这一次,Facebook的陈鑫磊、何恺明等人,又从全新的角度,再次解决了实例分割任务中的难题:

他们提出一种通用的实例分割框架TensorMask,弥补了密集滑动窗口实例分割的短板。

在COCO数据集上进行测试实例分割结果可以发现,TensorMask的效果可以比肩Mask R-CNN。

这是种怎样的新方法?

4D张量

在论文TensorMask: A Foundation for Dense Object Segmentation中,研究人员详细介绍了通用框架TensorMask。

此前,实例分割的主流方法是Mask R-CNN。在这种方法中,模型先检测物体的边界框,然后进行裁剪和目标分割。

但是,密集滑动窗口的实例分割 (Dense Sliding-window Instance Segmentation)却鲜少被人关注。在这种方法中,每个空间位置的输出本身具有自己空间维度的几何结构,与Mask R-CNN有本质上的区别。

为了形式化说明这一方法,研究人员将密集实例分割看作是4D张量(4D tensors)上的预测任务,并提出通用框架TensorMask获取这种几何结构。

TensorMask的核心变化是,用结构化的高维张量表示一组密集滑动窗口中的图像内容。

TensorMask中包含两部分,一是预测蒙版的Head,负责在滑动窗口中生成蒙版,二是进行分类的Head,负责预测目标的类别。

两者分工明确,各司其职。

在COCO数据集上进行实例分割检测可以发现,TensorMask在test-dev上的平均精度达到了35.5,与Mask R-CNN的36.8非常接近。

结果证明,在定量和定性上,TensorMask均接近Mask R-CNN。

中国少年×2

这项新研究的背后,少不了中国研究人员的足迹。

论文一作是中国少年陈鑫磊,目前就职于Facebook,一路走来其研究经历闪闪发光。

陈鑫磊在浙江大学攻读计算机科学专业学习时,师从蔡登教授。本科毕业后奔赴CMU攻读博士,师从Abhinav Gupta教授,主要攻读计算机视觉方向。

在博士毕业前,陈鑫磊在Google Cloud AI部门实习过,当时在李飞飞和李佳两位大牛的项目组内。

在陈鑫磊的个人主页上可以看到,其参与过的多篇论文都被顶会接收。

三作何恺明大家应该不陌生,作为Mask R-CNN的主要提出者,何恺明三次斩获顶会最佳论文。

何恺明曾是广东高考状元,并保送了清华。本科毕业后,何恺明进入香港中文大学读研。期间继续在微软亚洲研究院参与研究,现也就职于Facebook。

论文的二作Ross Girshick和四作Piotr Dollar陈鑫磊和何恺明在Facebook的同事,顶会论文Mask R-CNN、Focal Loss for Dense Object Detection等,都是三人曾合作开展的研究。

有友如此,甚好甚好。

传送门

论文TensorMask: A Foundation for Dense Object Segmentation:

https://arxiv.org/abs/1903.12174

论文中表示,研究结果将于不久后开源~

值得期待。

—  —

何恺明、陈鑫磊新研究:提出实例分割新方法,效果比肩Mask R-CNN相关推荐

  1. 字节跳动实习生提出实例分割新方法:性能超过何恺明Mask R-CNN

    乾明 十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 框架更简单,但实现了比Mask R-CNN还好的性能. 这是字节跳动实习生提出的实例分割新方法,名为SOLO. 核心在于通过引入&qu ...

  2. 计算成本缩减100倍!港中文提出语义分割新方法:张量低秩重建|ECCV2020

    原文链接:https://bbs.cvmart.net/articles/3099 专注计算机视觉前沿资讯和技术干货 微信公众号:极市平台 官网:https://www.cvmart.net/ --- ...

  3. 谷歌简单粗暴“复制-粘贴”数据增广,刷新COCO目标检测与实例分割新高度

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 近日,谷歌.UC伯克利与康奈尔大学的研究人员公布了一篇论文 Sim ...

  4. 完美替代Mask RCNN!BlendMask:实例分割新标杆

    点击我爱计算机视觉标星,更快获取CVML新技术 今天新出的论文BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation,提出一种自顶向 ...

  5. 万众瞩目!YOLOv8诞生,要包揽目标检测、实例分割新SOTA!

    来源  机器之心  编辑:小舟.陈萍 YOLOv8 抛弃了前几代模型的 Anchor-Base. YOLO 是一种基于图像全局信息进行预测的目标检测系统.自 2015 年 Joseph Redmon. ...

  6. 何恺明组又出神作!最新论文提出全景分割新方法

    ↑ 点击上方[计算机视觉联盟]关注我们 来源:arXiv 作者:Alexander Kirillov et. al. 编辑:肖琴 Facebook人工智能实验室(FAIR)何恺明等人团队在arXiv发 ...

  7. 超越EfficientNet,GPU上加速5倍,何恺明组CVPR 2020论文提出新型网络设计范式

    选自arXiv 作者:Ilija Radosavovic等 机器之心编译 机器之心编辑部 近日,何恺明大神组又发了一篇新论文,提出了一种新的网络设计范式.与以往研究不同,他们没有专注于设计单个网络实例 ...

  8. 何恺明团队新作!深度学习网络架构新视角:通过相关图表达理解神经网络

    标题&作者团队 导语:恺明大神出品,必属精品.Facebook的研究员从一个新奇的角度对神经网络的表示与设计进行探索,提出了一种新颖的相关图表示方式.它有助于对现有网络架构进行更深层次的分析与 ...

  9. 【重磅】旷视提出MegDetV2:目标检测/实例分割新系统

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 编辑:Amusi 在COCO 2019/2020 挑战赛中获得最佳结果!该方案包含RPN++. ...

最新文章

  1. getconnectiontimeoutexception 网络问题排查_通俗解析居家宽带网络问题:光猫设备排查教程篇...
  2. html2canvas在Vue项目踩坑-生成图片偏移不完整
  3. python代码需要背吗-20个Python代码段,你需要立刻学会,好用到哭!
  4. 计算机网络工程与菅理,网络工程与管理
  5. dubbo-go 白话文 | 从零搭建 dubbogo 和 dubbo 的简单用例
  6. PWN-PRACTICE-BUUCTF-22
  7. 外设驱动库开发笔记37:S1336-5BQ光敏二极管作为光度计驱动
  8. 个位数不含4用计算机表示,计算机组成原理
  9. 动画会震一下css,csshake.css强大的CSS3元素抖动动画库
  10. 从零开始的unity3d入门教程(二)----基本功能讲解
  11. 嵌入式系统开发10——STM32串口通信
  12. html怎么清除背景颜色,怎么去除Word复制网页内容的背景色?
  13. 计算机教学中扩词扩句的应用,【教学设计】学习扩写 ——部编人教版九下第一单元写作...
  14. php cms下载地址,让PHPCMS下载内容页显示链接真实地址
  15. PB调用DLL的常见问题及处理方法
  16. linux绝育玩客云_玩机技巧 篇二:玩客云实用指南(真·无痛绝育),附玩物下载对比...
  17. Dotaer vs Loler
  18. 百度搜索接口api_百度站长平台上线落地页视频转存功能,确保专业问答视频资源的质量和稳定性...
  19. 计算机网络技术(一)——概论
  20. 顶级产品经理是如何利用王者荣耀,3步毁掉你的自律。

热门文章

  1. 二条件if else语句可以用离散二分布概率函数实现
  2. 高性能计算专家Jack Dongarra获2021年图灵奖
  3. MT to Death,专访 ACL Fellow刘群,一个NLPer的极致表白
  4. 中国、意大利等国研究员用AI 发现新的月球陨石坑 | AI日报
  5. 李开复:发明期已过,AI科学家创业需谨慎(附演讲视频)
  6. 豆瓣评分 8.6,近 5 万读者学习的 Android 经典最新版出版,承载无数程序员的回忆......
  7. Tensorflow-gpu1.13.1 和 Tensorflow-gpu2.0.0共存之安装教程
  8. DCGAN论文笔记+源码解析
  9. 独家|OpenCV 1.2 如何用OpenCV扫描图像、查找表和测量时间(附链接)
  10. 铲屎官福音:汪星人和喵星人的小情绪,AI 可以识别了