何恺明、陈鑫磊新研究:提出实例分割新方法,效果比肩Mask R-CNN
https://www.toutiao.com/a6674769574212141579/
何恺明大神的团队又有新研究了!
这一次,Facebook的陈鑫磊、何恺明等人,又从全新的角度,再次解决了实例分割任务中的难题:
他们提出一种通用的实例分割框架TensorMask,弥补了密集滑动窗口实例分割的短板。
在COCO数据集上进行测试实例分割结果可以发现,TensorMask的效果可以比肩Mask R-CNN。
这是种怎样的新方法?
4D张量
在论文TensorMask: A Foundation for Dense Object Segmentation中,研究人员详细介绍了通用框架TensorMask。
此前,实例分割的主流方法是Mask R-CNN。在这种方法中,模型先检测物体的边界框,然后进行裁剪和目标分割。
但是,密集滑动窗口的实例分割 (Dense Sliding-window Instance Segmentation)却鲜少被人关注。在这种方法中,每个空间位置的输出本身具有自己空间维度的几何结构,与Mask R-CNN有本质上的区别。
为了形式化说明这一方法,研究人员将密集实例分割看作是4D张量(4D tensors)上的预测任务,并提出通用框架TensorMask获取这种几何结构。
TensorMask的核心变化是,用结构化的高维张量表示一组密集滑动窗口中的图像内容。
TensorMask中包含两部分,一是预测蒙版的Head,负责在滑动窗口中生成蒙版,二是进行分类的Head,负责预测目标的类别。
两者分工明确,各司其职。
在COCO数据集上进行实例分割检测可以发现,TensorMask在test-dev上的平均精度达到了35.5,与Mask R-CNN的36.8非常接近。
结果证明,在定量和定性上,TensorMask均接近Mask R-CNN。
中国少年×2
这项新研究的背后,少不了中国研究人员的足迹。
论文一作是中国少年陈鑫磊,目前就职于Facebook,一路走来其研究经历闪闪发光。
陈鑫磊在浙江大学攻读计算机科学专业学习时,师从蔡登教授。本科毕业后奔赴CMU攻读博士,师从Abhinav Gupta教授,主要攻读计算机视觉方向。
在博士毕业前,陈鑫磊在Google Cloud AI部门实习过,当时在李飞飞和李佳两位大牛的项目组内。
在陈鑫磊的个人主页上可以看到,其参与过的多篇论文都被顶会接收。
三作何恺明大家应该不陌生,作为Mask R-CNN的主要提出者,何恺明三次斩获顶会最佳论文。
何恺明曾是广东高考状元,并保送了清华。本科毕业后,何恺明进入香港中文大学读研。期间继续在微软亚洲研究院参与研究,现也就职于Facebook。
论文的二作Ross Girshick和四作Piotr Dollar陈鑫磊和何恺明在Facebook的同事,顶会论文Mask R-CNN、Focal Loss for Dense Object Detection等,都是三人曾合作开展的研究。
有友如此,甚好甚好。
传送门
论文TensorMask: A Foundation for Dense Object Segmentation:
https://arxiv.org/abs/1903.12174
论文中表示,研究结果将于不久后开源~
值得期待。
— 完 —
何恺明、陈鑫磊新研究:提出实例分割新方法,效果比肩Mask R-CNN相关推荐
- 字节跳动实习生提出实例分割新方法:性能超过何恺明Mask R-CNN
乾明 十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 框架更简单,但实现了比Mask R-CNN还好的性能. 这是字节跳动实习生提出的实例分割新方法,名为SOLO. 核心在于通过引入&qu ...
- 计算成本缩减100倍!港中文提出语义分割新方法:张量低秩重建|ECCV2020
原文链接:https://bbs.cvmart.net/articles/3099 专注计算机视觉前沿资讯和技术干货 微信公众号:极市平台 官网:https://www.cvmart.net/ --- ...
- 谷歌简单粗暴“复制-粘贴”数据增广,刷新COCO目标检测与实例分割新高度
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 近日,谷歌.UC伯克利与康奈尔大学的研究人员公布了一篇论文 Sim ...
- 完美替代Mask RCNN!BlendMask:实例分割新标杆
点击我爱计算机视觉标星,更快获取CVML新技术 今天新出的论文BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation,提出一种自顶向 ...
- 万众瞩目!YOLOv8诞生,要包揽目标检测、实例分割新SOTA!
来源 机器之心 编辑:小舟.陈萍 YOLOv8 抛弃了前几代模型的 Anchor-Base. YOLO 是一种基于图像全局信息进行预测的目标检测系统.自 2015 年 Joseph Redmon. ...
- 何恺明组又出神作!最新论文提出全景分割新方法
↑ 点击上方[计算机视觉联盟]关注我们 来源:arXiv 作者:Alexander Kirillov et. al. 编辑:肖琴 Facebook人工智能实验室(FAIR)何恺明等人团队在arXiv发 ...
- 超越EfficientNet,GPU上加速5倍,何恺明组CVPR 2020论文提出新型网络设计范式
选自arXiv 作者:Ilija Radosavovic等 机器之心编译 机器之心编辑部 近日,何恺明大神组又发了一篇新论文,提出了一种新的网络设计范式.与以往研究不同,他们没有专注于设计单个网络实例 ...
- 何恺明团队新作!深度学习网络架构新视角:通过相关图表达理解神经网络
标题&作者团队 导语:恺明大神出品,必属精品.Facebook的研究员从一个新奇的角度对神经网络的表示与设计进行探索,提出了一种新颖的相关图表示方式.它有助于对现有网络架构进行更深层次的分析与 ...
- 【重磅】旷视提出MegDetV2:目标检测/实例分割新系统
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 编辑:Amusi 在COCO 2019/2020 挑战赛中获得最佳结果!该方案包含RPN++. ...
最新文章
- getconnectiontimeoutexception 网络问题排查_通俗解析居家宽带网络问题:光猫设备排查教程篇...
- html2canvas在Vue项目踩坑-生成图片偏移不完整
- python代码需要背吗-20个Python代码段,你需要立刻学会,好用到哭!
- 计算机网络工程与菅理,网络工程与管理
- dubbo-go 白话文 | 从零搭建 dubbogo 和 dubbo 的简单用例
- PWN-PRACTICE-BUUCTF-22
- 外设驱动库开发笔记37:S1336-5BQ光敏二极管作为光度计驱动
- 个位数不含4用计算机表示,计算机组成原理
- 动画会震一下css,csshake.css强大的CSS3元素抖动动画库
- 从零开始的unity3d入门教程(二)----基本功能讲解
- 嵌入式系统开发10——STM32串口通信
- html怎么清除背景颜色,怎么去除Word复制网页内容的背景色?
- 计算机教学中扩词扩句的应用,【教学设计】学习扩写 ——部编人教版九下第一单元写作...
- php cms下载地址,让PHPCMS下载内容页显示链接真实地址
- PB调用DLL的常见问题及处理方法
- linux绝育玩客云_玩机技巧 篇二:玩客云实用指南(真·无痛绝育),附玩物下载对比...
- Dotaer vs Loler
- 百度搜索接口api_百度站长平台上线落地页视频转存功能,确保专业问答视频资源的质量和稳定性...
- 计算机网络技术(一)——概论
- 顶级产品经理是如何利用王者荣耀,3步毁掉你的自律。
热门文章
- 二条件if else语句可以用离散二分布概率函数实现
- 高性能计算专家Jack Dongarra获2021年图灵奖
- MT to Death,专访 ACL Fellow刘群,一个NLPer的极致表白
- 中国、意大利等国研究员用AI 发现新的月球陨石坑 | AI日报
- 李开复:发明期已过,AI科学家创业需谨慎(附演讲视频)
- 豆瓣评分 8.6,近 5 万读者学习的 Android 经典最新版出版,承载无数程序员的回忆......
- Tensorflow-gpu1.13.1 和 Tensorflow-gpu2.0.0共存之安装教程
- DCGAN论文笔记+源码解析
- 独家|OpenCV 1.2 如何用OpenCV扫描图像、查找表和测量时间(附链接)
- 铲屎官福音:汪星人和喵星人的小情绪,AI 可以识别了