目标检测是计算机视觉领域的一个基础研究主题,它利用每张图像的预定义类标签来预测边界框。大多数主流检测器使用的是基于锚的标签分配和非极大值抑制(NMS)等手动设计。近来,很多研究者提出方法通过距离感知和基于分布的标签分类来消除预定义的锚框集。尽管这些方法取得了显著的进展和优越的性能,但抛弃手动设计的 NMS 后处理可能阻碍完全的端到端训练。

基于这些问题,研究人员相继提出了 Learnable NMS、Soft NMS 和 CenterNet 等,它们能够提升重复删除效果,但依然无法提供有效的端到端训练策略。之后,Facebook AI 研究者提出的 DETR 将 Transformer 用到了目标检测任务中,还取得了可以媲美 Faster R-CNN 的效果。但是,DETR 的训练时间却大大延长,在小目标上的性能也相对较低。

旷视科技研究院BaseDetection组研究员王剑锋和西安交通大学的研究者近期提出了一个新颖问题:全卷积网络是否可以实现良好的端到端目标检测效果?(End-to-End Object Detection with Fully Convolutional Network)并从标签分配和网络架构两个方面回答并验证了这一问题。智源社区特邀请王剑锋研究员就相关内容做报告分享,欢迎大家交流。

报告主题:标签分配与端到端目标检测

报告时间:2021年2月4日(周四)19:00~20:00

报告形式:线上(Zoom + 智源社区Hub直播)

报 告 人 :王剑锋

个人简介:王剑锋,旷视科技研究院BaseDetection组研究员,北京航空航天大学硕士,主要研究方向为计算机视觉中的目标检测。

报告摘要:

标签分配 (label assignment) 是目标检测 (object detection) 至关重要的一个环节,近两年得到了许多的关注与研究。本次报告将分为两个部分,首先试图从一个统一的视角归纳总结常见的几种标签分配策略;其次将讨论标签分配与近期获关注较多的端到端 (end-to-end) 检测的关系,并介绍我们最近在端到端检测上的工作。

观看方式:

Zoom观看

https://zoom.com.cn/j/6011507040(无密码)

智源社区Hub直播:(点击【阅读原文】或扫描下方二维码)

欢迎加入知源月旦 Transformer+X 研究组

LIVE 预告 | 旷视王剑锋:丢弃Transformer,FCN也可以实现端到端检测相关推荐

  1. LIVE 预告 | 旷视王剑锋:全卷积网络,可以实现更好的端到端目标检测吗?

    目标检测是计算机视觉领域的一个基础研究主题,它利用每张图像的预定义类标签来预测边界框.大多数主流检测器使用的是基于锚的标签分配和非极大值抑制(NMS)等手动设计.近来,很多研究者提出方法通过距离感知和 ...

  2. LGD:涨点神器!旷视孙剑、张祥雨团队提出标签引导的自蒸馏技术,助力目标检测!...

    关注公众号,发现CV技术之美 本文介绍论文『LGD: Label-guided Self-distillation for Object Detection』,由旷视孙剑.张祥雨团队等提出标签引导的自 ...

  3. 旷视孙剑博士提出LGD,训练速度提升51%,适用于目标检测的知识蒸馏

    来源:新智元 [导读]知识蒸馏已经成了目前常用的模型压缩方法,但相关研究还局限在图像分类任务上.最近旷视孙剑博士联手西安交大发表了一篇论文,提出新模型LGD,无需一个强力的teacher模型也能在目标 ...

  4. 多快好省的目标检测器来了,旷视孙剑团队提出Anchor DETR:基于Anchor Point的DETR

    作者丨小马 编辑丨极市平台 本文原创首发于极市平台公众号,转载请获得授权并标明出处. [写在前面] 在本文中,作者提出了一种基于Transformer的目标检测器.在以前基于Transformer的检 ...

  5. 预告 | 旷视成都研究院负责人刘帅成:图像对齐技术及其应用

    北京时间12月18日(周三)晚8点,旷视成都研究院负责人刘帅成博士,将在将门技术社群在线进行技术分享,主题为"图像对齐技术及其应用".这次分享中,他将会介绍图像对齐领域的发展现状和 ...

  6. ResNet成阿尔法元核心技术 旷视孙剑详解Zero的伟大与局限

    摘要:2017年10月19日,DeepMind团队发表了迄今最强版本的AlphaGoAlphaGo Zero,其中一个重要模块是出自华人团队的深度残差网络ResNet.就此背景,新智元采访了深度残差网 ...

  7. AlphaGo Zero「无师自通」背后的伟大与局限 | 旷视孙剑解读

    整理 | 安木 当你被 AlphaGo Zero 刷屏的时候,你是对人类的创造力产生自豪,还是对人类的未来感到担忧? 10 月 20 日,旷视科技(Face++)首席科学家孙剑博士接受了多家媒体的群访 ...

  8. R TALK | 旷视孙剑:如何打造云、端、芯上的视觉计算

    「R TALK 」是北京智源-旷视联合实验室推出的一个深度学习专栏,将通过不定期的推送,展示旷视研究院的学术分享及阶段性技术成果.「R Talk 」旨在通过一场场精彩纷呈的深度学习分享,抛砖引玉,推陈 ...

  9. 对话旷视孙剑:比 TensorFlow 还早半年,旷视 Brain++ 的进化法则

    质疑与荣耀,技术与商业,所有疑问,或许通过这样一个国产自主的AI框架,至少可以回答一半. 打榜.噱头.争议.烧钱 创新.天才.明星.思辨 -- 评价 AI 企业,有人说他们是烧钱的机器.科技行业的共享 ...

最新文章

  1. c语言多线程转python多线程,真正的python 多线程!一个修饰符让你的多线程和C语言一样快...
  2. jQuery中$.fn的用法示例介绍
  3. QT QSqlTabModel 学习,用于从数据库中存取修改等操作。
  4. Oracle 12C R2-新特性-转换函数的增强
  5. 云时代架构--阅读笔记03
  6. 关于android.view.WindowLeaked异常的解决方案
  7. 链表 python 牛客_牛客网《剑指offer》之Python2.7实现:合并两个排序的链表
  8. 2019-2020年中国小吃产业发展报告
  9. pycharm无法安装第三方的包(AttributeError: module 'pip' has no attribute 'main')
  10. go语言实现zip压缩与解压
  11. mongodb安装、远程访问设置、管理命令、增删改查操作以及GUI
  12. java模拟浏览器http请求_java使用HttpClient模拟浏览器请求
  13. jquery jqplot pierenderer 饼图百分比小于3的无法显示DataLabels
  14. PLSQL Developer 64位下载
  15. 运用Python爬虫爬取一个美女网址,爬取美女图
  16. 最详细职场面试题目(一)
  17. 社区计算机义务维修策划书,义务维修电脑策划书.doc
  18. [转载] 七龙珠第一部——第041话 玛斯鲁塔的毁灭
  19. 你应该要懂的宇宙真相——《给忙碌者的天体物理学 》下篇
  20. 苹果设计团队正在经历重大变革:三名核心元老离职

热门文章

  1. web 服务器-Nginx
  2. 计算机系统验证课件,回顾性验证及再验证简介(ppt 42页)
  3. android开发常用的设计模式,android开发设计模式之——单例模式详解
  4. 对象的序列化和反序列化
  5. autosar中com模块_详细介绍AUTOSAR各个模块作用PART1(OS,SYS)
  6. Django:永别了pycrypto库~
  7. 臻好黄金百香果苗做一个有脑子的程序员
  8. Nodejs教程30(完结):PM2入门
  9. 在深谈TCP/IP三步握手四步挥手原理及衍生问题—长文解剖IP
  10. 关于数据仓库数据质量的问题处理