CVPR 2020几篇论文内容点评:目标检测跟踪,人脸表情识别,姿态估计,实例分割等

CVPR 2020中选论文放榜后,最新开源项目合集也来了。

本届CPVR共接收6656篇论文,中选1470篇,“中标率”只有22%,堪称十年来最难的一届。

目标检测

论文题目:

Bridging the Gap Between Anchor-based and Anchor-free Detection via
Adaptive Training Sample Selection

本文首先指出了基于锚点检测与无锚点检测的本质区别,在于如何定义正、负训练样本,从而导致两者之间的性能差距。

研究人员提出了一种自适应训练样本选择 (ATSS),根据对象的统计特征自动选择正样本和负样本。它显著地提高了基于锚点和无锚点探测器的性能,并弥补了两者之间的差距。

最后,还讨论了在图像上每个位置平铺多个锚点来检测目标的必要性。

论文地址:

https://arxiv.org/abs/1912.02424

代码:

https://github.com/sfzhang15/ATSS

目标跟踪

论文题目:

MAST: A Memory-Augmented Self-supervised
Tracker


这篇论文提出了一种密集的视频跟踪模型 (无任何注释),在现有的基准上大大超过了之前的自监督方法(+15%),并实现了与监督方法相当的性能。

首先通过深入的实验,重新评估用于自监督训练和重建损失的传统选择。其次,通过使用一个重要的内存组件来扩展架构,从而进一步改进现有的方法。而后,对大规模半监督视频对象分割进行了基准测试,提出了一种新的度量方法:可泛化 (generalizability)。

论文地址:

https://arxiv.org/abs/2002.07793

代码:

https://github.com/zlai0/MAST

实例分割

论文题目:

PolarMask: Single Shot Instance Segmentation with Polar
Representation



本文提出了PolarMask方法,是一种single shot的实例分割框架。PolarMask基于FCOS,把实例分割统一到了FCN的框架下。

FCOS本质上是一种FCN的dense prediction的检测框架,可以在性能上不输anchor based的目标检测方法。

贡献在于,把更复杂的实例分割问题,转化成在网络设计和计算量复杂度上和物体检测一样复杂的任务,把对实例分割的建模变得简单和高效。

论文地址:

https://arxiv.org/abs/1909.13226

代码:

https://github.com/xieenze/PolarMask

NAS

论文题目:

CARS: Continuous Evolution for Efficient Neural
Architecture Search

在本文中,研究人员开发了一种高效的连续演化方法来搜索神经网络。

在最近的迭代中,在一个超网中共享参数的种群中的架构,将在具有几个epoch的训练数据集上进行调优。下一个演化迭代中的搜索将直接继承超网和种群,加速了最优网络的生成。进一步采用非支配排序策略,仅保留Pareto前沿的结果,以精确更新超网。

经过0.4天的GPU连续搜索,可以生成多个模型大小和性能不同的神经网络。这些网络超过了基准ImageNet数据集上最先进方法产生的网络。

论文地址:

https://arxiv.org/abs/1909.04977

代码(即将开源):

https://github.com/huawei-noah/CARS

人体姿态估计

2D人体姿态估计

论文题目:

The Devil is in the Details: Delving into Unbiased Data
Processing for Human Pose Estimation

所有计算机视觉的任务都需要和数据处理打交道,但在关键点检测问题上,数据处理显得尤为重要。在关键点检测任务上,数据处理尚未被系统的学习,因此这篇文章关注了人体关键点检测问题的数据处理,认为它是算法的一个极其重要的组成部分。

在系统地分析这个问题的时候,发现现有的所有的state-of-the-art在这个环节上都会存在两个方面的问题:一个是在测试过程中,如果使用flip ensemble时,由翻转图像得到的结果和原图得到的结果并不对齐。另外一个是使用的编码解码(encoding-decoding)方法存在较大的统计误差。

这两个问题耦合在一起,产生的影响包括:估计的结果不准确、复现指标困难、有较大可能使得实验的结果结论不可靠。

论文地址:

https://arxiv.org/abs/1911.07524

代码:

https://github.com/HuangJunJie2017/UDP-Pose

人脸表情识别

论文题目:

Suppressing Uncertainties for Large-Scale Facial Expression
Recognition

本文提出了一种简单而有效的自修复网络(SCN),它能有效地抑制不确定性,防止深度网络对不确定的人脸图像进行过拟合。

具体来说,SCN从两个不同的方面抑制了不确定性:⑴在小批量上的自关注机制,通过排名规则化对每个训练样本进行加权;⑵重新贴标签机制,在排名最低的组中修改这些样本的标签。

论文地址:

https://arxiv.org/abs/2002.10392

代码(即将开源):

https://github.com/kaiwang960112/Self-Cure-Network

3D人体姿态估计

论文题目:

VIBE: Video Inference for Human Body Pose and Shape
Estimation



由于缺乏用于训练的ground-truth三维运动数据,现有的基于视频的最先进的方法无法生成准确和自然的运动序列。

为了解决这个问题,本文提出了身体姿态和形状估计的视频推理(VIBE),它利用了现有的大型动作捕捉数据集(AMASS)和未配对的、in-the-wild 2D关键点注释。

关键创新是一个对抗性学习框架,它利用AMASS来区分真实的人类动作和由时间姿态、形状回归网络产生的动作。

论文地址:

https://arxiv.org/abs/1912.05656

代码:

https://github.com/mkocabas/VIBE

CVPR 2020几篇论文内容点评:目标检测跟踪,人脸表情识别,姿态估计,实例分割等相关推荐

  1. 论文速递:AAAI 2023 | 优图16篇论文速览,含多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向

    近日,AAAI 2023(Association for the Advancement of Artificial Intelligence)国际先进人工智能协会公布了录用结果,本届会议共有8777 ...

  2. CVPR 2020丨更精准的视频目标检测:基于记忆增强的全局-局部整合网络的方法

    编者按:在视频物体检测任务中,由于相机失焦.物体遮挡等问题,仅基于图像的目标检测器很可能达不到令人满意的效果.针对此类问题,微软亚洲研究院提出了基于记忆增强的全局-局部整合网络(Memory Enha ...

  3. CVPR 2020 论文大盘点-目标检测篇

    本文盘点CVPR 2020 所有目标检测相关论文,总计64篇论文,感觉最大的特点是3D目标检测研究工作很多有21篇,尤其是工业界单位,可能是自动驾驶热带来的.2D目标检测依然很热,神经架构搜索也开始在 ...

  4. coco数据集目标检测论文_做目标检测,这6篇就够了:CVPR 2020目标检测论文盘点...

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 选自heartbeat 作者:Derrick Mwiti 转载:机 ...

  5. 【完结】如何掌握基于图像和视频的人脸表情识别,这9篇文章可以作为一个参考...

    文/编辑 | 言有三 人脸表情识别(Facial Expression Recognition,FER)作为人脸识别技术中的一个重要组成部分,近年来在人机交互.安全.机器人制造.自动化.医疗.通信和驾 ...

  6. ECCV 2020 论文大盘点-目标检测篇

    本文盘点ECCV 2020 与目标检测相关的研究,包含目标检测新范式.密集目标检测.点云目标检测.少样本目标检测.水下目标检测.域适应目标检测.弱监督目标检测.训练策略等,总计 41 篇,其中 2 篇 ...

  7. 腾讯优图8篇论文入选ECCV 2020,涵盖目标检测/跟踪/Re-ID/人脸等领域

    点击上方"视学算法",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:腾讯优图 近日,计算机视觉方向的三大国际顶级会议之一的ECCV 2020公布论文获 ...

  8. CVPR 2020最佳学生论文分享回顾:通过二叉空间分割(BSP)生成紧凑3D网格

    机器之心发布 机器之心编辑部 在近日举行的 CVPR 2020 大会上,最佳论文.最佳学生论文等奖项悉数公布.加拿大西蒙弗雷泽大学陈之钦(Zhiqin Chen )等人的「BSP-Net」相关研究获得 ...

  9. 2020年国内最新最优目标检测(完结篇)提供下载链接

    点击蓝字关注我们 computerVision 计算机视觉战队 ● 扫码关注,回复:目标检测 ● 获取目标检测相关下载链接 今天我们的目标检测综述最后一章,也是这个系列的完结,希望有兴趣的同学可以从中 ...

最新文章

  1. 序列比对-BLAST
  2. linux动态线程池--原理,这儿的代码不完整
  3. linux下influxdb安装教程,Linux下安装使用InfluxDB
  4. 达沃时代发布分布式块存储服务系统 启动存储生态圈
  5. 小蜜团队万字长文 | 讲透对话管理模型最新研究进展
  6. 谁能答对这道题?如有兴趣,请留下算法,呵呵~
  7. 自编fun函数求 N*N矩阵四周元素的平均值
  8. Python与JavaWeb的第一次碰撞
  9. 2021-2025年中国云托管服务行业市场供需与战略研究报告
  10. 测试工程师面试必问的十道题目!全答上来的直接免试
  11. 异常的继承关系与捕获关系(只有直系的继承关系时,下面的类才能被捕获,和辈分无关!!)
  12. 23种经典设计模式的java实现_5_职责链模式
  13. 模二多项式环 及 BCH码 的纯python实现和一些问题
  14. PS照片排版1寸2寸等及照片规格
  15. 递归与自我指涉标识牌Top 5
  16. windows10桌面_如何让Windows 10系统桌面变得更好看?
  17. 全选、反选、获取选中值
  18. 大模型微调技术(Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA)
  19. 计算机软件工程考研考哪些专业,2022考研:软件工程考研考什么科目?
  20. 我为什么会性格内向,能不能内向性格?

热门文章

  1. 简单图文配置golang+vscode【win10/centos7+golang helloworld+解决install failed等情况】
  2. 2022-2028年中国阻尼涂料市场研究及前瞻分析报告
  3. 2021-2027年中国智能家居设备行业市场前瞻与投资策略规划报告
  4. Git 常用操作(1)- 配置、查看、添加、暂存和提交
  5. 愿疫情早日过去,向那些在疫情战斗中牺牲的战士致敬
  6. plt.figure()的使用
  7. pytorch学习笔记(九):PyTorch结构介绍
  8. 操作系统学习笔记 第六章:设备管理(王道考研)
  9. nvGRAPH原理概述
  10. NVIDIA Tensor Cores解析