点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

本文提出了一个联合检测视频关键帧和地标的框架U-LanD。我们解决了一个特别具有挑战性的问题,训练标签是有噪声和高度稀疏的。U-LanD建立在一个关键的观察基础上:一个只在关键视频帧上训练的深度贝叶斯地标检测器,与视频中的其他帧相比,这些帧的预测不确定性显著降低。我们使用这个观察作为一个无监督信号自动识别关键帧,我们检测地标。作为我们框架的测试平台,我们使用心脏的超声成像视频,其中稀疏和嘈杂的临床标签只能用于每个视频的单个帧。使用4493例患者的数据,我们证明U-LanD在R方评分上的绝对优势显著地超过了最先进的非贝叶斯模型,达到42%,几乎没有模型大小的负担。我们的方法是通用的,可以潜在地应用于其他具有噪声和稀疏训练标签的具有挑战性的数据。

论文创新点

我们证明了U-LanD在具有挑战性数据集的稀疏注释数据上的有效性,即超声心动图(回声,心脏超声)。回声视频,又名回声电影系列,有着臭名昭著的噪声性质(样本帧可以在图1中看到),这增加了自动分析的复杂性。我们解决了左室流出道(LVOT)里程碑检测[23]的任务,这是一个遭受标签稀疏性极端限制的问题;在LVOT训练视频中,整个帧跨度中只有一帧具有ground-truth landmark标签。在每个训练视频中,临床专家都标注了两个点的位置(用于测量左心室直径的点的坐标),只标注了一帧(心脏收缩期中期周围的一帧),在这一帧中,目标对象,即主动脉,具有最高的可见性。在我们的实验中,我们收集了4493名患者的大规模回声数据集,证明了ULanD可以显著提高最先进的非贝叶斯对应对象的结果。同时,U-LanD是全自动的,它可以超过涉及专家监督的半自动关键帧地标检测的结果。

框架结构

提出的U-LanD框架的框图,包括训练、统计校准和测试阶段。ULanD自动预测视频关键帧上的地标,而训练视频只标注在一帧上。我们建议利用贝叶斯地标检测器(BU-Net)的预测不确定性,通过时间来识别关键帧和非关键帧。

实验结果

测试视频的样本帧,以及它们对应的任意和认知不确定性映射。a)采样非关键帧,不确定度高(无地标预测)自动丢弃。b)将预测地标叠加在关键帧上的关键帧样本。心脏超声视频的目标是左血流;地标是用来测量LVOT长度(两点之间的线)。图(b)显示了预测的地标(绿色)、地面真实地标(橙色)和重叠部分(黄色)。这种情况下的预测误差(长度的平均绝对差)为0.18 mm。此外,样本视频结果在补充材料中给出。

结论

在本文中,我们提出了U-LanD,一个贝叶斯框架,用于在具有极稀疏和噪声标签的视频中联合关键帧和地标检测。U-LanD利用时间的不确定性变化作为无监督信号来检测视频关键帧上的地标。我们在一个具有挑战性的心脏超声系列数据集上演示了U-LanD,其中每个训练视频中只有一帧被注释,然而这些注释是嘈杂的临床标签。在实验中,我们从4493例患者中采集了大规模的echo系列视频数据集,显示了U-LanD的有效性;以42%(+175%)的显著边际提高了最先进的非贝叶斯对应的R方分数,没有额外的标签成本,几乎没有内存开销。U-LanD(全自动)在R2评分上也比半自动视频里程碑检测高出25%(+61%)。U-LanD即使简单选择骨干检测器9和OOD剔除方法,也能取得较好的效果。未来的工作可能包括研究多目标检测和跟踪中的时间不确定性。

论文链接:https://arxiv.org/pdf/2102.01586.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

- END -

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

U-LanD:基于不确定性的视频地标检测相关推荐

  1. OpenCV + python 实现人脸检测(基于照片和视频进行检测)

    OpenCV + python 实现人脸检测(基于照片和视频进行检测) Haar-like 通俗的来讲,就是作为人脸特征即可. Haar特征值反映了图像的灰度变化情况.例如:脸部的一些特征能由矩形特征 ...

  2. python视频人脸检测_OpenCV + python 实现人脸检测(基于照片和视频进行检测)

    OpenCV + python 实现人脸检测(基于照片和视频进行检测) Haar-like 通俗的来讲,就是作为人脸特征即可. Haar特征值反映了图像的灰度变化情况.例如:脸部的一些特征能由矩形特征 ...

  3. python人工智能图像识别视频下载链接_2019-07-11 人工智能-图像识别项目分析-基于tensorflow的视频物品检测...

    选题:基于tensorflow的视频物品检测 Real-Time Object Recognition App with Tensorflow and OpenCV 一个实时对象识别应用程序 1.准备 ...

  4. C++基于opencv4的视频质量检测

    C++基于opencv的视频质量检测原理来源 请参考原作者的文章 , 本文引用了实现的思想说明https://www.cnblogs.com/wqvbjhc/tag/%E8%A7%86%E9%A2%9 ...

  5. 3d max用不同目标做关键帧_基于光流的视频目标检测系列文章解读

    作者:平凡的外卖小哥 全文5747字,预计阅读时间15分钟 1 简介 目前针对于图片的目标检测的方法大致分为两类: faster R-CNN/R-FCN一类: 此类方法在进行bbox回归和分类之前,必 ...

  6. tensorflow2 目标检测_基于光流的视频目标检测系列文章解读

    作者:平凡的外卖小哥 全文5747字,预计阅读时间15分钟 1 简介 目前针对于图片的目标检测的方法大致分为两类: faster R-CNN/R-FCN一类: 此类方法在进行bbox回归和分类之前,必 ...

  7. 基于MATLAB的视频运动目标检测识别

    一.课题介绍 视频图像处理技术广泛用于工业.安全.医疗.管理等领域.运动目标的检测和跟踪是图像处理技术在视频序列图像处理方面的一个重要应用,在航天.交通.机器人视觉.视频监控.公共场所客流数据监测等场 ...

  8. 基于OpenCV的视频人脸检测

    前言 设备使用带摄像头的笔记本与下载好IP摄像头软件的手机 Python版本为3.8 本人的OpenCV版本为4.5.1.48 本文人脸检测使用的是CV封装好的 haarcascade_frontal ...

  9. 基于帧间频域分析的视频篡改检测

    基于帧间频域分析的视频篡改检测 摘要:提出一种通过帧间频域分析,来对视频频篡进行盲检测.本文首先梳理分析目前视频分析取证的一些方法.总结出视频分析的依赖于视频连续帧中某一特性的不变性或连续性,提出可以 ...

最新文章

  1. Docker 入门系列(6)- Docker 互联
  2. 详解:Camera-IMU内外参标定原理
  3. HarmonyOS 手机应用开发者 Beta 版到来,对开发者意味着什么
  4. redhat6.4 添加yum本地源和安装virtualbox增强组件
  5. tomcat的热部署
  6. android 学习随笔二十(多媒体编程 )
  7. 计算机网络项目——最小网元设计(阶段二)
  8. qt创建简单的单例模式
  9. Cookie、Session、Token、JWT分别是什么(三)
  10. 文强+光裕+唐骏,告诉我们什么?
  11. 7.3.Zeng_Cache(4) --- 后端
  12. 【对话系统】对话系统核心技术概要
  13. 编写程序 - 打印购物小票.
  14. mace micro 代码分析: netdef 和Graph文件的生成
  15. c语言数组转换树存储结构,c语言, 一棵具有n个结点的完全二叉树以数组存储,试写一个非递归 算法实现对 该树的前序遍历。...
  16. 荧光微球激发光谱图/橙色荧光微球/绿色荧光微球/氨基红色荧光微球/氨基橙色荧光微球
  17. 用公司邮箱发错邮件怎么弄?邮件可以撤回吗?
  18. 大学生创新创业大赛应该如何入手?互联网+ 三创赛 挑战杯 有现成模板
  19. android实现气泡聊天
  20. Java父子二人求父子年龄_六年级数学年龄问题应用题练习2013

热门文章

  1. 解析深度神经网络背后的数学原理!
  2. JUC 常用 4 大并发工具类
  3. 一个支付案例,学会策略模式!
  4. GET 和 POST请求的本质区别是什么?原来我一直理解错了
  5. 研究一下,如何实现一个文件系统
  6. 数据挖掘终篇!一文学习模型融合!从加权融合到stacking, boosting
  7. 剑指offer_第8题_跳台阶
  8. GitHub:数据科学最全资料集合
  9. 自己挖坑自己填,谷歌大改Transformer注意力,速度、内存利用率都提上去了
  10. 博士真正搞科研的姿势