#CVPR 2021##全景分割##开放集#

1、Exemplar-Based Open-Set Panoptic Segmentation Network

首尔大学&Adobe Research

先是定义开放集全景分割(OPS)任务,并通过深入分析其固有的挑战,利用合理的假设使其可行。通过重新格式化 COCO 构建一个全新的 OPS 基准,并作为 Panoptic FPN 的变种展示其基线的性能。EOPSN 是基于典范理论的开放集全景分割框架,在检测和分割未知类别的例子方面都是有效的。

已开源:https://github.com/jd730/EOPSN

论文:https://arxiv.org/abs/2105.08336

主页:https://cv.snu.ac.kr/research/EOPSN/

#人体姿势预测#

2、Human Motion Prediction Using Manifold-Aware Wasserstein GAN

Univ. Lille

Human motion prediction(人体姿势预测)当前的一些挑战有预测运动的不连续性和长期范围内的性能衰减。本次工作,作者通过使用人类运动的紧凑 manifold-valued 表示来进行解决。实验证明所提出方法在 CMU MoCap和 Human 3.6M 数据集上的表现优于最先进的方法。定性结果也展示了预测运动的平稳性。

已开源:https://drive.google.com/drive/folders/1pQkwtVDBeubW1oPwuXWFOOtftHabKaph

论文:https://arxiv.org/abs/2105.08715

#ICME 2021 oral##显著目标检测#

3、Exploring Driving-aware Salient Object Detection via Knowledge Transfer

北航&鹏城实验室&美团

构建一个全新的数据集:CitySaliency,用于特定任务(驾驶任务) SOD,可以促进 task-aware SOD 的发展。通过知识迁移卷积神经网络提出一个驾驶任务感知 SOD 的基线模型。在这个网络中,构建一个基于注意力的知识迁移模块来弥补知识差异。此外,还引入一个高效的边界感知特征解码模块,对复杂的特定任务场景中的目标进行细致的特征解码。整个网络以一种渐进的方式整合了知识迁移和特征解码模块。实验证明所提出方法在该数据集上的表现优于 12 种最先进的方法,促进了任务感知 SOD 的发展。

将开源:http://cvteam.net/papers.html

论文:https://arxiv.org/abs/2105.08286

#图像分割#

4、Finding an Unsupervised Image Segmenter in Each of Your Deep Generative Models

牛津大学学者开发一个自动程序用于寻找导致前景和背景分离的动向,并使用这些动向来训练图像分割模型,无需人工监督。该方法是 generator-agnostic(与生成器无关),在各种不同的 GAN 架构下都能产生强大的分割结果。此外,通过利用在 ImageNet 等大型数据集上预训练的 GANs,能够对一系列领域的图像进行分割,而无需进一步的训练或微调。在图像分割基准上对所提出方法进行评估,与之前的工作相比,既不需要人工监督,也不使用训练数据。总的来说,从预训练的深度生成模型中自动提取前景-背景结构可以作为人类监督的一个非常有效的替代。

将开源:https://github.com/lukemelas/unsupervised-image-segmentation

主页:https://lukemelas.github.io/unsupervised-image-segmentation/

论文:https://arxiv.org/abs/2105.08127

#视频#

5、VPN++: Rethinking Video-Pose embeddings for understanding Activities of Daily Living

石溪大学&Inria and Universite Cote d’Azur

Video-Pose Network(VPN),是姿势驱动的注意力机制的扩展,可用于对不同方向进行探索,一个是通过特征级蒸馏将 Pose knowledge 迁移到 RGB 中,一个是通过注意级蒸馏模仿姿势驱动的注意力。然后将它们整合为一个单一的模型:VPN++。实验验证 VPN++ 不仅有效,而且还提供了高速度和对噪声姿势的高弹性。无论有无 3D姿势,VPN++ 在 4 个公共数据集上的表现都优于代表性的基线。

已开源:https://github.com/srijandas07/vpnplusplus

论文:https://arxiv.org/abs/2105.08141

#ICDAR 2021##表单理解#

6、Visual FUDGE: Form Understanding via Dynamic Graph Editing

杨百翰大学&Adobe Research

FUDGE,是一种可视化的表单理解方法,通过结合文本片段(图形顶点)和以迭代的方式修剪边缘来编辑图形结构,以获得最终的文本实体和关系。可以应用于文本识别困难的表单(如降质的或历史表单),以及因为预训练一些语言模型是具有挑战性的资源匮乏的语言表单。FUDGE 在历史题材 NAF 数据集上是最先进的。

将开源:https://github.com/herobd/FUDGE

论文:https://arxiv.org/abs/2105.08194

【5月19日】 开源论文代码分享 分割、姿势预测,目标检测相关推荐

  1. 【历史上的今天】11 月 19 日:Microsoft Office 首次发布;谷歌开源 Chrome OS;Twitter 创始人出生

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2021 年 11 月 19 日,在 5 年前的今天,世界首个光子神经网络诞生:来自普林斯顿大学的 Alexand ...

  2. 互联网晚报 | 3月19日 星期六 |​ 拼多多回应“六万人砍价不成功”;Netflix计划向分享账号的用户收费...

    拼多多回应"六万人砍价不成功":不实 未来将完善活动流程 新浪科技讯 3月19日下午消息,近日,主播直播间动员几万人参与拼多多砍一刀,称两小时内也没有成功.网友纷纷要官方给出一个回 ...

  3. 8月19日BBUG:电信技术开发经验分享与前景展望

    主题:电信技术开发经验分享与前景展望 时间:2006年8月19日星期六 1:30PM-5:30PM 地点:北京复兴门内大街51号 民族饭店11层东厅会议室 行车路线:乘坐地铁在复兴门或西单站下车,复兴 ...

  4. 分享Silverlight/WPF/Windows Phone一周学习导读(8月15日-8月19日)

    分享Silverlight/WPF/Windows Phone一周学习导读(8月15日-8月19日) 本周Silverlight学习资源更新: Silverlight Tools 4安装时的错误提示 ...

  5. 9 月 19 日,腾讯云安全中心监测到  Apache Tomcat 修复了2个严重级别的漏洞, 分别为: 信息泄露漏洞(CVE-2017-12616)、远程代码执行漏洞(CVE-2017-12615

    9 月 19 日,腾讯云安全中心监测到  Apache Tomcat 修复了2个严重级别的漏洞, 分别为: 信息泄露漏洞(CVE-2017-12616).远程代码执行漏洞(CVE-2017-12615 ...

  6. 高能预警:SFDC安全技术大会将于11月19日在北京举办,岂安科技CEO罗启武受邀演讲

    SegmentFault 面向全国开发者的技术大会--SegmentFault Developer Conference 2016(以下简称 SFDC), 将于 11.19 和 12.10 先后在北京 ...

  7. 豆瓣评分9.4!跟邱锡鹏教授一起学「神经网络与深度学习」,7月19日开课

    我们经常会在后台收到一些比较简要的技术咨询,描述了是什么任务,发现用BERT粗暴精调效果不好之后,问我们有什么办法可以提升.我们: 在面对第一把梭就失败时,我们通常是这么判断的: 1. 如果效果差的很 ...

  8. 【历史上的今天】2 月 20 日:Python 代码首次发布;Facebook 收购 WhatsApp;DEC 创始人出生

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2023 年 2 月 20 日,在历史上的今天,吉多·范罗苏姆正式对外公布 Python 代码,版本为 0.9.0 ...

  9. 解密谷歌机器学习工程最佳实践——机器学习43条军规 翻译 2017年09月19日 10:54:58 98310 本文是对Rules of Machine Learning: Best Practice

    解密谷歌机器学习工程最佳实践--机器学习43条军规 翻译 2017年09月19日 10:54:58 983 1 0 本文是对Rules of Machine Learning: Best Practi ...

最新文章

  1. command对象提供的3个execute方法是_21个极大提高开发效率的VS Code快捷键
  2. 典型问题分析(十五)
  3. python手机版打了代码运行不了-如何用iPad运行Python代码?
  4. ApacheFlink简介
  5. 使用spinner 做下拉对话框
  6. 全国计算机等级考试题库二级C操作题100套(第04套)
  7. 深度学习之卷积神经网络 VGGNet
  8. python把csv做成柱状图_用Python的Matplotlib模块实现CSV数据格式的可视化
  9. echart折线图删除_用Echart创建简单的折线图
  10. sscnc machine simulation电气识图_高级电气工程师的六大技能,PLC仅占其一,都会了年薪轻松50W+...
  11. flowplayer设置视频logo
  12. vs 2008 连接 tfs 2010
  13. EPLAN学习笔记——常用操作步骤
  14. Arduino Uno+步进电机28BYJ-48+ULN2003 实现简单的正反转demo
  15. html文件打开自动跳转至空白
  16. Linux用户不同UID分类区别
  17. Linux nm命令详解
  18. python基础语法及知识点总结
  19. 苹果审核Metadata Rejected解决
  20. 各路由协议的协议号_2020春节档,各路高手巅峰对决?鹿死谁手

热门文章

  1. centos telnet 安装 配置
  2. Linux2.6内核中链表的实现
  3. Java中的DeskTop类
  4. socket sock inet_sock 等关系
  5. 把服务器文件备份到文件服务器,服务器之间文件备份方案、如何把服务器文件自动备份到另外一台服务器?...
  6. 英雄探长的机器人怎么拼_LOL路人局都畏惧的辅助英雄,新版机器人布里兹上手指南...
  7. 共享库报错问题及解决方案
  8. axure 导入元件库显示不出白框_AXURE免费元件库分享-web
  9. css不换行属性_CSS强制不换行的whitespace:nowrap的坑,你会填么?
  10. 局域网服务器共享文件怎么设置,【局域网共享文件】局域网如何文件共享_局域网共享设置文件夹_佰佰安全网...