今天介绍两篇在计算机视觉领域应用图神经网络的论文,这两篇论文选自CVPR2020,都可以在arxiv上找到对应的原文。

第一篇论文题目为Object Relational Graph with Teacher-Recommended Learning for Video Captioning,这篇论文的署名单位有中国科学院自动化研究所,中科大以及人民日报。

本文的任务是Video Caption, 在(Video)Caption如何充分利用视觉和语言的信息一直是研究的主题。论文称现有的模型因为没有挖掘视频中Object之间的关系而缺乏足够的视觉特征,同时由于已有标注文字的分布呈现幂律分布导致没有足够丰富的单词来进行生动的描述。基于这两点,本文作者提出了一个模块捕捉Object关系,以及一个Teacher recommend learning (TRL)的方法使得语言词汇更加丰富。

词汇Long-tailed效应,左边是原来的分布,右边是经过TRL的分布

下面是论文的主要结构图:模型称为ORG-TRL。它主要由左上方显示的基于ORG的对象编码器组成框,以及在右上角具有时间/空间注意的分层解码器。左下角的框为TRL,右下角的公用TEL。

更多详细内容,论文:https://arxiv.org/pdf/2002.11566.pdf

第二篇论文题目为Social-STGCNN: A Social Spatio-Temporal Graph Convolutional Neural Network for Human Trajectory Prediction

本文作者来自The University of Texas at Austin以及KAUST, Stanford University。相关的代码已经公开。Code is available at

https://github.com/abduallahmohamed/Social-STGCNN.

理解行人的运动行为在自动驾驶中有着非常重要的作用。行人的轨迹不仅仅影响行人自己同时也影响着周边的一切, 之前的方法对于行人与周围行人的关系一般用一些特征聚合的方式,这些方法没有很好捕捉行人之间的交互关系等。该论文提出了Social-STGCNN,比较有新意的地方是本文提出了一个核函数将行人之间的social interactions嵌入到邻接矩阵中,进而来分析预测行人轨迹。

看完上面的叙述,我想social interactions怎么获得?难道要一个个标注一下吗?这样标注员也太辛苦了吧,另外这样的Interactions去哪里找?我们继续往下看:

The kernel function can thus be  considered as a prior knowledge about the social relations between pedestrians. A straightforward idea in designing the kernel function is to use the distance measured by the L2 norm defined in equation 8 between pedestrians to model their impacts to each other. However, this is against the intuition that the pedestrians tend to be influenced more by closer ones. To overcome this, we use similarity measure between the pedestrians. One of the proposals is to use the inverse of L2 norm as defined in equation10.

也就是说论文采用图上两个行人之间的距离来描述他们直接的相互影响,不过与直觉相反,因为越近我们认为影响越大,进一步作者修改为相似度,这原来就是作者描述的social interactions, 之前人体骨架轨迹预测也采用了类似的做法,这里作者进行行人轨迹的预测,作者定义为social-interactions

更多内容参考,

论文链接:https://arxiv.org/pdf/2002.11927.pdf

☆ END ☆

如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 mthler」,每日朋友圈更新一篇高质量博文(无广告)。

扫描二维码添加小编↓

【CVPR 2020】图神经网络在计算机视觉上的应用:精选论文两篇相关推荐

  1. 一小时讲懂图神经网络在分子上的应用

    介绍:图神经网络在分子上的应用是当前的研究热点.这个课件主要目标是用一小时给领域初学者讲清楚基础知识和背景,当前的研究热点,以及重要的工作.更重要的是,该课件内附很多领域内数据.公开赛.算法的链接,以 ...

  2. 清华大学计算机系张晨毕业院校,2020清华特奖入围名单公布:电子系学霸两篇顶会一作,2名计算机女生入选...

    2020清华特奖入围名单公布:电子系学霸两篇顶会一作,2名计算机女生入选 2020-10-23 14:54:19 来源:量子位 电子系学霸一篇CVPR,一篇ICML Oral 晓查 发自 凹非寺 量子 ...

  3. 【图神经网络实战】深入浅出地学习图神经网络GNN(上)

    文章目录 一.图神经网络应用领域 1.1 芯片设计 1.2 场景分析与问题推理 1.3 推荐系统 1.4 欺诈检测与风控相关 1.5 知识图谱 1.6 道路交通的流量预测 1.7 自动驾驶(无人机等场 ...

  4. 清华2020计算机系张晨,2020清华特奖入围名单公布:电子系学霸两篇顶会一作

    晓查 发自 凹非寺量子位 报道 | 公众号 QbitAI 一年一度,"神仙打架". 据清华小五爷园,2020年清华大学本科生特等奖学金答辩入围名单已经公布,共有15名同学入围. △ ...

  5. 三名学霸与计算机的缘,2020清华特奖入围名单公布:电子系学霸两篇顶会一作,2名计算机女生入选...

    来源:雪球App,作者: 量子位,(https://xueqiu.com/1097649362/161558011) 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一年一度," ...

  6. [MICCAI 2019 | CVPR 2020] 图数据,点云相关文章总结综述,一篇即可看完文章模型结构和创新

    [1] Integrating 3D Geometry of Organ for Improving Medical Image Segmentation,MICCAI2019,Part5 器官形状和 ...

  7. 【CVPR 2020】神经网络架构搜索(NAS)论文和代码汇总

    关注上方"深度学习技术前沿",选择"星标公众号", 技术干货,第一时间送达! [导读]今天给大家整理了CVPR2020录用的几篇神经网络架构搜索方面的论文,神经 ...

  8. 论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

    论文笔记整理:杨帆,浙江大学计算机学院. 动机 现有的用于图结构的预训练方法要么只关注node-level,导致在图表示空间没有区分度,要么只关注graph-level,导致在节点表示空间没有区分度. ...

  9. CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记

    目录 简介 动机 贡献 方法 实验 简介 本文的作者来自浦项科技大学和首尔大学 下载链接 动机 在Grounding领域,早些的方法都可以归结为scan-and-localize framework, ...

最新文章

  1. 元学习—Meta Learning的兴起
  2. CES现场低调的主线,近在咫尺的5G商业化 | CES2018技术趋势
  3. java linux so
  4. MIPS指令以及数据通路
  5. C和指针之字符串实现my_strrchr(char *str, int ch)的函数
  6. 第五周课程总结实验报告(三)
  7. 背包问题(动态规划)
  8. 使用CLONE TABLE方式实现同region不同可用区的MaxCompute
  9. 15 —— npm —— package.json 与 package-lock.json 的作用
  10. 用eclipice抓取JS代码
  11. clion开发php,如何在 Mac 上用 Clion 调试 php7 源码
  12. 思科 接入点 本地转发_思科路由器配置 IPv6 和 OSPFv3 路由
  13. mysql 5.6 参数详解
  14. wps表格在拟合曲线找点_excel拟合曲线函数表达式,excel散点拟合出来的公式看不懂。请问怎么写入表格使用?...
  15. ARM-QT5.14.2 触摸屏配置(电容屏/电阻屏)
  16. 一份Slide两张表格带你快速了解目标检测
  17. 8box播放器的引用
  18. [面试题] 从抽屉找东西的概率学问题
  19. 回望曾经的自己!对话心灵的治愈系漫画
  20. 常识-idea里鼠标左键选择变成矩形块

热门文章

  1. zsh报错 Insecure completion-dependent directories detected
  2. 网站SEO优化之sitemap协议
  3. access2010与mysql_计算机文化基础(第六章数据库系统与Access2010)
  4. 在excel中计算风向的函数
  5. SpringCloud Alibaba 之Sentinel
  6. 香港特首林郑月娥:希望阿里巴巴能够回香港上市
  7. 百度副总裁李硕:AI能深入场景创造真价值,从传感器到大屏仅是数字化开始...
  8. 千万不要在电脑中安装净网大师软件阿
  9. wordpress企业网站主题仿制01-企业仿站目标网站分析
  10. 新浪微博爬虫遇到的cookie rejected 问题解决办法