2月24日,2020 IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称CVPR)官方公布论文收录结果。我校信息与通信工程学院本科2016级学生王谭在新加坡南洋理工大学Prof. Hanwang Zhang指导和阿里巴巴达摩院的资助下,以第一作者撰写的论文“Visual Commonsense R-CNN”(视觉常识 R-CNN)被CVPR2020接收。这是我校第一位以第一作者在CVPR上发文的本科生。

CVPR是计算机视觉领域的三大世界顶级会议之一。本届CVPR投稿ID破万,最终收到来自世界各地的有效投稿6656篇,接收1470篇,录取率为22%,为近十年来最低。会议将于6月16-19日在美国华盛顿召开

王谭同学的论文“Visual Commonsense R-CNN”针对现有的Vision & Language任务所用Up-Down特征存在的bias较大、缺少构建物体与物体之间关系等问题,从因果推断(Causal Inference)的角度出发,利用Judea Pearl等人在2009年提出的“Do”算子和后门调整算法,结合现有的目标检测框架对现实场景中的物体进行干预(Intervention)。其本质可以简单的理解为“Borrow & Put”。

图1:和传统的贝叶斯条件概率对比

图2:视觉常识特征提取框架结构图

其研究和传统的贝叶斯条件概率对比,通过构建一个字典来把广泛存在于其他图片中的物体“borrow”到当前图片中。然后把借来的物体“put”到X、Y周围和X、Y对比,例如上图中的把 sink、handbag、chair等等移到toilet和person周围,然后通过后门调整公式计算干预后的值。最后通过一种自监督学习的方式学习到图片局部物体的更好的表征——我们称之为视觉常识特征。

作者在三个最主要的Vision & Language下游任务中对学习到的特征进行验证,都取得了目前最好结果。其中图片描述任务(Image Captioning)更是在Cider上比原先增长了近2个百分点。(提取框架图见图2,详细计算过程可参考文末链接文章)

因果理论是近一年来开始被计算机视觉学术界关注的全新方向和思路。这项研究除了是因果理论在计算机视觉学术界的推广,同时也和当下被广泛关注的自监督学习联系非常紧密。通过自监督学习可以有效地挖掘数据集中的特征信息,为广泛的计算机视觉下游任务提供便利,但是自监督学习缺乏直接的评价指标,需要耗费大量的实验和时间来验证算法的有效性。王谭希望花费了大量精力完成的这项成果能给学术界带来价值。

王谭,在校期间先后荣获国家奖学金、唐立新奖学金。加权平均分92.8,GPA3.99,前两年专业排名综合排名均位列1/450,所修67门课程中有62门90分以上,获得四川省优毕业生称号。于2019年7月前往新加坡南洋理工大学实习。2019年11月,他以第一作者撰写的论文“Matching Images and Text with Multi-modal Tensor Fusion and Re-ranking”(基于多模态张量融合和重排序的图像文本检索)被第27届国际多媒体会议(The 27th ACM International Conference on Multimedia)接收为Oral(大会演讲)论文。2020年1月,他以共同第一作者完成的论文“Cross-Modal Attention with Semantic Consistence for Image-Text Matching”被人工智能1区期刊TNNLS(IEEE Transactions on Neural Networks and Learning Systems)接收。

本科生学计算机视觉实际吗,成电信通学院本科生在全球计算机视觉顶会CVPR上发表研究成果...相关推荐

  1. 计算机学院 图论方向,成电计算机学院本科生在计算机科学理论方向重要国际会议SAT上发表论文...

    近日,计算机科学与工程学院(网络空间安全学院)2017级本科生和肖鸣宇教授撰写的论文"A Fast Algorithm for SAT in Terms of Formula Length& ...

  2. 我如何在计算机视觉顶级会议CVPR上发表论文?

    Scalers 点评: 两个月前,成长会的Ramon(S290)收到了计算机视觉顶级会议CVPR论文录取的通知,而且是口头报告.CVPR在计算机视觉领域属于三大顶级会议之一,具有较高的影响力,对于一名 ...

  3. [转载]我如何在计算机视觉顶级会议CVPR上发表论文?

    Scalers 点评: 两个月前,成长会的Ramon(S290)收到了计算机视觉顶级会议CVPR论文录取的通知,而且是口头报告.CVPR在计算机视觉领域属于三大顶级会议之一,具有较高的影响力,对于一名 ...

  4. 赵旭计算机论文,上海交通大学赵旭教授团队在计算机视觉顶级期刊上发表最新研究成果...

    近日,自动化系赵旭教授团队硕士研究生宋潇.方良骥.胡翰文在International Journal of Computer Vision (IJCV) 上在线发表研究论文"EdgeSter ...

  5. 计算机自动化通信领域顶级期刊,电院自动化系赵旭教授团队在计算机视觉顶级期刊 IJCV 上发表最新研究成果...

    近日,自动化系赵旭教授团队硕士研究生宋潇.方良骥.胡翰文在International Journal of Computer Vision (IJCV) 上在线发表研究论文"EdgeSter ...

  6. 最新:前SAP首席科学家邬学宁加入e成科技 担任首席数据官

    来源:e成科技(ID:ifchange2013) 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头 ...

  7. 中通滤波matlab,如何用MATLAB将低通改成中通滤波器

    程序注释:有疑问的我标注出来了???f1=10;f2=200;fs=1000;????????F1=f1/fs;F2=f2/fs;???????%数字频率(此处应该是2*f1/fs,2*f2/fs)? ...

  8. 本科生学深度学习-大白话说清楚CNN,没有公式

    推荐阅读 1.再不入坑就晚了,深度神经网络概念大整理,最简单的神经网络是什么样子 2.本科生学深度学习,搭建环境,再不入坑就晚了 3.深度学习基础之numpy,轻松入门numpy4.深度学习基础之三分 ...

  9. Dahua Lin是香港中文大学汤晓鸥教授的高徒,在计算机视觉/机器学习方面有很深的造诣。他在自己的主页上有一个推荐书表,值得大家作为参考。 全英文版的,感觉到与国际接轨的压力了!!!

    Dahua Lin是香港中文大学汤晓鸥教授的高徒,在计算机视觉/机器学习方面有很深的造诣.他在自己的主页上有一个推荐书表,值得大家作为参考. 全英文版的,感觉到与国际接轨的压力了!!! Recomme ...

  10. 重邮计算机专业取得奖项,重庆邮电大学移通学院学子在2019中国大学生计算机设计大赛全国总决赛中喜获四项国家级奖励...

    2019年7月-8月,当我们还沉浸在暑假的自由与欢快中时,第十二届中国大学生计算机设计大赛全国总决赛已经在吉林大学.北京大学.安徽师范大学等多个赛区火热开展.重庆邮电大学移通学院双体系四支队伍经过前期 ...

最新文章

  1. 马云卖数据,你卖商品
  2. 如何将usb摄像头连接到虚拟机vmware ubuntu系统上?
  3. 到底什么是云计算-转自http://blog.csdn.net/adwu73
  4. hust1341(模拟)
  5. go语言IP转换uint32,uint32转换IP
  6. 《Python CookBook2》 第一章 文本 - 检查字符串中是否包含某字符集合中的字符 简化字符串的translate方法的使用...
  7. 智能会议系统(17)--- Linphone用户注册
  8. mysql c#开发库_c# 开发+MySql数据库
  9. 再谈子网划分方法与子网划分示例
  10. Atitit 数据库技术体系 艾提拉总结 目录 1. 2. 初始概念 5 2 1.1. 2.1. 数据库的类型,网状,层次,树形数据库,kv数据库。Oodb 多媒体数据库 5 2 1.2. 2.2.
  11. Bootstrap4颜色拾取器插件
  12. lisp天正图元位置修改_关于图元改层的,请求大佬帮助 - AutoLISP/Visual LISP 编程技术 - CAD论坛 - 明经CAD社区 - Powered by Discuz!...
  13. gimp:图层的混合模式
  14. 人工智能会议等级列表
  15. c语言 统计数量用count_C语言中count该怎么用
  16. iphone照片恢复至android,将照片从Android传输到iPhone的8种方法很容易
  17. dataTable 查询,重置
  18. Google glog
  19. 使用python操作excel的xls文件和xlsx文件之间的批量导出和填充数据
  20. UPC第41场,第42场部分题解

热门文章

  1. 双系统卸载ubuntu
  2. 关于M0内核MCU的Bootloader编写
  3. JSONP实现跨域(9种跨域方案)
  4. 漫聊科技发展史——1. 人工智能的发展史
  5. 什么是zone?如何做zone?如何做好zone?
  6. web留言板整蛊网站愚人节
  7. php保存pdf旋转90度,怎么把pdf旋转90度 多个pdf文件页面旋转的方法|支持选择要旋转的页面及旋转角度...
  8. Process finished with exit code -1073741819(0x0000005)
  9. Latex文档中 插入符号和编号
  10. 从零开始学习CTF——CTF是什么