转自 Dahua Lin’s blog

URL:http://dahuasky.spaces.live.com/blog/cns!1AB3BC993DB84FD7!1168.entry

本年度CVPR最有趣的文章

在今年的CVPR,见到了很多朋友,也看到很多Paper。
在这次会议里面让我最喜欢的一篇Paper,却不是在会议中正式发表的,而是在TC Panel派发的。这篇Paper的题目叫Paper Gestalt。文章以诙谐的笔调描述了一个基于vision + learning的自动paper review算法。
参加会议的朋友们可以很幸运的在会场获取这篇文章,至于没有来的朋友,我想只能向作者(这位兄弟(也许是姐妹)在paper中自称Carven von Bearnensquash, bearensquash@live.com)索要了。

chenyusiyuan@ 原文下载:http://vision.ucsd.edu/sites/default/files/gestalt.pdf


这篇论文出炉的背景,就是最近几年CVPR或者ICCV的submission呈现急速的指数增长的趋势(在过去10年翻了三倍)。按照这个速度增长,在 10年后每次会议的投稿量就会超过5000篇!也许最好的办法是采用“货币杠杆”进行“宏观调控”——就是对投稿者收费。比如,对每个 submission征收100美元的费用,我相信对于投稿的数量和质量都会取得立竿见影的效果。一方面,很多纯粹是来碰运气的作者会掂量一下花100块 钱来博取1%的命中机会是不是值得;而持认真态度的作者则会对paper精益求精,免得投稿费白白浪费;而最终文章被录用的作者就可以减免注册费,会议方面也有更多的funding来给有志于为 Computer Vision 奋斗的学术青年发放参加会议的路费。一举四得,何乐不为,呵呵。


当然了,涉及到钱的问题,自然要经历很多微妙的利益博弈——这些事情还是让Chair们去担心好了。这里,我们还是继续“奇文共欣赏”吧。文章的算法很简单(前提是你对Machine Learning或者Computer Vision有一点了解),把8页的pdf文档并排成一张长的image,然后就在上面抽feature。做自然语言处理的朋友们请不要激动,这是 Vision的paper,自然用的是Vision圈子自己的方法。好了,抽什么feature呢?主要是HOG(Histogram of Gradients),这是一种纯粹用于描述视觉观感的feature。显然,大段的文本,曲线图,图像,表格,数学公式,它们的feature应该是不太一样的。然后作者用AdaBoost做feature selection训练得到一个分类器:纯粹根据paper的视觉观感来判断paper的好坏
说到训练分类器,自然需要一个训练集。这篇文章的作者收集了CVPR 2008, ICCV 2009和CVPR 2009的全部1196篇paper构成正样本。那么负样本从何而来呢?被拒的paper显然作者是拿不到的。于是他很聪明的利用了一个众所周知但是大家 却不会公开明言的事实:workshop接纳的很多是在主要会议被拒收的paper。这样,很不幸的,workshop上发表的文章被用作负样本。在 Workshop上发表了论文的同志们不要打我——我只是讲述一篇别人的文章,这个主意不是我出的。
最有趣的部分要数实验结果了。从ROC曲线来看,结果其实还是不错的——以拒绝15%的正样本为代价,可以滤除一半的负样本。作者对于正负样本的特征做了 一些总结,也许对于大家以后投paper还是有点指导意义呢。。。


正样本的“视觉”特点:
1. 里面有几段公式,看上去文章显得似乎很专业,也显得作者似乎数学不错;
2. 实验部分里面多少要有几个曲线图,即使那几个曲线图说明不了什么。但是,只要有几个曲线图在那里,起码表示我做的是“科学实验”;
3. 最好在文章开头或者最后一页排列一堆图像。其实,我也注意到很多作者喜欢排列很多dataset里面的图像到paper上——即使那是一个 publically available的standard dataset——我不知道这样做的意义何在——除了审美效果。
4. 最好写满8页,代表分量足够。


负样本的特点:
1. 不够页数。在submission阶段,写不满6页的文章被录用的机会很小。虽然最后很多本来8页的文章还是能很神奇地被压缩到6页,如果作者想省掉 200美元的附加页费。题外话,我也一直不明白为什么多一页要多交100美元注册费。
2. 有很大的数字表,就是m行n列,排满数字那种。这篇文章表明,排列了很多曲线图和柱状图的文章比排列了很多数字表的文章有更大概率被接收。
3. 没有漂亮插图。

这篇文章的结果,我也做一些补充评论。
1. CVPR和ICCV的录用结果,对于文章的视觉观感,有着显著的统计相关。从我自己做Reviewer的经验,以及和其它reviewer的交谈来说,这个确实在一定程度上影响了reviewer的第一印象,甚至是评价基调。一篇文章在first glance给人以专业和有内涵的感觉,会有利于它在reviewer心中树立良好印象。这与学术无关,但是,很不幸,却是一个普遍存在的事实。
对于NIPS这种理论取向的会议,虽然不需要那么多漂亮的图表,但是,文章要“长得”像这些会议的文章。让人觉得写文章的是一个有经验的研究者,而不是一个打酱油的。
2. Workshop的文章和CVPR/ICCV主会似乎存在明显差距,以至于一个如此简单的分类器都能够在区分它们的任务中取得不俗的成绩。另外,作者使用 workshop paper作为负样本的做法虽然是个人选择,但是,起码在一定程度上反映了这个community对于workshop的态度。
3. 近年来CV paper的投稿量的高速增长,已经严重影响了review的质量。一方面,会议不得不邀请许多没有很多经验的学生参与到review的过程,即使文章是 发到senior researcher的手中,最终还是会被传递到他的某个刚入行的学生那里作为学习reviewing的“牺牲品”。我甚至听说过有reviewer为了 应付due date,把文章交给秘书或者亲戚来审,其结果可想而知了。另外,reviewer也没有足够的时间来仔细的审读paper。很多情况下,读完 abstract和intro,大概翻翻实验结果以及文章的插图,已经基本形成对文章的定性。如果reviewer喜欢这篇paper,它会根据作者的 claim对文章表示赞赏;如果不喜欢这篇文章,就会找一些似是而非的理由把文章拒掉。
当然了,最后我们还有rebuttal,然后由AC meeting来确定文章的生死。Area Chair大多是成名学者,个人的学术水平还是由一定保证的。但是,他们非常繁忙,AC meeting虽然目的是给每篇文章一个decision,但是在一些AC的心目里,这主要是一个旅游和social的机会。大部分的final decision就是根据review结果照本宣科(一个不成文的规矩是review rating的中位数是2作为录取划线标准)。另外,AC大概会看看abstract和rebuttal,然后酌情裁量。

好文章也是要色香味俱全的!——CVPR2010最有趣文章相关推荐

  1. 文章收录技巧(怎么提升网站伪原创文章的收录)

    最近很多站长都被一个问题所困扰,那就是收录问题,我们都知道网站收录一直是SEO优化考核的重要标准之一,所以这个问题对我们的影响非常大.很大部分站长做网站收录都是用文章来做的,所以解决收录问题就是要提升 ...

  2. java 黑马头条 day4 自媒体文章发布 自媒体文章列表查询 频道列表展示 自媒体文章-发布、修改、保存草稿 自媒体文章-根据id查询 自媒体文章-删除

    1 自媒体文章列表查询 1.1 需求分析 1.2 表结构和实体类 wm_news 自媒体文章表 需求: 如果有文章标题,按照文章标题模糊查询 如果有频道信息,按照频道ID查询 如果有文章状态,按照状态 ...

  3. 织梦文章摘要php文件,织梦dedecms自动采集文章摘要教程

    织梦dedecms自动采集文章摘要教程 . 1在采集规则模型里添加1个字段 description 描述成文章摘要 递属表:dede4_archives 2 建立的新节点就多了一个文章摘要,匹配区域和 ...

  4. 如何1分钟批量导出一个微信公众号所有文章到word和pdf + 快捷搜索微信所有文章

    微信的公众平台是一个非常非常庞大的文章素材库,各个行业各种类型的文章都能在微信公众号里面找到,不管对于自媒体写手来说,还是对于普通用户,这无疑是我们一个好的文章素材平台. 现在微信APP上面可以直接搜 ...

  5. 使用计算机写文章属于什么方面的应用,用计算机写文章.doc

    第三册 用计算机写文章 教学目标 通过本册书的学习使学生掌握用计算机处理文字信息的基本方法,学会通过文字编辑.版面设置.插入图片和艺术字.绘制图形以及制作文字表格等方式增强文档的表现力,制作出图文并茂 ...

  6. 微信文章支持html,妙用书签,将微信文章装进 Drafts

    YPE html> 编者注:本文涉及到 Bookmarklet 相关知识,如果你对该工具不熟悉,可以通过以下文章有所了解: 对于许多人来说,微信公众号是获取信息的重要来源.但是在微信封闭的环境里 ...

  7. 智能AI文章原创工具推荐,5个AI原创文章生成器盘点

    智能AI文章原创工具推荐,别再傻傻改写伪原创!这些平台不仅可以提高创作者的产能,还可以让创作内容更加精准高效.下面就为大家推荐五款不可错过的AI人工智能原创文章写作平台. 智能AI文章原创工具: 第1 ...

  8. 如何快速删除公众号发布的文章?教你一键批量删除公众号文章【图文教程】

    如何快速删除公众号发布的文章?教你一键批量删除公众号文章[图文教程] https://www.hechangquan.com/how/635.html

  9. python爬取文章保存为txt_爬取博主所有文章并保存到本地(.txt版)--python3.6

    闲话: 一位前辈告诉我大学期间要好好维护自己的博客,在博客园发布很好,但是自己最好也保留一个备份. 正好最近在学习python,刚刚从py2转到py3,还有点不是很习惯,正想着多练习,于是萌生了这个想 ...

最新文章

  1. 为了给你们讲清楚数据库中间件有哪些,我也是拼了!
  2. MySQL的字符编码体系(一)——数据存储编码
  3. mysql函数及解析,Mysql研究之MySQL常用内置函数完全解析
  4. 一张图搞清楚Java异常机制
  5. java常见面试题——java常见笔试题
  6. Oracle之外键(Foreign Key)使用方法具体解释(二)- 级联删除(DELETE CASCADE)
  7. Python_将conda里的环境导入到pychram中
  8. jdk动态代理异常处理分析,UndeclaredThrowableException
  9. 山西毕业主题研学夏令营
  10. 手把手教你Android来去电通话自动录音的方法
  11. Visual Studio开发环境介绍 及控件属性、事件
  12. 【周刊】“熊孩子”乱敲键盘攻破 Linux 桌面;500 个值得学习的 AI 开源项目;Rust 升级成为微软一级项目...
  13. 使用JMeter 录制脚本
  14. github上下载的源码 如何使用 ?
  15. python中finally是什么意思_什么是pythontry-finally语句?它能起到什么样的作用?
  16. Power BI for Office 365(六)Power Map简介
  17. Autodesk(欧特克)公司的主要产品介绍
  18. (二)S7Comm协议分析
  19. C语言实验——时间间隔
  20. 暗影精灵3安装无线网卡驱动(ubuntu16.04)

热门文章

  1. Visual Studio Code:Web前端——登录、注册界面、个人相册
  2. 对 Viper RGB 驱动多个缓冲区溢出漏洞的分析
  3. android launcher目录,【 Android 10 系统启动 】系列 -- Launcher(应用门户)
  4. 苹果官方iCloud中的照片如何迁移到Google Photo教程来了
  5. 如何使用m3u8格式下载快手直播回放的视频?自动转换MP4
  6. java基础训练_实验1Java语言程序设计基础训练.doc
  7. 基于LabVIEW的电阻合格率检测装置仿真设计
  8. 安装/重装Win10系统
  9. 华为认证——HCIA-IoT(V2.0)——物联网工程师-模拟试卷(答案)
  10. Concepts:Stateful Stream Processing