《Edge Boxes: Locating Object Proposals from Edges》读后感
《Edge Boxes: Locating Object Proposals from Edges》是ECCV2014的一篇关于目标检测的一篇文章,作者是来自于微软研究院的Piotr等人,属于大中牛范畴。本文并没有涉及到“机器学习”,其采用的是纯图像的方法,这点让我大感意外,因为很多提取proposals的文献,例如BING等,都是基于学习理论的方法。此外,本文的许多内容,甚至数学公式,都是基于作者的直觉直接建立,可以说,牛的一腿。。。。。
一篇学术paper,一般由研究目标,研究方法和实验结论组成,以下部分分别从这几方面进行介绍。
本文的研究目的:为了加速现有目标检测算法,提出了一种能够以较高精度确定proposal的新方法。其中,proposal还没有一个确定的中文翻译,一般被称作“目标大概可能的位置”。这个概念非常重要,我们大家想想,当我们看到一幅图像的时候,我们绝对不会像传统检测算法那样,从图像左上角开始扫描图像,而是一眼“纵观全局”,直接发现目标“大概的位置”,然后进一步细看,proposal正是由人类这一特质启发,而提出的。显而易见,这样的方式,速度会很快,但是,如果proposal提取的不准,那么就悲催了。
本文的研究方法:利用边缘信息(Edge),确定框框内的轮廓个数和与框框边缘重叠的轮廓个数(这点很重要,如果我能够清楚的知道一个框框内完全包含的轮廓个数,那么目标有很大可能性,就在这个框中。这也是作者的一大直觉,牛吧?),并基于此对框框进行评分,进一步根据得分的高低顺序确定proposal信息(由大小,长宽比,位置构成)。而后续工作就是在proposal内部运行相关检测算法。
下面试着详细介绍本文算法流程。
图 1. 算法思想图示
图1来自于文献,箭头是我自己加的,我觉得这幅图像,可以很好的说明该文的算法思想。
首先,第一行是原图,第二行是基于文献《Structured Forests for Fast Edge Detection》所提出的结构化边缘检测算法,得到的边缘图像,这时的边缘图像显得很紧密,需要用NMS进一步处理得到一个相对稀疏的边缘图像。
其次,第三行中,本来灰色的边缘变成了五颜六色的边缘,其实这些五颜六色的边缘是基于某种策略,将边缘点集合起来得到的N多个小段,论文中,叫做edge group。所采用的的策略是:将近乎在一条直线上的边缘点,集中起来形成一个edge group,具体的做法是,不停地寻找8连通的边缘点,直到两两边缘点之间的方向角度差值的和大于pi/2,这样便得到了N多个edge group。
再其次,得到N个edge group之后,还要进一步计算两两edge group之间的相似度,相似度的公式很简单,如下:
这样变使得,如果两个edge group越在一条直线上,上述公式计算得到的相似度就越高,反之亦然。作者之所以引入edge group概念,是为了确定轮廓个数做准备,因为一个轮廓中的所有edge group当然是最相似的,这点可以在纸上画画,十分明显。
最后,让我们看看作者是怎么根据edge group来确定轮廓的。作者的做法在我看起来很奇葩,他给每一个edge group一个权值,换句话说,打个分数,然后把权值均为1的edge group归为框框内轮廓上的一部分,把权值为0的edge group归为框框外或者与框框边界重叠的轮廓的一部分。采用了一个数学公式达到了上述目的,如下:
其中,T是指从框框的边缘开始到达si的edge group序列集合,当然,会有很多个T,看到没,它的目标就是从这么多的路径T中,寻找相似度最高的路径,这就是传说中的轮廓。值得注意的是,在某路径T上,一旦出现相似度为0(这很容易出现)的情况,这条路径T就废弃了,所以想找到那个合适的T,真的很快。。。。
最最后,作者给出了框框的评分(具体公式没什么好解释的,就不给出了)。然后就得到了倒数第二行的效果,效果还是很不错的。
综上,给出自己画的算法流程图,如下所示:
本文的实验效果:作者和几个当前流行的proposal提取算法进行了比较,得到了比较不错的效果,主要是基于经典的PASCAL VOC数据集,但是不得不说,他把BING弄得太差了。另外,这个算法存在一个较大的缺陷。
本文算法的不足:一句话,通过demo测试,发现,其评分较高的proposals均为近乎整幅图像,比如说,图像中有8个人,那么该算法评分最高的proposal肯定是同时包含了这8个人的,这一点不足,使得这个算法的含金量大大缩水,因为,在实际应用中,我想要的效果往往是,最高评分的几个proposal最好是单独的人,而不是8个人一起。
至于原因,不难理解,上面已经说过了,本文不是基于“学习”的算法,没有训练过程,不可能像BING那样,训练了单独人体,那么最高评分的proposal肯定就是单独的人体,训练了汽车,那么最高评分的proposal肯定就是单独的汽车等等。。。。
关于读后感:其实这篇文章,我有很多细节还没有说出来,一方面时间不够,另一方面,自己的文采不行,说多了就会显得啰嗦。所以,还请各位读者不吝批评赐教,大家一起学习,共同进步!!!!
(转载请注明:http://blog.csdn.net/wsj998689aa/article/details/39476551)
《Edge Boxes: Locating Object Proposals from Edges》读后感相关推荐
- GC13:XO独占游戏《神鬼寓言传奇》公布
作者: 来源: www.bts668.com 微软日前公布了<神鬼寓言传奇>(Fable Legends),该游戏是此系列作品的新作,将作为Xbox One游戏出现. 这款由狮子头工作室开 ...
- Facebook 重金挖不到,ASP.NET 之父,微软大神“红衣教主”传奇
作者 | 伍杏玲 出品 | CSDN (ID:CSDNnews) 2018 年底,微软"王者归来",时隔 16 年市值重返全球第一.人们纷纷用"力挽狂澜"&qu ...
- 乔布斯去世衍生多种周边产品(支持乔布斯请顶)
各种乔布斯肖像 乔布斯公仔 乔布斯立体纸人 不管你是不是狂热的苹果粉丝,是不是拥有n多的苹果产品,苹果帮主乔布斯都应该值得我们纪念. "为什么说乔布斯改变了世界?没有 iPhone,就不会有 ...
- 一战封神!“中国飞人”苏炳添跑出9秒83到底有多牛?
公众号后台回复"图书",了解更多号主新书内容作者:CDA数据分析师来源:CDA数据分析师 [导读] 在刚刚结束的东京奥运会百米飞人大战上,中国选手苏炳添在半决赛跑出9秒83,刷新了 ...
- 乔布斯导演的最后一幕
连作者也说,他仅仅是这本书的写作者,真正的作者是乔布斯."中信出版社总编辑潘岳近日分享了<史蒂夫·乔布斯传>幕后的故事.这本传记预定期已达100万册,预估最终销量将达到500万册 ...
- 30本pdf完整版的经典Linux学习和开发教程和资料下载 android arm java 资料大全
史上最牛的Linux内核学习方法论 点击下载 我的arm_linux移植笔记 点击下载 S3C2440完全开发流程 点击下载 Linux系统命令及其使用详解完整版 点击下载 Linux ...
- 30本pdf完整版的经典Linux学习和开发教程和资料下载 android arm java 资料大全...
史上最牛的Linux内核学习方法论 点击下载 我的arm_linux移植笔记 点击下载 S3C2440完全开发流程 点击下载 Linux系统命令及其使用详解完整版 点击下载 Linux主要shell命 ...
- 养成励志的习惯,一生励志——文指星终极励志
语言的突破全集 卡耐基 --励志经典 点击下载 人性的优点--卡耐基名著--励志经典 点击下载 人生格言精华总集 点击下载 人生定律与原则--励志经典 点击下载 厚黑学 ...
- 养成励志的习惯,一生励志
语言的突破全集 卡耐基 --励志经典 点击下载 人性的优点--卡耐基名著--励志经典 点击下载 人生格言精华总集 点击下载 人生定律与原则--励志经典 点击下载 厚黑学 ...
- 【转】乔布斯经典语录
2011年8月25日消息,乔布斯辞去了苹果公司CEO的职务.10月6日,传来了他去世的消息.在此缅怀乔帮主的同时,与大家分享乔布斯在世时的经典语录.(来自于<乔布斯传>--神一样的传奇的附 ...
最新文章
- 【译】SQL Server误区30日谈-Day1-正在运行的事务在服务器故障转移后继续执行
- Oracle数据库密码过期重置
- 第五十九天 how can I 坚持 --------补昨天5月31号
- uva140 Bandwidth
- 我的Linux系统入坑之路!!!!
- 诺基亚手机新品发布定档 6 月 11 日!Nokia C20 Plus 即将到来
- 不是单组分组函数_面向对象编程是否已淘汰?函数式编程的枪口瞄错了对象
- 世界杯开赛看球吃麻辣小龙虾
- mysql 正则表达式 标点符号_正则表达式-匹配标点符号
- 移动开发采用什么平台好?
- linux系统下,python 调用终端禁用鼠标键盘
- 图片文字介绍滑动效果代码介绍
- 有了手机远程控制手机的软件,在家突然收到工作任务也不怕
- 目前大数据分析的发展状况是怎样
- 极大似然估计原理解析
- windows下查看python下安装的opencv版本
- 解决chrome下textarea控件滚动条不好使情况
- [BZOJ2539][CTSC2000][KM]丘比特的烦恼
- ACWing算法提高课 友好城市
- c++简易病毒(附代码)
热门文章
- c语言体积的单词,C语言程序:求常用圆形体的体积
- 系统分析师学习笔记(十九)
- 仙剑三功略(结局,冶炼,魔剑养成)
- mysql 报错 1054 - Unknown column ‘box_inf.box_number‘ in ‘where clause‘
- 遇到bug我们如何分析定位?
- 你所不知道的,华为项目管理之道!
- 菜刀连接图片一句话木马
- flash源文件小,导出后变大的问题
- 【MATLAB】基本绘图 ( plot 函数绘制多个图形 | legend 函数标注图形 | 图形修饰 )
- HTML5中的data-id与id