点击我爱计算机视觉标星,更快获取CVML新技术


本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载

机器之心专栏

作者:Earhian (乔健), YourVenn (王乙衡)

不久之前,Kaggle座头鲸识别挑战赛结束,Earhian(乔健) YourVenn(王乙衡)、Tom 57、A.L.四位选手组成的团队夺得了第一名。本文主要介绍了冠军团队的解决方案。

图注:Kaggle座头鲸识别挑战赛 leaderboard

为了帮助鲸鱼保护,科学家们使用照片监视系统 (Photo Surveillance Systems) 来监视海洋活动。他们使用鲸鱼尾巴这一独一无二的标记来在连续的图像中识别鲸鱼,并对它们的活动进行细致地分析。在过去的四十年里,大部分工作基于科学家们的手工作业,这也使得大量的数据未被充分利用。

在这一竞赛中,我们是要构建算法来识别图像中的鲸鱼个体,而难点在于训练样本的严重不均衡以及存在近三分之一的无标注(new whale)数据。

1.概述

这是一个few shot learning和细粒度分类的问题。比赛初期,我们使用了softmax + 固定阈值的方法,仅对有标注的样本进行训练并通过阈值插入new whale的预测,但是没有取得很好的效果(MAP@5 < 0.9)。为了将new whale加入网络中训练,我们针对每一类鲸鱼进行二分类(如下图所示),并且使用triplet loss来做特征度量。通过大量实验,SE-resneXt154被作为最优的backbone,取得了单模型0.96的baseline,在追加了一系列tricks之后,单fold模型达到了0.969 (private LB: 0.97+ 榜上第三名)。最后,借助4 fold cross validation,以及类别平衡后处理,得到了最终public & private两榜第一名的0.973。

2.网络输入

我们使用RGB + Mask的四信道输入(Mask来源于我们训练的分割模型,通过论坛中开源的450张标注数据训练即取得了很好的效果: MAP for local cross validation: 0.96+ )。

3.鲸鱼水平翻转,并赋予新的id(+0.006~0.007)

论坛中,选手Heng CherKeng 提出“根据鲸鱼尾部不对称的特性(见下图),将其翻转可以得到新的类别”这一假设。这个假设没有得到很多的赞同票,但在我们的实验中取得了非常好的效果。赛后我们也获悉,第三名Pudae使用了同样的技巧亦提高了分数。

4. 伪标签(+0.002)

在模型得到public 0.96+的分数时,我们做了一次伪标签:将预测置信度为1的测试样本加入到训练集中。

5. 类间平衡(+0.001~0.002)

我们发现随着模型性能的提升,预测结果中top1对应的不同类别数也在增加(见下图)。所以我们用了以下策略:

假设五个预测为:class_1 class_2 class_3 class_4 class_5

如果1) class_1的置信度减去class_2的置信度 < 0.3, 2) 并且class_2没在top1中出现过,3) 而class_1在top2中多次出现,则交换class_1与class_2的位置。

最后,感谢队友们的努力:@Yiheng Wang, @Peiyuan Liao and @Thomas Tilli。感谢@ Heng CherKeng,祝贺3位新的Grandmaster!@SeuTao, @David, @Weimin Wang。

我们已经将方案代码进行了整理并开源:

  • https://github.com/earhian/Humpback-Whale-Identification-1st-

英文版本可从Kaggle论坛查看:

  • https://www.kaggle.com/c/humpback-whale-identification/discussion/82366

加入专业讨论群

关注计算机视觉与机器学习相关技术竞赛,欢迎加入52CV-竞赛交流群,扫码添加CV君拉你入群:

(请务必注明:竞赛)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:702781905。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

干货!Kaggle座头鲸识别落下帷幕,冠军方案解读相关推荐

  1. Kaggle座头鲸识别赛,TOP10团队的解决方案分享

    大数据文摘出品 编译:籍缓.陆震 Kaggle的座头鲸识别挑战比赛在最近落下帷幕,全球共2131个团队参加了比赛. 这是近期Kaggle上颇受欢迎的一次竞赛,常用的分类方法无法处理大量的无标注数据,只 ...

  2. csgo天津服务器维护怎么办,CSGO华北赛区在天津落下帷幕

    原标题:CSGO华北赛区在天津落下帷幕 11月19日,CSGO"英特尔杯"中国城市精英对抗赛华北赛区总决赛在天津世纪都会购物中心落下帷幕,除东道主外,还有来自北京.石家庄和太原市的 ...

  3. 2014 ChinaJoy落下帷幕 十大年度热门事件盘点

    2014ChinaJoy终于落下帷幕,期间有关明星.showgirl的话题再次超越游戏本身成功上位,如果你不相信,回头翻看各大媒体报端.头条上的新闻就知道了.当然,2014ChinaJoy较往年相比, ...

  4. 2020全球C++及系统软件技术大会成功落下帷幕

    此文转载自:https://blog.csdn.net/lianshaohua/article/details/110850471 由Boolan 主办的2020全球C++及系统软件技术大会成功在深圳 ...

  5. 2018第九届环中国国际公路自行车赛落下帷幕

    中国安顺--(美国商业资讯)--历时16天的2018环中国国际公路自行车赛于9月23日在贵州省安顺市落下帷幕.来自意大利威廉洲际职业队(Wilier Triestina - Selle Italia) ...

  6. 再领高校前沿科技风潮,微众银行第三届金融科技大赛落下帷幕

    11月8日, 2021年微众银行第三届金融科技高校技术大赛(以下简称"大赛")在深圳成功落下帷幕. 本届大赛历时80天,共有220余支队伍,总计800余名海内外高校学生参与.在人工 ...

  7. 北京奥运会闭幕式落下帷幕

    北京时间8月24日,在进行了16天的激烈争夺之后,本届北京奥运会在今天落下帷幕.今晚8时,奥运会闭幕式在"鸟巢"举行.在<远方的朋友请你留下来>的歌声中,北京奥运会的闭 ...

  8. CES 2021落下帷幕 未来3年展会时间已公布

    1月15日消息,据国外媒体报道,2021年度的国际消费类电子产品展览会(CES 2021),已经落下帷幕,未来3年展会的时间,也已经公布. 2021年度的国际消费类电子产品展览会,原计划1月6日至9日 ...

  9. 双11落下帷幕,天猫、京东战报再创记录,拼多多“失声”...

    双11正式落下帷幕,一年一次电商促销大战告一段落,我们许多人又参与了一年的好几个千亿大项目.几大主流电商平台实时公布了他们今年的战报,下面就一起来看看吧. 天猫双11战绩 第11个天猫双11经过24小 ...

最新文章

  1. Win7屏幕键盘 在哪 使用
  2. 烂泥:SQL Server 2005数据库备份与恢复
  3. scrapy-splash抓取动态数据例子六
  4. Oracle海量数据优化-02分区在海量数据库中的应用-更新中
  5. root和user切换
  6. Django讲课笔记08:定义商城的数据模型
  7. Unreal3 window下内存管理实现详解
  8. Python爬虫实战:应用宝APP数据信息采集
  9. 剑指offer_两个链表的第一个公共结点
  10. 湖南省公务员考试计算机专业,湖南省2018年普通高等学校对口招生考试计算机应用类专业综合知识试题...
  11. 有关编辑距离计算的一点整理。
  12. im即时通讯源码/uniapp即时通讯im源码附视频安装教程
  13. Linux scipy安装
  14. VBA 字典使用小结:关键字循环
  15. 详解比较好的音视频通话SDK开发包的技术要点
  16. Rxjava +Retrofit 你需要掌握的几个技巧,Retrofit缓存,RxJava封装,统一对有无网络处理,异常处理, 返回结果问题
  17. 《大型网站技术架构》——第一章 大型网站架构演化
  18. Java Swing JButton:按钮组件
  19. 如何使 一个 div 居中显示
  20. CSS-3D酷炫柱状图

热门文章

  1. 679 - Dropping Balls
  2. 中缀表达式到前缀表达式和后缀表达式
  3. python 判断时间是否大于6点_python - 在dataframe中,如何检查时间增量是否大于一分钟?_pandas_酷徒编程知识库...
  4. mysql 指定tcpip连接数_tcp ip连接数据库
  5. echarts 仪表盘 文字位置_方法 | 用notion打造个人仪表盘
  6. 有趣的html代码_千万别惹程序员,否则会在代码注释里,告诉这家公司有多坑...
  7. android选项菜单xml,使用 XML 定义选项菜单
  8. php shell exec 阻塞,php shell_exec()vs exec()
  9. 北京化工大学2018年10月程序设计竞赛部分题解(A,C,E,H)
  10. table中的td内容过长显示为固定长度,多余部分用省略号代替