本文转载自机器之心。

近日,支付宝天筭安全实验室在 CVPR FGVC(细粒度视觉分类)workshop 举办的植物病理学挑战赛(Plant Pathology Challenge)中夺冠。本文介绍了冠军队伍及其解决方案。

CVPR(国际计算机视觉与模式识别会议)是由 IEEE 主办的一年一度的世界顶级计算机视觉学术性会议。大会包含多个 workshop,以及对应的许多计算机视觉算法竞赛。

其中 FGVC(细粒度视觉分类)workshop 也举办了多项竞赛,如 Plant Pathology Challenge。该竞赛的任务是:根据苹果树叶子图片区分不同种类的疾病,提高疾病分类的准确率,从而减少化学药品的滥用,及其导致的耐药病原体菌株出现的问题。

其带来的效果是显性地减少种植成本投入、错误疾病诊断带来的经济损失,以及不必要的环境污染。

本次竞赛共有 1317 支队伍参加,支付宝天筭安全实验室获得冠军,并与其他队伍拉开较大差距。

本文将为大家介绍此次竞赛冠军团队的解决方案。

01

Plant Pathology 竞赛简介

赛题数据集

本次竞赛数据集包含 1821 张训练图像和 1821 张测试图像,每张图像有四种可能的标签(健康、锈病、痂病、同时拥有两种疾病),这四种类型的比例为 6:6:6:1,存在数据不平衡问题,且数据集中有一部分不准确标签。

因此如何解决数据量少和标签不准确问题,对所有参赛团队都是个挑战。

评价指标

赛题采用 mean column-wise ROC AUC 作为评价指标来衡量模型的性能,该指标的具体计算方式为各类标签 ROC AUC 值的平均。

02

冠军解决方案    

如前所述,该竞赛数据集存在数据量少以及标签不准确的问题。为此,支付宝天筭安全团队采用了数据增强和知识蒸馏技术。

数据增强

由于竞赛数据集相对较小,直接使用原始数据进行训练会导致模型存在过拟合的风险。为了更好地增加模型鲁棒性,天筭安全团队对数据集进行了如下一系列数据增强操作。

1. 随机光照增强

2. 随机对比度增强

3. 上下翻转增强

4. 左右翻转增强

5. 随机旋转缩放增强

此外,该团队还使用了一些高斯模糊等肉眼不容易区分的增强操作,这些操作极大地丰富了训练数据集,让模型尽可能地学习更多的特征,以增强其泛化程度。

from albumentations import (Compose,Resize,OneOf,RandomBrightness,RandomContrast,MotionBlur,MedianBlur,GaussianBlur,VerticalFlip,HorizontalFlip,ShiftScaleRotate,Normalize,
)train_transform = Compose([Resize(height=image_size[0], width=image_size[1]),OneOf([RandomBrightness(limit=0.1, p=1), RandomContrast(limit=0.1, p=1)]),OneOf([MotionBlur(blur_limit=3),MedianBlur(blur_limit=3), GaussianBlur(blur_limit=3),], p=0.5,),VerticalFlip(p=0.5),HorizontalFlip(p=0.5),ShiftScaleRotate(shift_limit=0.2,scale_limit=0.2,rotate_limit=20,interpolation=cv2.INTER_LINEAR,border_mode=cv2.BORDER_REFLECT_101,p=1,),Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225), max_pixel_value=255.0, p=1.0),]
)

模型选型

该团队采用 seresnext50 作为训练的模型框架,其中前缀 se 表示 squeeze and excitation 过程。该过程的原理是:通过控制 scale 的大小,把重要的特征增强、不重要的特征减弱,原理和注意力机制相同。其目的是让提取的特征指向性更强,从而更好地对 FGVC 任务中的精细特征做识别。

训练策略

该团队采用 adam + cycle learning rate 的学习策略进行模型训练。

这种学习策略的优势是:通常不会产生太多过拟合,也不需要仔细调参。

误差分析

误差分析是提升深度学习模型性能中十分重要的一环。当模型训练完成后,如何对模型性能进行改进才是提分的关键点。

该团队通过热力图的方式将模型对图片关键识别部位提取出来,这样就能很清晰地了解模型看到了哪些部位才将图片识别为对应的类别。把识别错误的图片进行分析后,就可以知道模型训练的整体环节中有哪些可以被改进。

自蒸馏

由于有些疾病较难区分,导致标签存在一些不准确的情况,这给训练增加了一定的难度,模型很可能被不准确的标签误导。

为了应对这种情况,支付宝团队采用了自蒸馏的方式来解决该问题:训练五折模型,然后将五折的验证集组成 out-of-fold 文件,最后将 out-of-fold 的结果和 ground truth label 按 3:7 混合作为训练新模型的标签。简单来说,就是给每个软化前的标签赋予一定的概率,从而降低模型训练的难度 。

模型预测

在最后提交成绩的阶段,该团队采用了 TTA(Test Time Augmentation)策略,对预测样本都执行了一定的数据增强,然后对这些增强的预测值做平均加权,这也为模型结果起到了一定的提升作用。

03

小结

细粒度图像分类是计算机视觉领域中极具挑战的方向,但这一方向在实际应用中对于提升交易风险辨识度有很大的帮助。支付宝天筭安全团队在此次竞赛中所使用的原创模型,为用户交易纠纷举证、网站内容风险识别等场景的技术优化带来了新思路。

冠军团队介绍

该技术研究团队来自支付宝天筭安全实验室,隶属于支付宝安全实验室。研究方向重点围绕智能风控和反欺诈技术,探索安全领域的机器学习等前沿问题。此次该团队不仅在 Kaggle 挑战赛登顶,在全球仅 180 位 Kaggle Grandmaster 中,天筭安全实验室占了 4 位。该团队还在 2019 年 AI 数据挖掘领域的「世界杯」KDD 比赛中夺冠,在 1600 余支参赛队伍中,碾压了包括谷歌、微软、Facebook 在内的全球强队。

安全科技是支付宝的重要科技实力之一,该实验室是支付宝「你敢付我敢赔」承诺的重要技术力量。支付宝自研智能风控引擎 AlphaRisk 拥有近 500 条量化策略、100 个风险模型,对用户交易支付进行 7*24 小时的实时风险检测扫描及保护,能在数亿交易中精准识别用户的账户异常行为,是全球最先进的风控系统之一。在其保护下,支付宝交易资损率不到 0.00001%,远低于行业平均水平,交易风险率低至千万分之 0.64,领先国际同行 PayPal 2.3 万倍。

END

备注:细粒度

图像分类&细粒度分类交流群

关注最新前沿分类与细粒度分类技术,扫码拉你入群。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

CVPR 2020 细粒度分类挑战赛冠军方案:数据增强+知识蒸馏,效果大幅提升相关推荐

  1. 开源:CVPR 2020视觉定位挑战赛冠军方案

    今天介绍今年视觉定位挑战赛的冠军方案.接下来会分别介绍什么是视觉定位挑战赛,比赛的难点是什么,冠军方案以及后续展望. 1. 关于视觉定位挑战赛 视觉定位是一个估计6自由度(DoF)相机姿态的问题,从中 ...

  2. 弱监督学习下商品识别:CVPR 2018细粒度识别挑战赛获胜方案简介

    弱监督学习下商品识别:CVPR 2018细粒度识别挑战赛获胜方案简介 细粒度视觉分类(FGCV,Fine-Grained Visual Categorization)即识别细分类别的任务,一般它需要同 ...

  3. 【基于深度学习的细粒度分类笔记2】弱监督学习下商品识别:CVPR 2018细粒度识别挑战赛获胜方案简介

    细粒度视觉分类(FGCV,Fine-Grained Visual Categorization)即识别细分类别的任务,一般它需要同时使用全局图像信息与局部特征信息精确识别图像子类别.细粒度分类是计算机 ...

  4. 大比分领先!ACCV 2022 国际细粒度图像分析挑战赛冠军方案

    写在前面 在刚刚结束的 ACCV 2022 国际细粒度图像分析挑战赛中,我们团队在 133 支参赛队伍中脱颖而出,在 Leadboard-B 上以 2.5 的绝对优势取得冠军. 比赛成绩截图 在比赛过 ...

  5. CVPR 2019 CLIC 图像压缩挑战赛冠军方案解读

    点击我爱计算机视觉标星,更快获取CVML新技术 导读:图像视频压缩是传统多媒体技术的核心,也是一项牵动整个多媒体信息产业的基础技术.深度学习在该领域的成功运用,已经引起了不少IT巨头的关注.图鸭科技是 ...

  6. 在数据增强、蒸馏剪枝下ERNIE3.0分类模型性能提升

    在数据增强.蒸馏剪枝下ERNIE3.0模型性能提升 项目链接: https://aistudio.baidu.com/aistudio/projectdetail/4436131?contributi ...

  7. 借鸡生蛋,无需数据的知识蒸馏

    点击我爱计算机视觉标星,更快获取CVML新技术 本文简要介绍ICCV 2019论文"Data-Free Learning of Student Networks"的主要工作.该论文 ...

  8. 【CVPR 2021】基于解耦特征的目标检测知识蒸馏:Distilling Object Detectors via Decoupled Features

    [CVPR 2021]基于解耦特征的目标检测知识蒸馏:Distilling Object Detectors via Decoupled Features 论文地址: 主要问题: 主要思路: 具体实现 ...

  9. CVPR 2020 夜间目标检测挑战赛冠军方案解读

    ↑ 点击蓝字 关注视学算法 来源丨DeepBlue深兰科技 编辑丨极市平台 在 CVPR 2020 Workshop 举办的 NightOwls Detection Challenge 中,来自国内团 ...

最新文章

  1. 华为云+AI,视频分析全面进入智能时代
  2. 一看就会的OSPF路由协议综合实验
  3. 学习MSCKF笔记——后端、状态预测、状态扩增、状态更新
  4. 年度数据与月度数据转化_山东工会新媒体传播力指数2020年12月数据、年度数据出炉...
  5. 阿拉伯数字转为罗马数字
  6. windows和linux下的文件路径表示
  7. DIY一个低成本多功能点阵时钟!
  8. 复习:线性表——双链表、循环链表
  9. jenkins 管理员账号丢失
  10. 精读CSS权威指南第四版(3)
  11. Visio图片导出不清晰
  12. Windows XP中的通用即插即用
  13. lda数学八卦_[ LDA主题模型应用和改进组 ] 招募成员
  14. python中numpy.minimum函数
  15. TSP问题(推销员问题)
  16. IETester的使用(针对VB.NET视频)
  17. Spring实训 个人博客二 详情页
  18. 【点云处理技术之PCL】range image——提取深度图像的边界并可视化
  19. tableau:表计算
  20. 201901建站运维笔记 22A

热门文章

  1. 将一个列表的奇数列赋值到另外一个列表
  2. 156 - Ananagrams
  3. 东芝半导体-三极管和功率管-元器件后缀说明解释-L3F
  4. ppt计算机控制系统实例,第部分计算机控制系统的应用实例.ppt
  5. java kotlin lateinit_15. Kotlin 究竟该不该用 lateinit?
  6. linux io100的原因_Unix与Linux的区别与联系
  7. 两用物项许可证办理流程_办理医疗器械经营许可证流程
  8. python基本图形绘制第二周答案_荐测验2: Python基本图形绘制 (第2周)
  9. 【生活资讯】5款好用的生活学习类APP
  10. 【windows】windows操作系统安全加固