点击上方“机器学习与生成对抗网络”,关注"星标"

获取有趣、好玩的前沿干货!

转自 创新奇智

近日,创新奇智有关少样本学习(Few-shot Learning)的研究论文《Prototype Rectification for Few-Shot Learning》被全球计算机视觉顶会ECCV 2020接收为Oral论文,入选率仅2%

ECCV全称为European Conference on Computer Vision(欧洲计算机视觉国际会议),与ICCV和CVPR合称为全球计算机视觉三大顶级会议,每两年举办一次。据大会官方介绍,本届会议共收到5025份有效投稿,共接收1361篇,录取率为27%,其中1361篇接收论文里面,有104篇Oral以及161篇 Spotlight,分别占比2%和5%,堪称史上最难ECCV

创新奇智CTO张发恩表示:“当前的深度学习技术对数据具有极大依赖性,如何减小数据依赖,利用较少的数据取得理想的识别效果成为当下亟待突破的技术难点。少样本学习旨在从已有类别的数据中学习先验知识,然后利用极少的标注数据完成对新类别的识别,打破了样本数据量的制约,在传统制造业等样本普遍缺失的领域具有实用价值,有助于推动AI落地。”

创新奇智本次发表的论文指出,少样本学习的瓶颈在于数据稀缺引起的偏差,主要包括类内偏差和跨类偏差,并提出相应方法有针对性地减小两项偏差。该思路经过严格的理论证明其合理性,并通过大量实验证明了方法的有效性,在少样本学习通用的数据集中达到了最优的结果。

以下为论文解读:

(论文初版arXiv地址为:https://arxiv.org/abs/1911.10713。后续Camera Ready版本将于近日更新,补充了更多数据集上的表现。)

1

概述

少样本学习(Few-shot learning)旨在从大量有标注数据的类别中学习到普遍的规律,利用学习到的知识,能够使用少量的有标注数据(如一张或五张)完成对新类别的识别。原型网络是少样本学习中一类非常有效的方法,其针对不同的类别提取出对应的类原型,然后根据样本与类原型之间的距离进行分类。由于新类别的样本数量极少,原型网络所计算出的类原型存在一定的偏差。

本文指出了制约原型网络效果的两个关键因素:类内偏差和跨类偏差,并且提出利用伪标签的方法减小类内偏差,利用特征偏移的方法减小跨类偏差,进一步通过理论分析指出原型网络准确率的理论下界,证明伪标签的方法可以提高理论下界从而提高整体准确率,最后,实验结果表明,本文的方法在miniImageNet和tieredImageNet上达到了最高水平的结果

主要贡献

•  本文指出了原型网络在少样本学习中的两项制约因素:类内偏差(intra-class bias)及跨类偏差(cross-class bias)。

•  本文利用伪标签和特征偏移,进行原型校正和减小偏差,简单有效地提高了少样本分类的表现。

•   本文分析了理论下界与样本数量之间的关系,从而验证了所提方法的合理性,并给出了偏移量的推导过程。

• 本文所提出的方法在通用的少样本数据集miniImageNet和tieredImageNet上达到了最优的结果。

2

方法

2.1  基于余弦相似度的原型网络(CSPN)

本文利用基于余弦相似度的原型网络(Cosine Similarity Based Prototypical Network,CSPN)得到少样本类别(few-shot class)的基础类原型。

首先在基础类别(base class)上训练特征提取器和余弦分类器,余弦分类器定义如下:

其中是特征提取器,W为可学习权重,为温度参数。在模型训练阶段使用如下损失函数:

预训练结束后,使用下式得到few-shot class的基础类原型:

2.2 原型校正中的偏差消除(Bias Diminishing for Prototype Rectification)

在样本较少的情况下,比如K=1或K=5,计算所得基础类原型与理想的类原型之间存在一定偏差,减小偏差可以提高类原型的表征能力,从而提高分类准确率,本文指出如下两种偏差以及对应的减小偏差的方法。

类内偏差(intra-class bias)

即真实类原型(第一项)和使用少量样本计算的类原型(第二项)之间的偏差。真实的类原型往往是不可得的,可得的是利用少量有标注的数据集(support set)计算得到的类原型,为了减小这两项之间的偏差,本文提出利用无标注的数据集(query set)重新计算类原型。首先通过计算query set中的样本与基础类原型之间的余弦相似度获得query sample的伪标签,然后将top-z confident的query sample加入support set中,并根据下式重新计算,得到修正后的类原型

跨类偏差(cross-class bias)

即整个有标注数据集support set和无标注数据集query set之间的偏差。为了修正跨类偏差,本文在无标注数据中加入偏移量, 具体计算方式如下:

2.3 理论推导Theoretical Analysis

本文通过以下理论推导,解释了上述方法的合理性以及该方法是如何提高少样本分类表现的。

理论下界

在原型网络中,假设最终的准确率与类原型和样本间余弦相似度之间呈正相关,即最终优化目标可以表示为:

再结合使用一阶近似、柯西施瓦茨不等式等方法进行推导验证,可以得到模型的理论下界:

可以看出模型最终效果和样本数之间呈正相关,因此可以通过引入无标签样本来提高模型理论下界,即增大 T 可以提高模型表现。

有关偏移量的推导过程详见论文,在这里就不敷述了。

3

实验

3.1实验结果

本文在少样本学习的两个公开数据集 (miniImageNet, tieredImageNet) 上进行了实验,与其他方法相比,本文提出的BD-CSPN在1-shot及5-shot的设置下均达到了最佳效果。

3.2消融实验

本文通过消融实验进一步验证了模型每一部分的有效性。

表中从上到下分别为:不使用原型修正的方法,单独使用跨类偏差修正,单独使用类内偏差修正以及同时使用类内偏差和跨类偏差修正的结果,可以看到减小偏差对最终结果有明显的提升。

本文进一步分析了原型校正中无标注样本的样本数量对于最终结果的影响,如图2(a-b)所示,随着无标注样本的增多最终效果有持续的提升,图2(c)中虚线为通过计算所得到的理论下界,可以看到本文的实验结果和理论相符。

本文采用不同的网络结构作为特征提取器,验证了原型校正的方法在不同网络结构下均有明显提升。

4

总结

本文提出一种简单有效的少样本学习方法,通过减小类内偏差和跨类偏差进行原型校正,从而显著提高少样本分类结果,并且给出理论推导证明本文所提方法可以提高理论下界,最终通过实验表明本方法在通用数据集中达到了最优结果,论文被ECCV 2020 接收为Oral。

本文中提出的算法已经在创新奇智的实际场景中落地应用,可以从海量非结构化数据中根据极少数种子数据(1张至5张)挖掘出所需要的同类数据,可以极大的提升数据收集速度和准确率,降低成本。

创新奇智

创新奇智(AInnovation)成立于2018年3月,是创新工场AI子公司,以“人工智能赋能商业价值”为使命,致力于用最前沿的人工智能技术为企业提供 AI 相关产品及商业解决方案,通过 AI 赋能助力企业客户及合作伙伴提升商业效率和价值,实现数字化转型。

创新奇智以“技术产品”+“行业场景”双轮驱动模式,为制造、零售、金融等行业提供人工智能整体解决方案,已获取中冶赛迪、宗申、格力、宝武钢铁、长安汽车、中铁四局、怡东集团、鸿海科技、玛氏、雀巢、嘉士伯、永辉、水井坊、惠氏、邮储银行、光大银行、人保、太保、泰康等多家行业标杆客户。

公司成立以来快速成长,已完成总金额近10亿元的天使轮、A/A+和B轮融资。创新奇智以北京为核心,先后落地广州、重庆、南京、合肥、成都、西安、青岛、上海等地,设立粤港澳大湾区总部、长三角区域总部,形成全国性布局,还与中冶赛迪合资成立制造业子公司-赛迪奇智,以及金融业子公司-睿云奇智,增强行业影响力。

创新奇智的飞速发展广受市场认可,荣获多项国内外大奖,如:2020 CB Insights AI100、《哈佛商业评论》拉姆·查兰管理实践奖、《Fast Company》中国最佳创新公司50、2019红鲱鱼亚洲百强、2019胡润中国潜力独角兽、IDC Innovator、中国人工智能产业独角兽Top50、2019亚太十大零售分析解决方案供应商、2019科创板潜力新兴企业、全球AI科技创新企业50等。

猜您喜欢:

 戳我,查看GAN的系列专辑~!

CVPR 2020之117篇GAN论文分类汇总清单

2020年6月100篇GAN论文汇总

2020年5月60篇GAN论文汇总

2020年4月70多篇GAN论文

2020年3月90多篇GAN论文

2020年2月50多篇GAN论文

2020年1月GAN论文汇总

2019年12月份GAN论文汇总

超100篇!CVPR 2020最全GAN论文梳理汇总!

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

少样本学习新突破!创新奇智入选ECCV 2020 Oral论文相关推荐

  1. 如何玩转AI时代下的新零售,创新奇智新零售聚智沙龙给你答案...

    在这里,读懂新零售. 在人工智能和数字化驱动的消费市场中,新零售成为兵家必争之地.据市场调研机构Tractica预计,2025年人工智能将为全球零售业带来368亿美元的收益,这一数字在2016年仅为6 ...

  2. 李开复操刀的创新奇智敲钟在即,亏了11个亿的公司为何还能获得国家和市场的双重认可?...

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 曾于2021年6月递表的创新奇智,等待半年后,在港交所的申请材料于当年12月"失效",元旦刚过,还没等2021年全年财报出来, ...

  3. 创新奇智CTO张发恩:AI+to B还是蓝海 将诞生新巨头

    关注网易智能,聚焦AI大事件,读懂下一个大时代! 出品 | 网易智能(公众号 smartman163) 期号 | AI英雄总第102期 作者 | 丁广胜 李开复是全球AI领域最积极的布道者,而创新工场 ...

  4. 创办3年就IPO!创新奇智作价150亿成“AI+制造”第一股,李开复躬身实践:创造硬科技投资新范式...

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI AI+制造第一股创新奇智,正式登陆港交所挂牌上市! 今天上午9时30分开盘后,创新奇智(2121.HK)股价最高达到27.00港元,超过发行价(2 ...

  5. “AI+制造”第一股!李开复躬身实践,创新奇智3年IPO!

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI AI+制造第一股创新奇智,正式登陆港交所挂牌上市! 今天上午9时30分开盘后,创新奇智(2121.HK)股价最高达到27.00港元,超过发行价(2 ...

  6. 悟道·文汇详解:少样本学习等近十个数据集取得第一

    智源导读:预训练模型如今已经成为深度学习研究中的一种主流范式,智源研究院认为「深度学习已经从『大炼模型』步入到『练大模型』的阶段」.基于此种考虑,由智源研究院牵头,汇聚清华.北大.中科院.人大等高校院 ...

  7. Yann LeCun、吴恩达的新年AI预测:强调“少样本学习”,AI恐慌在减少

    来源:大数据文摘 新年伊始,海外媒体VentureBeat电话访谈了包括吴恩达.Yann Lecun在内的四位人工智能领域领军者,询问了他们对于过去一年人工智能领域发展的看法,以及他们认为新一年人工智 ...

  8. 2019【创新奇智】【算法】【面经】

    创新奇智,一家以"AI赋能"为主题的公司,是创新工场的子公司,于2018年3月成立.也不知道水平怎么样,通知了面试,就去了. 岗位要求: 图像视觉算法实习生 250-280/天  ...

  9. 9 行代码提高少样本学习泛化能力,代码已开源

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 转自 | 新智元 来源 | 知乎 作者 | 杨朔 本文介绍一篇最新发 ...

最新文章

  1. 【新产品发布】《EVC8021 RS-232RS-485/422 隔离接口转换器》
  2. Java Spring源代码学习之DispatcherServlet.getHandler
  3. 5. vector 模板类型? 数据类型?
  4. App Transport Security has blocked a cleartext
  5. 一次性发布20个音频IP,看喜马拉雅FM解锁品牌营销新姿势
  6. Element UI 前端分页
  7. linux安装db2数据库并设置开机自启动
  8. pca 累积方差贡献率公式_SPSS主成分分析时,是不是得到的方差百分比就是贡献率,累计百分比就是累计贡献率??...
  9. Makefile 自动化变量及其说明
  10. 基于数字电路典型分频电路设计
  11. 从 Uber 数据泄露事件我们可以学到什么?
  12. 雨刮器全国产化电子元件推荐方案
  13. 普及游戏:小型团队如何赢得大赛
  14. 计算机如何默认一种打字法,怎么把电脑的输入法设置成默认的
  15. 20P76 pr预设模板850个缩放炫光毛刺干扰透视平移无缝视频转场
  16. python 埋点 库_测试~python库介绍(一) opencv
  17. No.067<软考>《(高项)备考大全》【冲刺14】《软考高项极简知识点(3)》
  18. 如何成为一名成功的博士生(计算机科学(in NLPML))——Do what will make you happy
  19. java 用ftl模板生成word时插入多张图片
  20. 未能加载文件或程序集Noesis.Javascript.DLL或它的某一个依赖项。找不到指定的模块。

热门文章

  1. 基于逐浪CMS后台商城及店铺运费配置管理
  2. css border: datted 和border dashed对比
  3. YDOOK 星空导航正式上线!功能介绍 作者:博主 JY Lin - YDOOK
  4. 将gitee个人仓库克隆到本地
  5. MySQL 8.0 clone plugin 完整版
  6. 优酷html5速度慢,优酷发力Html5技术关注高品质移动体验
  7. 响应式图像_如何为响应图像使用HTML5“图片”,“ srcset”和“大小”
  8. 创建集合并添加给定数据(学生名),删除集合中以王开头的学生,打印剩余学生的姓名
  9. 上市后的第一份财报,藏着满帮的两把双刃剑
  10. 荣耀Magic5至臻版摄像头参数怎么样 荣耀Magic5至臻版电池容量