文 | 丰色 发自 凹非寺
源 | 量子位(QbitAI)

本科生搞科研到底能做出什么成绩?

最新被CVPR 2022收录的一篇论文中,提供了一种新思路来解决深度学习中长尾分布数据的分类问题,最终实现了新SOTA。

论文:https://arxiv.org/abs/2111.09030

文章一共5位作者,有博士生,也有来自新加坡A*STAR的高级研究员……

而排在一作位置的,是一位来自天津大学的科生——李同学

厉害的是,这还不是这位“初生牛犊”的第一篇顶会论文,在此之前,他还中了一篇数据挖掘领域的顶会(WWW 2022),同样是一作。

本科生搞科研,势头已经这么强了吗?

大三进实验室,大四就有2篇顶会在手

李同学来自天津大学智能与计算学部,今年大四

这篇CVPR文章,主要就是以新型集成(ensembling)学习策略来解决长尾分类的问题。

长尾分布大家都知道,对于这些数据的分类则是深度学习中十分常见的一个应用。

它的难点主要是样本量极端不平衡尤其尾部样本量过少,难以获得有效的训练结果。

目前,基于集成学习的方法显示出巨大潜力,实现了SOTA性能。

但这种方法有两个局限性:

一是在failure-sensitive应用中的预测通常不可信,这对极容易出错的尾部数据的影响非常大;

二是它会为所有样本分配统一数量的资源(experts),这对于简单样本来说,造成了多余、过高的计算成本。

因此,李同学等人提出,通过引入不确定性集成,来实现对尾部类别样本的自动感知。

在此基础上,提出为尾部类别样本动态分配比头部样本更多的模型资源(experts),以兼顾性能与效率。

▲ 测试阶段使用哈佛提出的DS理论形成joint uncertainty

最终,所得模型实现了对尾部类别样本的自动化检测与训练调节,成为一个解决长尾分类问题的通用模型。

一系列分类、尾部检测、离群点检测和故障预测等任务的综合实验证明,该模型的性能成功打败现有的SOTA方法

今年6月,李同学即将本科毕业,然后将直接以博士生的身份进入普渡大学学习,师从张教授。

张教授刚刚从康奈尔大学统计学博士毕业,在普渡大学担任助理教授,她的研究方向为机器学习和数据科学中概率模型的构建。

他是在大三的时候,凭着优秀的学习成绩进入了学部的机器学习与数据挖掘实验室

在导师张长青(天津大学博导)的带领下,李同学经过短短一年半的学习,就中标了两篇顶会论文。可以说后生可畏。

越来越多的本科生开始发顶会

不过要说起本科生搞科研,其实大家应该有所注意,很多学校对于这件事越来越开放和重视:

在大三或者更低年级时,就会开放一些名额让有潜力的学生进入实验室,和研究生、博士生一起搞科研。

比如清华“星火班”就招募大二学生,北大也鼓励学生从大二就开始开展科研项目,而像中科大等学校,对做出相应成绩的本科生还会给予专门的奖学金

在这样的情况下,已经有不少像李同学这样的学生,在本科期间就发表上顶会了,可谓光环满身。

比如我们熟悉的清华特奖得主、2016级本科生高天宇,大学四年期间就有四篇顶会在手:两篇AAAI、两篇EMNLP,还开过一个直播,专门传授起自己的科研经验。

比如MIT本科生毛啸,大四中标计算机理论顶会FOCS 2021,并摘得最佳学生论文奖。

再比如清华电子系本科生刘泓,3篇一作顶会;北大本科生吴克文不仅发顶会(ACM计算理论年会STOC),还拿下最佳论文奖;以及电子科大本科生王谭也有1篇一作CVPR 2020、浙大本科生任意同样1篇一作ICML 2019……

类似的例子非常多。

可以说,本科生搞科研是越来越厉害了,大家觉得呢?

后台回复关键词【入群

加入卖萌屋NLP、CV与搜推广与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1]http://cic.tju.edu.cn/info/1040/3704.html

CVPR 2022 | 天大本科生论文入选!深度学习长尾分类新SOTA相关推荐

  1. 天大本科生论文入选CVPR 2022,实现深度学习长尾分类新SOTA

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 本科生搞科研到 ...

  2. 同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读

    视学算法发布 作者:陈涵晟(同济大学研究生.阿里达摩院研究型实习生) 距离 CVPR 2022 各大奖项公布没多久,来自同济大学研究生.阿里达摩院研究型实习生陈涵晟为我们解读最佳学生论文奖. 本文解读 ...

  3. 论文合集 | 李飞飞新论文:深度学习代码搜索综述;Adobe用GAN生成动画(附地址)...

    来源:机器之心 本文约3200字,建议阅读7分钟. 本文介绍了李飞飞新论文,深度学习代码搜索综述,Adobe用GAN生成动画. 本周有李飞飞.朱玉可等的图像因果推理和吴恩达等的 NGBoost 新论文 ...

  4. 【每周CV论文】深度学习图像降噪应该从阅读哪些文章开始

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像降噪是图像处理领域中非常传统和经典的问题 ...

  5. 【NLP】深度学习文本分类|模型代码技巧

    文本分类是NLP的必备入门任务,在搜索.推荐.对话等场景中随处可见,并有情感分析.新闻分类.标签分类等成熟的研究分支和数据集. 本文主要介绍深度学习文本分类的常用模型原理.优缺点以及技巧,是「NLP入 ...

  6. 传统文本分类和基于深度学习文本分类

    用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践 近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文题目便是文本分类问题,趁此机会总 ...

  7. 基于逻辑回归,支持向量机,朴素贝叶斯以及简单深度学习文本分类方法(BiLSTM、CNN)实现的中文情感分析,含数据集可直接运行

    基于逻辑回归,支持向量机,朴素贝叶斯以及简单深度学习文本分类方法(BiLSTM.CNN)实现的中文情感分析,含数据集可直接运行 完整代码下载地址:中文情感分析 中文情感分析 本项目旨在通过一个中文情感 ...

  8. R使用LSTM模型构建深度学习文本分类模型(Quora Insincere Questions Classification)

    R使用LSTM模型构建深度学习文本分类模型(Quora Insincere Questions Classification) Long Short Term 网络-- 一般就叫做 LSTM --是一 ...

  9. HALCON 21.11:深度学习笔记---分类(10)

    HALCON 21.11:深度学习笔记---分类(10) HALCON 21.11.0.0中,实现了深度学习方法. 本章介绍了如何在训练和推理阶段使用基于深度学习的分类. 基于深度学习的分类是一种对一 ...

最新文章

  1. 文件上传oss服务器
  2. MAC 升级到10.10(OS X Yosemite)下apache+php的配置问题
  3. js修改html不成功,为什么这段代码中用js修改css样式中的display属性却不成功?
  4. 掌握Rabbitmq几个重要概念,从一条消息说起
  5. 扩展云存储边界,阿里云推出全球首个云定义存储产品
  6. Qt线程间通信-信号与槽通信
  7. 使用OUTPUT从句从SQL Server表删除和归档大量记录
  8. spring mvc后端代码实现弹出对话框_伟源|一图搞定Spring框架
  9. 时隔两年,PuTTY 喜提新版
  10. RHEL 6 LAMP(一)
  11. MFC 盾webBrowser打开弹出的页面
  12. POJ - 3624 (01背包问题)(动态规划-滚动数组)
  13. JSON字符串,JSON对象,JSON数组,实体类转换
  14. 计算机显示器刷新率怎么调,显示器刷新率怎么超频?电脑显示器提高屏幕刷新率超频教程...
  15. python根据excel数据生成柱状图并导出成图片格式
  16. 1000:有一分数序列: 2/1 3/2 5/3 8/5 13/8 21/13...... 求出这个数列的前N项之和,保留两位小数:
  17. outlook2013配置
  18. 图片的分辨率大于设备分辨率或者小于设备的分辨率的显示问题
  19. lol聊天服务器断开无法修复,英雄联盟无法聊天说话处理办法
  20. Homography 估计单应性矩阵代码实现

热门文章

  1. (五)uboot移植补基础之shell
  2. [翻译]API Guides - Bound Services
  3. 挖掘有价值的搜索关键词
  4. 邮件服务器之POP3协议分析
  5. ASP.NET小收集:Word的编码是Unicode
  6. Linux Cpu 利用率计算
  7. 观察者模式Observer
  8. 答应了好久的camera资料
  9. python 3d渲染_python老司机带你玩玩炫酷的3D渲染,酷毙了!
  10. 图像目标分割_1 概述