FewRel 2.0数据集:以近知远,以一知万,少次学习新挑战
大家都知道,传统的机器学习模型需要较大的训练数据才能达到好的效果。然而我们人类从小时候起,就有看少量例子学会新事物的能力。少次学习(Few-Shot Learning)正是致力于探索模型如何能快速适应新任务的一种方式。
有一类经典的少次学习设定叫做 N-Way K-Shot:给定 N 个模型从未见过的类型,每个类型给定 K 个训练样本,要求模型能够将测试样例进行 N 分类。形象地说,这种设定要求模型“现学现卖”,先看几个例子,然后在测试集上做“选择题”,判断它们到底属于新类型中的哪一类。
在 CV 领域,常用的少次学习数据集有 miniImageNet 和 Omniglot。而在 NLP 领域,清华大学的刘知远老师组去年发布了 FewRel——一个大规模的少次学习关系抽取数据集。该数据集仅发布一年便获得了多次引用,也有许多研究者以此为基础展开相关研究。
而在今年的 EMNLP 上,该团队又发布了数据集的升级版:FewRel 2.0。相关论文已经放出(https://arxiv.org/abs/1910.07124)。和 1.0 相比,FewRel 2.0 又有哪些区别呢?
两大新挑战
在 FewRel 2.0 中,作者提出了两大少次学习新挑战:跨领域和“以上都不是”(无答案问题)。作者表示,以往的少次学习模型都不能很好的解决这两大问题,虽然他们提出了两个新模型,效果得到了一定的改善,但在这两个挑战上,仍有巨大的上升空间。
▲ 一图看FewRel两大新挑战
▲ FewRel 1.0和FewRel 2.0测试结果对比,可看出跨领域任务十分具有挑战性
更多信息
总结来说,FewRel 2.0 相比 1.0 版本增加了两个挑战:跨领域和“以上都不是”。经典模型在这两个挑战面前的表现都不尽人意。尽管作者在论文中提出了可能的解决方案和模型,但表现仍然有较大的提升空间。
最后,数据集的论文(https://arxiv.org/abs/1910.07124)和Github项目(https://github.com/thunlp/fewrel)均已放出,论文中提到的模型也都包括在内,感兴趣的同学可以到他们的 Github 主页和论文中了解更多信息。
关于作者
PaperWeekly携手图灵教育
送出5本PyTorch入门宝典
从零到一,真正实现 PyTorch 深度学习入门。本书浅显易懂,图文并貌地讲解了深度学习的基础知识,从如何挑选硬件到神经网络的初步搭建,再到实现图片识别、文本翻译、强化学习、生成对抗网络等多个目前最流行的深度学习应用。书中基于目前流行的 PyTorch 框架,运用 Python 语言实现了各种深度学习的应用程序,让理论和实践紧密结合。
长按识别下方小程序码
即可参与本次抽奖
开奖时间:11月8日 14:00
FewRel 2.0数据集:以近知远,以一知万,少次学习新挑战相关推荐
- 悟道·文汇详解:少样本学习等近十个数据集取得第一
智源导读:预训练模型如今已经成为深度学习研究中的一种主流范式,智源研究院认为「深度学习已经从『大炼模型』步入到『练大模型』的阶段」.基于此种考虑,由智源研究院牵头,汇聚清华.北大.中科院.人大等高校院 ...
- AI和工业4.0之间,还有多远的差距?
本文为 AI 研习社编译的技术博客,原标题 : Spanning the reality gap between AI and Industry 4.0 作者 | Philip Montsho 翻译 ...
- 实现光晕效果_马自达6车灯升级激光四透镜实现四近四远光
汽车前照明大灯升级案例 车型:马自达6 灯泡色温:5600K 透镜案例:米石激光 TMF激光 原车灯泡型号:H1 H1 雾灯:H3 原车瓦数:80-100W 升级方式:支架 安装方式:有 密封胶性质: ...
- 如何按距离排序 php,php做附近的人,根据距离由近到远进行排序
用户登陆的时候会获取到该用户的经纬度,数据库中存有所有用户的经纬度,如何进行由近到远进行排序,并算出距离 可以考虑用GeoHASH实现,效率更高,参考这篇http://www.cnblogs.com/ ...
- 伯克利AI实验室最新发文:公布用于机器人抓取的Dexterity Network (Dex-Net) 2.0数据集...
雷锋网AI科技评论按:伯克利AI实验室最新发文公布了用于机器人抓取的Dexterity Network (Dex-Net) 2.0数据集,这些数据集可以用来训练根据实际机器人的点云做抓取规划的神经网络 ...
- 2021高考成绩查询镇远一中,离太阳由近到远的八大行星排序及记忆方法
八大行星按照离太阳的距离从近到远,它们依次为水星.金星.地球.火星.木星.土星.天王星.海王星. 更多高考资讯尽在30高考网https://www.30gk.com/ 八大行星的排序 1.水星:在太阳 ...
- css 实现文字3D旋转近清晰远模糊
3D旋转:父元素设置透距perspective:160vmin,子元素设置3D模式transform-style: preserve-3d 近清晰远模糊:通过filter:blur实现模糊,filte ...
- HTAP数据库 PostgreSQL 场景与性能测试之 6 - (OLTP) 空间应用 - KNN查询(搜索附近对象,由近到远排序输出)...
标签 PostgreSQL , HTAP , OLTP , OLAP , 场景与性能测试 背景 PostgreSQL是一个历史悠久的数据库,历史可以追溯到1973年,最早由2014计算机图灵奖得主,关 ...
- AI,你究竟离我们是近还是远?
关注云报 洞察深一度 有人说,情诗很近,但仓央嘉措很远.因为能写情诗的人很多,但像仓央嘉措那样将情感描写得如此细腻真挚动人的很少. 也有人说,AI(人工智能)很近,但应用很远.因为AI的产品虽然五花八 ...
最新文章
- UA MATH636 信息论9 有限域简介
- 【算法数据结构Java实现】折半查找
- Android控件随手指的移动而移动
- 【HDU - 1087】Super Jumping! Jumping! Jumping! (最大上升子序列类问题,dp)
- python 解方程 sympy_Python数据处理篇之Sympy系列(五)---解方程
- hdu 3068 最长回文 (Manacher算法求最长回文串)
- 如何使用python多线程_Python:怎样用线程将任务并行化?
- 解决pip pandas 安装提示time out
- Python Selenium 疑难杂症解方(一):启动浏览器
- 推荐几个摸鱼时常看的技术网站
- 服务器版博客系统、前后端交互1
- 【全网详解】从0到1搭建双十一实时交易数据展示平台——Spark+Kafka构建实时分析系统
- 成都中忻嘉业:抖音小店商品不出单,如何做好优化
- 本地windows首次远程登录阿里云ECS服务器
- 一感冒就得红眼病,而且很严重怎么办
- 什么是视频价值?如何体现价值?做自媒体有很多人都弄错了
- 那些年我们追过的C#奇葩关键字——忐忑
- 如何将PPT转换成Excel表格?教大家一种转换小妙招
- 【Mysql数据库 第2章】MySQL数据库基本操作-DML
- 文本框只能输入特定内容如文本框只能输入数字
热门文章
- 无法加入nacos服务列表_Nacos 1.1.1 发布,支持灰度配置和地址服务器模式
- python安装出错0xc00006b_Python安装时我遇到的一些问题
- Android切换到主线程
- 团队作业-Beta冲刺第二天
- (一)为什么要UML
- Vue之旅-Vue环境搭建
- Android 不同View ID相同
- python机械手标定_机械手姿态的获取,ros,臂,当前,位姿
- linux ps1 目录颜色,Linux下PS1终端下的颜色设置
- MATLAB不定积分的运算,matlab中怎么把积分函数 int 得到的不定积分式代入 solve 函数中进行计算?...