文献阅读——Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
附注
- 这篇文章中在最终提到模型的时候使用了一个 “知识蒸馏” 的点,这点需要注意。如果不懂的话,请参考知识蒸馏基本原理
- 其实,这里的知识蒸馏主要是在预训练模型的Fine-tuning中应用的较多,首先是使用一个大于1的T来学习预训练模型得到的一个有关数据之间的软分布,同时加上自己的一定真是数据,这样可以使得我们的模型具有较好的泛化能力。
- 接着是在我们进行预测的时候将T的温度降下来,使得输出一个正常的分布。
文章主要思想
- 首先对于这篇文献主要解决的问题是few-shot文本分类问题,同时在文中也是提到了文中提到的方法加以改进亦可以做到zero-shot方面的文本分类问题上来。
- Few-shot上面存在的问题有:
- 首先,few-shot的数据集中带有标签的数据量很少,这种情况有可能导致,我我们在进行模型的预训练的时候很难从这些少量的实例中提取到有用的信息。
- 因此,文中针对于解决few-shot的文本分类问题提出了它的解决方案。
- 文中提到的算法有两个名称分别是PET和iPET,很明显可以看出来iPET是PET模型的改进版。也就是使用的迭代的方式来解决了PET方法中遗留下来的问题。
- 这里先论述base method——PET方法。
- 这种方法使用的大致思想是,首先使用few-shot数据集中仅存的少量带标签的数据对MLM模型进行Fine-tuning,然后可以得到一个集成的语言模型&
文献阅读——Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference相关推荐
- 【提示学习】Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
论文信息 名称 内容 论文标题 Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inf ...
- 论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference 随着 ...
- 【论文分享】PET:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
论文链接:https://arxiv.org/pdf/2001.07676.pdf 时间:2021年1月 特点:多模板 目录 背景 模型 PVP定义 组合PVP P: V: 结构 实验 背景 在小样本 ...
- Exploiting Cloze Questions for Few Shot Text Classification and NaturalLanguage Inference翻译
Abstract 一些NLP任务可以以完全无监督的方式解决,方法是用自然语言提供预先训练过的带有"任务描述"的语言模型(例如,Radford等人,2019).虽然这种方法的性能不如 ...
- 论文解读: Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
前言:在自然语言研究领域,某些自然语言处理任务可以利用"预训练模型+任务描述"方式的无监督学习来解决.然而,已有的"预训练模型+任务描述"的无监督学习方法不如有 ...
- 深度学习文本分类文献综述(翻译自Deep Learning Based Text Classification: A Comprehensive Review)
深度学习文本分类文献综述 摘要 介绍 1. 文本分类任务 2.文本分类中的深度模型 2.1 Feed-Forward Neural Networks 2.2 RNN-Based Models 2.3 ...
- 论文阅读笔记:Graph Convolutional Networks for Text Classification
Abstract 文本分类作为一个经典的自然语言处理任务,已经有很多利用卷积神经网络进行文本分类的研究,但是利用图卷积神经网络进行研究的仍然较少. 本文基于单词共现和文档单词间的关系构建一个text ...
- Natural Language Inference Over Interaction Space(DIIN)阅读笔记
文章目录 Introduction Model Interactive Inference Network(IIN) Densely Interactive Inference Network(DII ...
- 文献阅读笔记 # Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
<Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks> 用于快速搭建NLP任务的demo的开源项目sbert的原始 ...
最新文章
- Python自动化开发学习15-css补充内容
- 初等数学O 集合论基础 第六节 商集
- Scala入门到精通——第十五节 Case Class与模式匹配(二)
- MD5算法原理与常用实现
- 软件工程资料 - 优秀的大学怎么教程序开发和软件工程课
- 【毕业设计】jSP在线教学质量评价系统的设计与实现(源代码+论文)
- synchronized互斥锁结合wait()、notify()方法使用,实现线程的阻塞以及线程调用案例
- 继承ActionSupport类
- 电脑自动跳出计算机管理员登陆界面,解决运行wegame总是弹出用户账户控制界面的方法...
- pc计算机属于第几代,i5 vPro是第几代?十一代vPro平台你了解吗?
- linux mint mac桌面图标,在Ubuntu、Linux Mint上安装Mac OS X主题
- 绿联硬盘盒挂载linux,绿联sata硬盘盒,2.5/3.5寸外置usb3.0移动硬盘盒
- Opencv去除高光的算法--Highlights Removal
- sql中日期和时间戳的相互转换
- “音响”事件对国产豪华品牌车汽车厂商的警示
- 想学java老师建议学python怎么办?IT培训常见骗局汇总
- C++ pthread cond_wait 和 cond_broadcast的使用
- win10截图快捷键无法使用 | 无法打开窗口 | 鼠标无法点击
- Apache Spark+PyTorch 案例实战
- FPGA学习-5:仿真
热门文章
- 对Fontforge中单个字符map自动校验中的错误的分析
- iOS之应用图标AppIcon和启动页LaunchImage
- abap 实现F-47过账增强
- java 最大值 MAX_VALUE 与最小值 MIN_VALUE
- 【蓝桥杯】【星系炸弹】
- 【慕伏白教程】在Vmware中安装Ubuntu流程
- 微服务网关限流鉴权-wei-fu-wu-wang-guan-xian-liu--jian-quan
- Invalid UTF-8 middle byte 0xcf
- Windows c++界面开发初学(一)
- 【技术认证题库】齐治中级运维安全认证——RIS堡垒机习题