Self-training Improves Pre-training for Natural Language Understanding,NAACL2021
本文研究了半监督学习中通过自监督训练利用非标记数据的一种方法。具体来说,引入了SentAugment,这是一种数据增强方法,它从有标签的数据中计算特定于任务的查询嵌入,从从网络上爬取的数十亿个无标签的句子库中检索句子(/(ㄒoㄒ)/~~果然是Facebook AI才配做的工作啊)。与以前的半监督方法不同,本文的方法不需要域内无标记数据,因此更普遍适用(我觉得咋不太实用呢,主要是数据量太大了穷逼应该用不起吧?)。
其实本文的思路很简单,捋一遍论文就知道了。
Approach
总体的结构图如图所示:
Large-scale sentence bank
本文的方法依赖于一个大规模的无监督句子语料库,也就
Self-training Improves Pre-training for Natural Language Understanding,NAACL2021相关推荐
- 自然语言理解(Natural Language Understanding)
1. 引言 Siri,Cortana,Google Now,小冰,度秘,随着技术的进步和自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争夺的下一个入口.这些智能助理尽管能力有大有小,但有一个共同 ...
- TINYBERT: DISTILLING BERT FOR NATURAL LANGUAGE UNDERSTANDING
TINYBERT: DISTILLING BERT FOR NATURAL LANGUAGE UNDERSTANDING 来源:ICLR 2020 在审 链接:https://arxiv.org/pd ...
- 自然语言处理从入门到应用——自然语言处理(Natural Language Processing,NLP)基础知识
分类目录:<自然语言处理从入门到应用>总目录 自然语言通常指的是人类语言,是人类思维的载体和交流的基本工具,也是人类区别于动物的根本标志,更是人类智能发展的外在体现形式之一.自然语言处理( ...
- Self-training Improves Pre-training for Natural Language Understanding 笔记
self-training,是用训练好的模型的预测结果 作为 伪target,混入原训练集一起训练, 该文的创新在于提出一种文本相似度算法从海量文本中找出和 训练集中的文本 相似的文本, 然后用训练好 ...
- NLU(Natural Language Understanding)太难了
原文链接:https://github.com/fighting41love/hardNLU NLU is hard!!! 一直关注刘群老师的微博,常常看见他分享的一些好玩的#自然语言理解太难了#. ...
- 【模型蒸馏】TinyBERT: Distilling BERT for Natural Language Understanding
总述 TinyBert主要探究如何使用模型蒸馏来实现BERT模型的压缩. 主要包括两个创新点: 对Transformer的参数进行蒸馏,需要同时注意embedding,attention_weight ...
- NATURAL LANGUAGE INFERENCE OVER INTERACTION SPACE
文章目录 ABSTRACT 1 INTRODUCTION 2 RELATED WORK 3 MODEL 3.1 INTERACTIVE INFERENCE NETWORK 3.2 DENSELY IN ...
- Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Process
摘要 这篇文章是对最近比较火的"prompt"的一个总结,一篇非常好的综述,做NLP方向建议都要读一读:) 本文将这种方法称之为"prompt-based learnin ...
- EMNLP2020 | 近期必读Natural Language Inference精选论文
**AMiner平台**由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务 ...
最新文章
- jpg怎么合成一份_哪些超实用的有机化学知识点---之有机合成工具包
- keepalive实验配置
- STL中的priority_queue(优先队列)
- ASP.NET-Session cooike
- keepalive之LVS-DR架构
- 【DP】剪草(jzoj 1510)
- 客户机服务器文件更新,服务端数据更新,如何更新客户端缓存
- AJAX -- 目录
- 【matlab】 GMSK的调制与解调【附详尽注释】
- 提醒:电脑一族常感眼睛干涩可能是干眼症
- Verilog HDL简介
- 字节跳动杨震原:A/B测试不是万能的,但不会一定不行 ​
- divi 相关主题推荐
- Cesium Primitives加载大量图标点
- MATLAB---制作动画并演示
- Apifox 生成接口文档 教程与操作步骤
- 0x00000005 3.数据结构和算法 基础数据结构 字符串(上)
- 【算法】只有五行的Floyd最短路算法
- Arduino(三)——按钮控制数码管
- 人脸识别的发展和基础概念
热门文章
- 【转】ubuntu实现磁盘配额限制步骤
- php怎么实现登录后管理员和普通会员的不同的登录页面_智学网怎么登录 智学网怎么查分数 智学网统一登录平台网址分享https://www.zhixue.com/login.html...
- kangle环境liunx一键安装脚本
- 【零信任落地案例】陆军军医大学第一附属医院零信任安全架构主要构成
- linux dts 文件格式,DTS 文件扩展名: 它是什么以及如何打开它?
- R for beginners
- 快递单号发出物流如何查询,快递单号查询物流方法
- 在win10 安装配置jdk和tomcat
- 循环神经网络惊人的有效性(上)
- 刘帅嵌入式系统-BLX(2)