论文:Improving Language Understandingby Generative Pre-Training

1. 前言

本文对2018年OpenAi提出的论文《Improving Language Understandingby Generative Pre-Training》做一个解析。

一个对文本有效的抽象方法可以减轻NLP对监督学习的依赖。大多数深度学习方法大量的人工标注信息,这限制了在很多领域的应用。在这些情况下,可以利用来未标记数据的语言信息的模型来产生更多的注释,这可能既耗时又昂贵。此外,即使在可获得相当大的监督的情况下,以无人监督的方式学习良好的表示也可以提供显着的性能提升。到目前为止,最引人注目的证据是广泛使用预训练词嵌入来提高一系列NLP任务的性能。

2. OpenAI GPT原理

本文提出一种半监督的方式来处理语言理解的任务。使用非监督的预训练和监督方式的微调。我们的目标是学习一个通用的语言标示,可以经过很小的调整就应用在各种任务中。这个模型的设置不需要目标任务和非标注的数据集在同一个领域。模型有两个过程。

  1. 使用语言模型学习一个深度模型
  2. 随后,使用相应的监督目标将这些参数调整到目标任务

3. OpenAI GPT模型结构

3.1 非监督预训练

处理非监督文本(

系统学习NLP(二十八)--GPT相关推荐

  1. 系统学习NLP(十八)--文本分类概述

    转自:https://blog.csdn.net/u014248127/article/details/80774668 文本分类问题: 给定文档p(可能含有标题t),将文档分类为n个类别中的一个或多 ...

  2. Unreal Engine 4 —— GAS系统学习 (二十八) 创建Lazer招式与GameplayEffect

    欢迎大家加入Unreal Engine C++ & Blueprint群一起交流:1143575617 为Lazer招式新建一个GA招式,继承自BP_GameplayAbility,这个类是前 ...

  3. 嵌入式系统设计师学习笔记二十八:嵌入式程序设计③——高级程序设计语言

    嵌入式系统设计师学习笔记二十八:嵌入式程序设计③--高级程序设计语言 解释程序和编译程序 编译器的工作阶段示意图 语法错误:非法字符,关键字或标识符拼写错误 语法错误:语法结构出错,if--endif ...

  4. 无人驾驶汽车系统入门(二十八)——基于VoxelNet的激光雷达点云车辆检测及ROS实现

    无人驾驶汽车系统入门(二十八)--基于VoxelNet的激光雷达点云车辆检测及ROS实现 前文我们提到使用SqueezeSeg进行了三维点云的分割,由于采用的是SqueezeNet作为特征提取网络,该 ...

  5. JavaScript学习(二十八)—事件冒泡和事件捕获

    JavaScript学习(二十八)-事件冒泡和事件捕获 一.什么是事件流? 简单说,事件流就是指事件的执行顺序,他包含两种模式:事件冒泡.事件捕获. (一).事件冒泡 最常用的一种模式,就是指事件的执 ...

  6. Mr.J-- jQuery学习笔记(二十八)--DOM操作方法(添加方法总结)

    Table of Contents appendTo appendTo(source, target) 源代码 append prependTo ​ ​ ​ ​ prependTo源码 prepend ...

  7. 系统学习NLP(十二)--文本表示综述

    文本表示,简单的说就是不将文本视为字符串,而视为在数学上处理起来更为方便的向量(也就是文本特征抽取).而怎么把字符串变为向量,就是文本表示的核心问题. 文本表示,基于类型分为: 长文本表示 短文本表示 ...

  8. 嵌入式Linux系统编程学习之二十八线程的等待退出

    文章目录 一.等待线程退出 二.线程的取消 三.线程终止清理函数 一.等待线程退出   线程从入口点函数自然返回,或者主动调用 pthread_exit 函数都可以让线程正常终止.线程从入口点函数自然 ...

  9. 系统学习深度学习(二十八)--DSD

    论文:DSD: Dense-Sparse-Dense Training for Deep Neural Networks 论文链接:https://arxiv.org/pdf/1607.04381.p ...

  10. 系统学习NLP(十九)--文本分类之FastText

    转自:https://blog.csdn.net/sinat_26917383/article/details/54850933 FastText是Facebook开发的一款快速文本分类器,提供简单而 ...

最新文章

  1. redis在容器里连接不上_Redis服务器被劫持风波,服务器相关知识共享学习
  2. python处理xml中非法字符的一种思路
  3. jQuery Pagination分页插件--无刷新
  4. Vue_template是什么
  5. 如何使用Meter-WebSocketSampler
  6. leetcode 1227 python
  7. Keras——用Keras搭建RNN分类循环神经网络
  8. Java基础,无需使用复杂语句,实现输出0-130之间的数字,每行显示7个数字。
  9. 基金投资入门1:基金基础知识介绍
  10. jmeter 录制--https代理证书导入IOS手机
  11. 计算机专业分类分级,计算机等级分级
  12. C DoEvents
  13. 画江湖之独门暗器指针
  14. 幸福公开课字幕 中英文全
  15. ucache灾备云报价_UCache云灾备体系介绍
  16. 前端学习CSS3(day3)盾牌案例
  17. 就在本周末!北美最牛X的餐饮大咖都找齐了,值得你来朝圣这一次
  18. 软考-架构师-第五章-系统性能评价 第二节 性能计算(读书笔记)
  19. RNA 1. SCI 文章中读取 GEO 数据
  20. 安装算量软件解决造价人的痛点难点

热门文章

  1. git显示分支关系图
  2. Ubuntu 14.04报错: error while loading shared libraries libc++.so cannot open shared object file解决
  3. 深度学习自学(十七):caffe-sphereface-编译matcaffe遇到的问题
  4. ubuntu-常用命令汇总
  5. 我的世界服务器开服文件夹,详细开服教程。想要自己开服的小伙伴儿 戳这里·...
  6. linux学习笔记:处理linux目录的常用命令
  7. pass 软件_怎么用电脑剪辑音乐?用什么剪辑软件好?
  8. moment获取几小时前_请问怎么把“多少小时前”精确到“多少小时多少分钟前”...
  9. python 服务监控_promethues + python + flask监控后端服务状态
  10. python源码_Python爬虫入门之获取网页源码