更新说明

1. 2019-09-16更新:

OpenAI于Aug 21, 2019提交了一个commit,其公布了更大的774M模型,并且纠正了对之前公布的两个模型的参数估计错误导致的命名不准确问题,修改了其名称:其中,原117M模型更名为124M;345M更名为355M。(仅修改名称,模型的文件内容并没有任何修改,可以继续使用)

commit地址:OpenAI: push 774M model

Note that our original parameter counts were wrong due to an error (in our previous blog posts and paper). Thus you may have seen small referred to as 117M and medium referred to as 345M

更新后的3种模型(124M/355M/774M)下载地址:

链接:https://pan.baidu.com/s/13FxNXKOc85A07AjhCT23GQ 
提取码:rmqk

———————————————————————————————————————

原始地址

GPT-2项目地址:https://github.com/openai/gpt-2

背景

由于该下载源在国外,所以在下载该模型的时候经常会报错,难以下载。

于是我在终于下载好了之后,将该模型上传至网盘,方便大家下载。

其中包括已开源的117M和345M两个模型,下载后,将models直接放在gpt-2的文件夹下即可使用。

下载地址

网盘地址:

链接:https://pan.baidu.com/s/1r3hn1BdDZJ6FWK6pCu6-4A 
提取码:hsxp

压缩包大小为1.66GB,解压之后为1.78GB。

由于百度云限速,推荐使用PanDownload工具进行下载。

声明

该GPT-2模型是由OpenAI训练并发布的,本人只是将其下载下来并转存至百度云,使用其所造成的后果与本人无关

如有侵权请联系本人删除。

OpenAI GPT-2 官方模型下载相关推荐

  1. LSTM、Bilstm、ELMo、openAI GPT、Bert模型简介

    把握: LSTM 里面:遗忘门f_t,记忆门i_t,输出门o_t                      输入:上一个细胞隐藏层状态:h_t-1,本时刻输入参数                   ...

  2. 解决BERT官方模型script脚本下载GLUE data失败的问题

    解决BERT官方模型script脚本下载GLUE data失败的问题 1. 运行脚本下载GLUE数据集(建议科学上网) BERT的提出对于NLP领域是一项里程碑.再一次证明了利用语言模型的预训练然后再 ...

  3. Kubectl-AI: 一款使用 OpenAI GPT 自动生成应用 Kubernetes 部署清单的神器

    公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! ​ 找到一个好插件,人话翻译机. 该项目是一个kubectl插件,使用OpenAI GPT生成和应用Kuberne ...

  4. OpenAI的人工智能语音识别模型Whisper详解及使用

    1 whisper介绍 拥有ChatGPT语言模型的OpenAI公司,开源了 Whisper 自动语音识别系统,OpenAI 强调 Whisper 的语音识别能力已达到人类水准. Whisper是一个 ...

  5. 经典教材《模式识别和机器学习》官方免费下载!

    编辑:肖琴 [新智元导读]最经典的机器学习教材之一.大牛Christopher Bishop所著的<模式识别与机器学习>公开了官方的免费下载版本! 今天,微软剑桥研究院在官方推特放出一个大 ...

  6. Lanenet 车道线检测网络模型学习(论文解读+官方模型)

    本文讲解的是用于车道线检测的一个网络结构叫lanenet, 转载请备注,多谢哈|! 2018.2发表出来的,文章下载地址:https://arxiv.org/abs/1802.05591 github ...

  7. 基于OpenVINO部署PaddlePadle-YOLOE模型—2.模型下载与转换

    1. 模型下载  首先下载PP-YOLOE官方训练模型,该模型由PaddleDetection提供,基于COCO数据集训练,可以识别80种常见物体.此处采用的是PaddleDetection rele ...

  8. 草图大师里创建动态组件_教你搞定SketchUp草图大师动态组件模型下载

    昨天最角模型上发布了一个"室内概念草图"的视频,里面涉及到一个门的开关,很多SketchUp爱好者非常好奇,是怎么制作的?虽然不是利用动态组件制作的,但其实就是动态组件的意思.大家 ...

  9. 一文搞懂ChatGPT相关概念和区别:GPT、大模型、AIGC、LLM、Transformer、羊驼、LangChain…..

    ChatGPT横空出世后,伴随而来的是大量AI概念,这些概念互相之间既有联系也有区别,让人一脸懵逼,近期大鱼做了GPT相关概念的辨析,特此分享给你. 1)Transformer 2)GPT 3)Ins ...

最新文章

  1. 换发型app任性扣费?苹果app订阅任性扣费?怎么办?刚成功
  2. 按钮垂直居中_带下拉按钮的动态图表
  3. easyUI droppable组件使用
  4. seaborn系列 (2) | 散点图scatterplot()
  5. mysqldatareader获取整行数据给datarow_SqlDataReader的用法(读取1整行)
  6. 中国金融体系(金融机构,金融市场,金融基础设施)
  7. java虚拟机标志_《Java虚拟机原理图解》1.3、class文件中的访问标志、类索引、父类索引、接口索引集合...
  8. 通俗易懂的Monte Carlo积分方法(二)
  9. webRTC之Mesh/MCU/SFU通信架构区别(九)
  10. C++ vector和set的区别
  11. 散粉在哪个步骤用_平时用的散粉除了所谓的定妆,还有这么多好处啊?
  12. 统计学——线性回归决定系数R2
  13. CloudDrive — 将阿里云盘变成电脑本地磁盘,网盘挂载映射为本地磁盘!
  14. 2019 美团校招笔试题 外卖满减
  15. python和selenium爬虫,网页表格下载自动化脚本
  16. OpenGL入门教程之 深入理解
  17. 爬虫数据储存—CSV文件
  18. mysql将没有员工的部门都删除_Mysql 用sql语句实现删除与CLARK同部门的员工信息...
  19. Svchost.exe 程序占用CPU高
  20. git文件共享_与Git共享文件

热门文章

  1. 应避免在强磁场干扰下使用计算机,2016年计算机二级office高级应用考试题
  2. MySQL 错误:2003 - Can‘t connect to MySQL server on ‘localhost‘ (10061 “Unknown error“)
  3. android仿支付提现功能,Android应用开发Android 仿微信支付密码界面
  4. 发布一个收藏的XML处理类
  5. 基于VLC实现RTSP推流桌面(共享桌面)
  6. 校园无线网络服务器,某校园无线网络覆盖设计方案.doc
  7. 文本框控件TextBox(文本类控件)
  8. MATLAB程序设计与应用刘卫国(第三版)课后实验答案——6
  9. Git版本控制管理——合并
  10. 统计学--基于R(第3版)(基于R应用的统计学丛书)作者:贾俊平 习题答案 第七章