文 | 小戏
编 | 小轶

GPT3终于开源!不过,不是官方开的(别打我

Eleuther AI推出的名为GPT-Neo的开源项目,于今晨4点于twitter正式宣布:已经开源了复现版GPT-3的模型参数(1.3B和2.7B级别),并将其更新在Colab notebook之上。需要指出的是这次开源的模型里较大的那个版本也只是到了GPT-3商用版里最小模型的参数量,不过Eleuther AI表示未来会进一步开源10B版本和原始大小版本的GPT3模型参数

消息发布后,立刻被各个大v转发,10小时内就已迅速收获1.5K的点赞量,相应的github链接也已收获接近2k star。

▲Twitter原文

▲相应Github项目已收获近2k star

但关于复现模型的性能,目前只说“实验表现与原版GPT-3相当”(they performed on par)。具体实验结果将于明天公布。

风靡一时的拥有1750亿超大参数量,一出道便被视作NLP领域最强AI模型的GPT-3,得益于其庞大的参数量,使得GPT-3拥有不用接受特定训练与微调,就能在不同NLP领域达到领先水平的强大能力。去年七月,GPT-3被Open-AI以商业API的形式向公众开放,并被人们探索出了形形色色的应用,从基于问题的搜索,到文本样式转换,从UI界面设计,再到自动生成SQL代码,GPT-3以其卓越的性能展现了其广阔的应用场景,深度学习之父Hinton甚至这样评价道:

如果以GPT-3的出色性能推算未来、生命、宇宙和万物的答案也不过是4.398万亿个参数

但是,由于目前GPT-3的使用模式仍然是付费的商业API,因此并不是所有NLP的研究者都能使用GPT-3完成自己领域的任务与工作。而由Connor Leahy,Leo Gao和Sid Black三人联合创立的Eleuther AI的团队,于去年11月宣布推出GPT-Neo的开源项目,该项目基于GPT系列的设计原理,旨在复现GPT系列的各种项目,在该项目发布之初,其团队成员已经预测可以完成GPT-3级别大小的语言模型。

毫无疑问,GPT-3的开源将会催生出一大批NLP技术的崭新应用,也会以更为低廉的成本释放人们对NLP未来的想象力。以下是项目的Github与推特原文地址。

Github:
https://github.com/EleutherAI/gpt-neo/

Twitter:
https://twitter.com/arankomatsuzaki/status/1373732645444579331?s=05


往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑
本站qq群851320808,加入微信群请扫码:

【NLP】千呼万唤始出来——GPT-3终于开源!相关推荐

  1. 各种NLP操作难实现?谷歌开源序列建模框架Lingvo

    各种NLP操作难实现?谷歌开源序列建模框架Lingvo 自然语言处理在过去一年取得了很大进步,但直接关注 NLP 或序列建模的框架还很少.本文介绍了谷歌开源的 Lingvo,它是一种建立在 Tenso ...

  2. Oracle 要慌了!华为终于开源了自家的 Huawei JDK——毕昇 JDK!

    点击上方 好好学java ,选择 星标 公众号 重磅资讯.干货,第一时间送达 今日推荐:硬刚一周,3W字总结,一年的经验告诉你如何准备校招! 个人原创100W+访问量博客:点击前往,查看更多 没错,自 ...

  3. 最强 NLP 预训练模型库 PyTorch-Transformers 正式开源:支持 6 个预训练框架,27 个预训练模型...

    先上开源地址: https://github.com/huggingface/pytorch-transformers#quick-tour 官网: https://huggingface.co/py ...

  4. Swift For TensorFlow终于开源,但先别急着用

    问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 上个月底的TensorFlow开发者峰会上,Google宣布将在四月开源发布Swift for TensorFlow. 就在这个月即将过去的 ...

  5. .NET Framework终于开源了!

    期待已久的.NET Framework终于在本周开源了,微软在MS-RL协议下终于公开了.NET Framework源代码,我们只可以自由查看,不允许直接进行修改.第一批开放的源代码包括: .NET基 ...

  6. N 年沉淀,腾讯这套系统终于开源!

    大家好,我是鱼皮,前段时间给大家介绍了字节跳动开源的两套设计系统,分别是 Arco Design 和抖音 Semi Design. 而就在几天前,腾讯终于也开源了自家的设计系统 TDesgin !这次 ...

  7. EfficientDet目标检测谷歌官方终于开源了!

    EfficientDet是谷歌大脑于去年11月份公布的目标检测算法族,涵盖轻量级到高精度的多个模型,COCO数据集上达到 50.9 mAP,一经推出便获得了大量关注! 因为结果吸引人,Github上已 ...

  8. 【NLP】OpenAI GPT算法理解

    论文<Improving Language Understanding by Generative Pre-Training> Pytorch代码实现: huggingface/pytor ...

  9. 久等了,改造版阿里 sentinel 控制台终于开源了

    附面试思维导图: 近几天,好几个小伙伴在后台询问,改造后的 sentinel-dashboard 什么时候开源.讲真,不是不想给大家放出来,是因为一些地方还没有完善好,怕误导了大家,在经过了一个星期业 ...

  10. [导入].NET Framework终于开源了!

    摘要: 期待已久的.NET Framework终于在本周开源了,微软在MS-RL协议下终于公开了.NET Framework源代码,我们只可以自由查看,不允许直接进行修改.第一批开放的源代码包括: . ...

最新文章

  1. Hibernate 乐观锁和悲观锁
  2. 高阶程序员之路-轻松学习分布式锁
  3. Python:值传递,引用传递?不存在的,是赋值传递
  4. DBLINK 无统计信息导致SQL变慢
  5. 几何画板200个经典课件_动态几何画板 Geogebra
  6. 只读副本和Spring Data第2部分:配置基础项目
  7. Leetcode刷题实战(1):Two Sum
  8. Leetcode每日一题:222.count-complete-tree-nodes(完全二叉树的节点个数)
  9. 百战程序员-人工智能从入门到开发教程(60万下载量)
  10. 门禁卡读写器—把手机秒变门禁卡与自己复制门禁卡
  11. arcgis语言如何中文改英文_ArcGIS的概述及中英文切换——附GIS名词解释大全(一)...
  12. 创意欣赏:国外35个独特的露天广告牌设计
  13. word排版案例报告_轻松搞定论文格式,这是 Word 排版的正确姿势
  14. 我说Java完全面向对象,老大过来就是一jio
  15. 线程Signaled nonsignaled状态的意思
  16. 观念理解论创业设计思维
  17. 高德地图placesearch 搜索结果生成自定义marker
  18. 电脑上如何操作Android手机
  19. PG学习笔记(1)—— 主从复制:流复制
  20. grant all privileges on

热门文章

  1. 异数OS 星星之火(一)-- 异数OS-织梦师云 用户使用手册
  2. 天使轮、A轮、B轮、C轮、D轮融资 究竟是什么?
  3. Android重新分区parted,使用parted划分GPT分区
  4. 关于计算机教学的论文,关于计算机教学论文.docx
  5. 马云在大学学计算机,IT大佬高考成绩单:李彦宏是状元 马云数学仅1分
  6. Cannot determine archive format of /tmp/pip-req-build-
  7. 图片大小怎么调整?图片怎么改尺寸?
  8. Offset is outside the bounds of the DataView
  9. python使用selenium模拟浏览器进入好友QQ空间留言
  10. Ambisonics声音格式及麦克