前情提要

论文名称: Language Models are Few-shot learners

但是GPT-3的缺点在于,太过巨大! 它有多大呢? 原来最大的时候是Turing NLG,有17B,而GPT-3是它的10倍!

对GPT-3的评价:

GPT-3要干什么事呢? 它是为了ZERO-shot的learning! 所以你现在要训练你的BERT还是需要训练一些资料的! 而GPT-3的目的就是说不再需要fine-tune,直接一个模型就解决所有!!!

GPT系列的野望

就是给出你问题,你在读了问题后就知道怎么解答这个试题!

具体一点,该模型主要做了三个事! GPT-3的目的直接zero-shot,而不需要例子,只需要给出描述就可以了! 在论文中就叫做“In-context” learning!!

后面这个是GPT系列的准确率! 准确率是提高了,但是这种复杂度的提高值不值得就另当别论了!

应用

CLosed Book QA

就是说不需要读特定的文章就可以回答问题! GPT-3的效果可以超过经过Fine-tuned的最好性能!

SuperGLUE上

效果也是还行的

Generated new articles

只给出标题来生成文章! 横轴是参数的量,纵轴是准确率,就是能够骗过模型的准确率!准确率越低,说明人分辨生成的新闻能力越差!

造句

数学问题

后面都是表现差的例子:

NLI(就是输入两个句子,看这两个句子是不是有矛盾)

Turing Advice Challenge

这是一个比赛,让看模型理解人的语言到什么程度! 内容一般是一个人提出自己的生活中的问题,然后让机器人回答怎么解决!

可以看到生成可用建议的准确度还不是很高! 只有9%,就算最好40%

图像上的应用: gpt: raster order

就是让图像自己有创造力,自己创造故事!

李宏毅机器学习(十)GPT-3相关推荐

  1. 李宏毅机器学习--self-supervised:BERT、GPT、Auto-encoder

    目录 Self-Supervised Learning BERT BERT训练 masking input(随机遮盖一些输入单位) next sentence prediction(预测前后两个句子是 ...

  2. 2018-3-21李宏毅机器学习视频笔记(十二)--Backpropagation

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=14 复合函数求偏 ...

  3. 2018-3-20李宏毅机器学习笔记十----------Logistic Regression

    上节讲到:既然是一个直线型,只需要求解w和b.为何还要那么费劲的使用概率??? 视频:李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilib ...

  4. 资料分享:推荐一本《李宏毅机器学习》开源电子书!

    背景 今天在 github 上看到了 datawhale 发布的 李宏毅机器学习笔记. https://datawhalechina.github.io/leeml-notes 其目录如下: P1 机 ...

  5. python线性回归预测pm2.5_线性回归预测PM2.5----台大李宏毅机器学习作业1(HW1)

    一.作业说明 给定训练集train.csv,要求根据前9个小时的空气监测情况预测第10个小时的PM2.5含量. 训练集介绍: (1).CSV文件,包含台湾丰原地区240天的气象观测资料(取每个月前20 ...

  6. 李宏毅机器学习—读书笔记

    李宏毅机器学习笔记(LeeML-Notes) leeml-notes 机器学习 人工智慧(Artificial Intelligence)是我们想要达成的目标,希望机器可以跟人一样的聪明.机器学习(M ...

  7. 2021李宏毅机器学习笔记--21 Anomaly Detection

    2021李宏毅机器学习笔记--21 Anomaly Detection(异常侦测) 摘要 一.问题描述 二.Anomaly异常 三.Anomaly Detection(异常侦测)做法 3.1 Bina ...

  8. 【组队学习】【31期】李宏毅机器学习(含深度学习)

    李宏毅机器学习(含深度学习) 航路开辟者:王茂霖.陈安东,刘峥嵘,李玲 领航员:张菘淳 航海士:王茂霖.吴振一 基本信息 开源内容:https://github.com/datawhalechina/ ...

  9. 李宏毅机器学习HW1

    本博文主要是完成李宏毅机器学习HW1作业 作业连接:https://ntumlta2019.github.io/ml-web-hw1/ 作业规则 所有代码必须用python3.6编写 允许所有pyth ...

  10. ⭐李宏毅机器学习2020作业汇总

    更新进度:■■■■■□□□□□□□□□□□□□□□|30% 李宏毅机器学习code 序号 主题 完成情况 作业一 Linear Regression ✅ 作业二 Classification ✅ 作业 ...

最新文章

  1. ospf 环回口的路由条目_OSPF的LSA类型
  2. HDU 1253-大逃亡(裸-DBFS)
  3. Redash 9安装与配置(基于Docker方式)
  4. PythonR语言-python和r相遇
  5. 【Todo】Java类型转换总结
  6. 如何制作媲美memz的炫酷特效恶搞程序
  7. 那些年我们一起上过的黑客网站
  8. Excel表格匹配合并
  9. 刷题——求斐波那契数列的第n项(迭代)
  10. 网页龙虎游戏有服务器吗,完美《梦幻诛仙2》今日公测 首开五大新服
  11. 过压电路保护元器件详解,一文就看明白了
  12. 利用python绘制自定义棋盘格
  13. 视觉SLAM十四讲学习第二部分(ch7-ch14)
  14. HanLP --- 依存句法分析
  15. 最佳助攻!25款轻巧实用的SKETCH插件大合集
  16. 使用OmicShare Tools做权重网络图
  17. HomeAssistant(Hass.io)系统安装
  18. 计算机专业本科考教资可以考哪些,高中教师资格证计算机专业考什么内容
  19. 从autojs到冰狐智能辅助的心里历程
  20. 为知笔记有linux版本吗,为知笔记Linux版

热门文章

  1. IOS开发之格式化日期时间
  2. UVa 11636 Hello World!
  3. WCF分布式开发步步为赢系列
  4. 02. Creating a Web Forms User Interface
  5. 这两种printf()函数重定向方法,太实用了
  6. 怎么把一个bool数组转成char?
  7. linux查看wifi信号命令_使用Nmcli命令从Linux终端连接WiFi
  8. 每日一题(5) —— 逗号表达式
  9. Linux C高级编程——网络编程之TCP(3)
  10. C语言中的转义字符【转ce123的技术博客】