前情提要

前面我们有说,BERT做的是什么? Bert做的是填空题! GPT做的是什么? 做的是预测接下来要出现的Token是什么? 它里面的结构有点像Transformer中的Decoder

GPT最有名的就是生成了一个关于独角兽的假新闻! 同时也说明了它的作用就是可以写出一个文章

GPT系列很难去训练,因为太大了,也很难去fine-tune! 但是GPT有一个很狂的想法: 就是说我们只给你少量或者没有参考样本,在给出你提示后,让你去学习出正确的答案!

给出了42个任务! 这些是42个任务的准确率!

Beyond Text

当然也可以用在不同的领域上了!

Image

BYOL:Bootstrap Your Own Latent(不知道为什么会Work! Deep learning的神奇)
SimCLR

Speech

Audio Version/Bert 也可以补全语音

Speech GLUE- SUPERB

这是各种Self-supervised的模型!

李宏毅机器学习(七)GPT的野望相关推荐

  1. 李宏毅机器学习--self-supervised:BERT、GPT、Auto-encoder

    目录 Self-Supervised Learning BERT BERT训练 masking input(随机遮盖一些输入单位) next sentence prediction(预测前后两个句子是 ...

  2. 201-3-19李宏毅机器学习视频笔记七(游戏解释Gradient Descent)

    视频部分: 视频7:使用帝国时代游戏解释Gradient Descent 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.co ...

  3. 资料分享:推荐一本《李宏毅机器学习》开源电子书!

    背景 今天在 github 上看到了 datawhale 发布的 李宏毅机器学习笔记. https://datawhalechina.github.io/leeml-notes 其目录如下: P1 机 ...

  4. 【李宏毅机器学习】Classification_1 分类(p10) 学习笔记

    李宏毅机器学习学习笔记汇总 课程链接 文章目录 Classification Probabilistic Gernerative Model 分类:概率遗传模型 ==**如何完成这个任务?**== = ...

  5. 李宏毅机器学习—读书笔记

    李宏毅机器学习笔记(LeeML-Notes) leeml-notes 机器学习 人工智慧(Artificial Intelligence)是我们想要达成的目标,希望机器可以跟人一样的聪明.机器学习(M ...

  6. 2021李宏毅机器学习笔记--21 Anomaly Detection

    2021李宏毅机器学习笔记--21 Anomaly Detection(异常侦测) 摘要 一.问题描述 二.Anomaly异常 三.Anomaly Detection(异常侦测)做法 3.1 Bina ...

  7. 【李宏毅机器学习CP1-3】(task1)机器学习简介分类|回归

    文章目录 1.机器学习的过程 2.机器学习相关分类 3.选择合适的model,loss function 4.CP3 一.回归定义和应用例子 回归定义 应用举例 二.模型步骤 Step 1:模型假设 ...

  8. 【李宏毅机器学习CP21】(task6)卷积神经网络

    学习心得/总结 (1)CNN误差反向传播的细节可以参考<深度学习的数学>P200的5.5部分,还没看.task3的食物图片分类作业还在做--[李宏毅机器学习2021]卷积神经网络HW3-I ...

  9. ⭐李宏毅机器学习2020作业汇总

    更新进度:■■■■■□□□□□□□□□□□□□□□|30% 李宏毅机器学习code 序号 主题 完成情况 作业一 Linear Regression ✅ 作业二 Classification ✅ 作业 ...

  10. 2018-3-21李宏毅机器学习视频笔记(十二)--Backpropagation

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=14 复合函数求偏 ...

最新文章

  1. 【Https异常】This request has been blocked; the content must be served over HTTPS
  2. 超图使用服务管理页面发布服务图解
  3. python 赋值 浅copy_python – 浅拷贝,deepcopy和正常赋值操作之间的区别是什么?
  4. java xml 反射_java使用dom4j解析xml配置文件实现抽象工厂反射示例
  5. P4173 残缺的字符串
  6. Google的面试题长啥样
  7. spring environment_程序员:Spring项目中简单几步实现多个动态数据源切换
  8. SQLServer查询表结构
  9. 在hibernate框架中配置显示sql语句
  10. 记录——《C Primer Plus (第五版)》第十章编程练习第三题
  11. python数据清洗 - Numpy库
  12. PCB Layout 中的直角走线、差分走线和蛇形线
  13. linux怎么运行idl,科学网—在Scientific linux 7上安装idl83 - 姜小川的博文
  14. mysql 易语言 邮件_易语言实现163邮箱登录获取邮件列表等操作的代码
  15. Navicat 常见操作
  16. 网络安全与计算机信息管理论文,计算机信息管理技术在网络安全的应用论文
  17. 大数据联姻“互联网+”驱动绿色变革
  18. 铁柱学习node.js
  19. 2022年执法资格刑侦执法考试多选题专项训练题及答案
  20. ajax接口写法,ajax 请求常用写法

热门文章

  1. 【BZOJ 3191】[JLOI2013]卡牌游戏
  2. STM32的RTC万年历显示问题
  3. bzoj 1036 树的统计Count
  4. 初学Struts遇到的坑爹问题
  5. [转载]WebBrowser知识
  6. 多线程死锁及解决办法
  7. 书中自有黄金屋~外加中奖结果通知
  8. RK3288/RK3399 CPU定频方法
  9. html5 网络断开,html5 – websocket不断断开连接
  10. break lab c语言,C语言实验lab10.doc