一、引言

预设的知识储备要求:数学(微积分、线性代数、机率);编程能力(读写python)

这门课专注在 深度学习领域deep learning,

事实上深度学习在今天的整个机器学习(ML)的领域使用非常广泛,可以说是最受重视的一项ML技术。

这门课可以作为你的机器学习的第一堂课,修完后可以更深入的把这个技术,用在你未来感兴趣的领域。

课程录像和作业:

如果 只凭google colab可以取得及格的成绩,基本上如果有越多的运算资源,越有机会在这门课取得比较好的成绩。

要做机器学习、尤其是深度学习相关的任务,运算资源往往是非常重要的。


二、【生成式AI】ChatGPT原理剖析

2022.11.30,被公开

1. 对ChatGPT的常见误解:

输出机率分布,之后取样

2. Chat-GPT怎么被训练出来的:(原理)

Chat-GPT背后的关键技术:预训练(Pre-train)。又叫督导式学习(Self-supervised Learning)、基石模型(Foundation Model)

一般机器是怎样学习的? 督导式学习

怎么通过成对资料(督导式学习),机器自动寻找函式f,本课程后面会学习。

但仅仅这样做,能力很有限,因为成对资料非常有限。

ChatGPT的前身GPT,就是单纯从网络上大量资料来学习做文字接龙。

GPT一代没有受到什么关注。

GPT-2可以 说一段话给他,他就开始瞎掰、并且像模像样。这种能力今天看起来很正常,但当时让学界震惊。

测试在CoQA问答资料集上,具备了一定回答问题的能力。

openAI官方说: 拿GPT3做一些微调 都叫GPT3.5,并不是特指某个模型。

GPT3(2020)是来自“暗黑大陆”的模型,因为实在太过巨大。

参数量越高、模型表现越好。

但是GPT3有非常明显的能力上限 。

很多时候GPT3不受控,给的答案不一定是我们想要的。

强化GPT3的能力:人工介入。 ----->  加入督导式学习 ChatGPT

李老师个人猜测,没有用翻译引擎。因为:

multi-Bert也是一个自督导式的预训练模型,在GPT前非常热门的模型。

下面这个实验是测试在DRCD中文阅读能力理解测验资料库上。

在机器心里把所有人类的语言都内化成同一种语言(自己的语言)。

总结: ChatGPT是在自督导式学习/预训练/基石模型的基础上,加入微调(finetune)/督导式学习,再加上RL(ppo算法)。

适用增强式学习的情况,1)想偷懒时,更容易搜集更多资料。2)人类自己都不知道答案时。

很多时候问ChatGPT问题,他给的答案非常棒,不太像在做文字接龙,是因为你问的问题,人类老师都教过了。

如果问一些莫名其妙的问题:

3. ChatGPT带来的新的研究问题

ChatGPT的出现,对自然语言处理相关研究带来蛮大的打击。

未来可能会被重视的研究方向:

1)如何精准提出需求

需要好好调教他,不然不像在聊天。

需要精确提出需求,(”催眠“,Prompting):

  • 想象你是我的朋友----让他讲话更像人
  • 要求中文回答
  • 请试着跟我聊聊--- 这样他才会反问你问题,不会一直句号。
  • 现在我们开始--- 这句话还挺重要的,不讲有时候他不知道你要开始了。

网络上有很多”调教指南“,都是乡民试出来的,不一定是最好的,未来会有一系列的研究,用更系统化的方法自动找出催眠指令。

2)【Neutral Editing

3.) 侦测AI生成的物件

李老师 没有把握chatGPT生成的答案的diversity有多大。

这类的工具如果是可以轻易取用的,应该是需要被学习的内容。

4.)不小心泄露机密?

chatGPT口风不紧, 可以像小孩一样,绕圈骗他。

不过这个地址是错的

李宏毅2023春季机器学习笔记 - 01生成AI(ChatGPT)相关推荐

  1. 李宏毅2023春季机器学习课程

    目录 2021&2022课程 重磅须知 我维护的其他项目 更新日志 课程地址 课程资料直链 课程作业直链 其他优质课程 2021&2022课程 CSDN Github 重磅须知 为方便 ...

  2. 李宏毅2021春季机器学习课程视频笔记1:Introduction, Colab PyTorch Tutorials, HW1

    诸神缄默不语-个人CSDN博文目录 李宏毅2021春季机器学习课程视频笔记集合 VX号"PolarisRisingWar"可直接搜索添加作者好友讨论. 更新日志: 2021.11. ...

  3. 1-2 李宏毅2021春季机器学习教程-第一节(下)-深度学习基本概念简介

    上篇文章1-1 李宏毅2021春季机器学习教程-第一节(上)-机器学习基本概念简介介绍了回归的一些知识,重点介绍了机器学习寻找函式的三个步骤.接着我们继续学习第一节Introduction的内容. 目 ...

  4. 1-4 李宏毅2021春季机器学习教程-PyTorch教学-助教许湛然

    1-3 李宏毅2021春季机器学习教程-Google Colab教学-助教许湛然介绍了Colab的使用,这篇文章是助教许湛然关于PyTorch框架的简要讲解. 更多操作查看: https://pyto ...

  5. 2-1 李宏毅2021春季机器学习教程-第二节机器学习任务攻略

    之前的学习简要介绍了机器学习和深度学习的相关概念,上一篇文章李宏毅2021春季机器学习教程HW1-COVID-19 Cases Prediction (Regression)解答有关于HW1的解答,接 ...

  6. 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:3/24机器如何生成图像

    目录 3/24 机器如何生成图像 速览图像生成常见模型 浅谈图像生成模型 Diffusion Model 原理 Stable Diffusion.DALL-E.Imagen 背后共同的套路 Varia ...

  7. 李宏毅2021春季机器学习课程视频笔记14-Transformer

    Transformer Transformer实际上就是变形金刚,其与Bert实际类似.其实际上就是一个Sequence-to-Sequence的模型,其输出的长度并不是由人为指定,而是由机器自行确定 ...

  8. 李宏毅2021春季机器学习课程视频笔记11-卷积伸进网络(CNN)

    卷积神经网络架构 图像识别 将图片拉直放入神经网络中进行训练. 网络通过对图像中的存在的特征进行分析,判断当前属于何种类别. 神经网络其实不需要对整个图片进行分析,只需要对一些特殊的信息进行分析就可以 ...

  9. 1-3 李宏毅2021春季机器学习教程-Google Colab教学-助教许湛然

    李宏毅老师的课程会配合着助教的讲解,也很有帮助.这堂课介绍一个可运行python代码的浏览器Colaboratory(简写为"Colab"). Colab具有以下特性: 零配置要求 ...

最新文章

  1. windows 检查cuda安装_Windows环境CUDA 4.0:安装与验证
  2. 关于公示2019年度智源青年科学家征集评选结果的通知
  3. CentOS安装jdk和tomcat
  4. php一对多聊天程序代码,微信小程序实现一对多发消息
  5. jshell_五分钟的JShell
  6. java azure blobs sas_使用 Java 的 Azure 存储示例 | Azure Docs
  7. maven多个子项目、父项目之间的引用问题
  8. Netty工作笔记0008---NIO的Buffer的机制及子类
  9. 制作可以 SSH 登录的 Docker 镜像
  10. 成都Uber优步司机奖励政策(1月16日)
  11. 基于STM32F4系列 之 霍尔编码器减速直流电机
  12. 松下TDA-200开启呼叫转移功能
  13. 软件测试的度量方法包括,软件测试过程的度量
  14. iOS- 网络访问JSON数据类型与XML数据类型的实现思路及它们之间的区别
  15. 免费把你的 GoogleDrive 和 OneDrive 变成 CDN
  16. Android View简易生成Pdf
  17. opengl碗状_OpenGLES简单入门
  18. 4.2nbsp;反身理论与均衡价格论
  19. 产品经理如何开好需求评审会
  20. Greenplum Python专用库gppylib学习——base.py

热门文章

  1. 概率密度函数、概率函数、概率分布函数和积分等的一些概念
  2. 【Kotlin入门教程】史上最全最易于理解最全面的文章
  3. win7系统 修改默认管理员用户名administrator方法
  4. 如何通过ps把彩色照片转换为黑白素描
  5. python学多久可以考二级建造师吗_没有基础。学多久能过二级建造师
  6. 计算机毕业设计ssm+vue基本微信小程序的“香草屋”饮料奶茶点单小程序
  7. IOS模拟用户触发各种事件
  8. 比周黑鸭与绝味食品更早上市的煌上煌,为何掉队了?
  9. 飞塔防火墙之ACL配置
  10. 表达的方式:评价很让人难受