李宏毅机器学习01:机器学习介绍 Introduction

文章目录

  • 李宏毅机器学习01:机器学习介绍 Introduction
    • 一、机器学习步骤
    • 二、机器学习框架
    • 三、机器学习学习地图
      • (一)Learning Theory
        • 1.Supervised Learning 监督学习
        • 2.Semi-supervised Learning 半监督学习
        • 3.Transfer Learning 迁移学习
        • 4.Unsupervised Learning 无监督学习
        • 5.Reinforcement Learning 强化学习
        • Structured Learning 结构化学习(监督学习中的结构化学习)
      • (二)Model
    • 四、总结

一、机器学习步骤

Machine Learning ≈ Looking for a Function

  • Step 1: define a set of function
  • Step 2: goodness of function
  • Step 3: pick the best function

二、机器学习框架

三、机器学习学习地图

(一)Learning Theory

1.Supervised Learning 监督学习

  • 回归Regression

Regression是一种machine learning的task,当我们说:我们要做regression时的意思是,machine找到的function,它的输出是一个scalar,这个叫做regression。举例来说,在作业一里面,我们会要你做PM2.5的预测(比如说预测明天上午的PM2.5) ,也就是说你要找一个function,这个function的输出是未来某一个时间PM2.5的一个数值,这个是一个regression的问题。
机器要判断function明天上午的PM2.5输出,你要提供给它一些资讯,它才能够猜出明天上午的PM2.5。你给他资讯可能是今天上的PM2.5、昨天上午的PM2.5等等。这是一个function,它吃我们给它过去PM2.5的资料,它输出的是预测未来的PM2.5。

  • 分类Classification

Regression和Classification的差别就是我们要机器输出的东西的类型是不一样。在Regression中机器输出的是一个数值,在Classification里面机器输出的是类别。假设Classification问题分成两种,一种叫做二分类输出的是是或否(Yes or No);另一类叫做多分类(Multi-class),在Multi-class中是让机器做一个选择题,等于是给他数个选项,每个选项都是一个类别,让他从数个类别里选择正确的类别。

2.Semi-supervised Learning 半监督学习

监督学习的问题是我们需要大量的training data。training data告诉我们要找的function的input和output之间的关系。如果我们在监督学习下进行学习,我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的output叫做label。
那有没有办法减少label需要的量呢?就是半监督学习。
假设你先想让机器鉴别猫狗的不同。你想做一个分类器让它告诉你,图片上是猫还是狗。你有少量的猫和狗的labelled data,但是同时你又有大量的Unlabeled data,但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中,这些没有label的data,他可能也是对学习有帮助。这个我们之后会讲为什么这些没有label的data对学习会有帮助。

3.Transfer Learning 迁移学习

另外一个减少data用量的方向是迁移学习。
迁移学习的意思是:假设我们要做猫和狗的分类问题,我们也一样,只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么特别的关系的,我们要分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片还是动画图片你有这一大堆不相干的图片,它到底可以带来什么帮助。这个就是迁移学习要讲的问题。

4.Unsupervised Learning 无监督学习

更加进阶的就是无监督学习,我们希望机器可以学到无师自通。
如果在完全没有任何label的情况下,到底机器可以学到什么样的事情。举例来说,假设我们今天带机器去动物园让它看一大堆的动物,它能不能够在看了一大堆动物以后,它就学会自己创造一些动物。那这个都是真实例子。仔细看了大量的动物以后,它就可以自己的画一些狗出来。有眼睛长在身上的狗、还有乳牛狗等等。
这个Task也是一个无监督学习的问题,这个function的输入不知道是什么,可能是某一个code代表要输出图片的特性,输出是一张图片。你给机器看到的只有非常大量的图片,只有function的input,没有output。机器要如何生成新的图片,这是我们后面要解决的问题。

5.Reinforcement Learning 强化学习

reinforcement learning是什么呢?在reinforcement learning里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。若我们现在要用reinforcement learning方法来训练一个聊天机器人的话,他训练的方法会是这样:你就把机器发到线下,让他的和面进来的客人对话,然后想了半天以后呢,最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。机器要在reinforcement learning的情况下学习,机器是非常intelligence的。
监督学习:learning form teacher
强化学习:learning form critics

Structured Learning 结构化学习(监督学习中的结构化学习)

structured learning 中让机器输出的是要有结构性的,举例来说:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话,你输入中文希望机器翻成英文,它的输出也是有结构性的。或者你今天要做的是人脸辨识,来给机器看张图片。然后机器要把目标标出来,这也是一个structure learning问题。

其实多数人可能都听过regression,也听过classification,你可能不见得听过structure learning。很多教科书都直接说,machine learning是两大类的问题,regression,和classification。machine learning只有regression和classification两类问题,就好像告诉你:我们所熟知的世界只有五大洲,但是这只是真实世界的一小部分,真正的世界是如图所示。真正世界还应该包括structure learning,这里面还有很多问题是没有探究的。

(二)Model

  • 1.Linear Model 线性模型
  • 2.Non-linear Model 非线性模型

四、总结

【知识索引】【李宏毅机器学习】

【李宏毅机器学习】01:机器学习介绍 Introduction相关推荐

  1. 李宏毅机器学习01机器学习介绍

    机器学习介绍 机器学习与人工智慧 人工智慧(AI).Artificial Intelligence是我们想要达成的目标,而机器学习是想要达成目标的手段,希望机器通过学习方式,他跟人一样聪明. 深度学习 ...

  2. 李宏毅老师2022机器学习课程笔记 01 Introduction of Deep Learning

    01 Introduction of Deep Learning 机器学习相关规定 什么是机器学习 机器学习的概念 我觉得李老师讲得非常好的一点就是,他真正说清楚了机器学习中的一些因果逻辑. 比如我之 ...

  3. 李宏毅2021春季机器学习课程视频笔记1:Introduction, Colab PyTorch Tutorials, HW1

    诸神缄默不语-个人CSDN博文目录 李宏毅2021春季机器学习课程视频笔记集合 VX号"PolarisRisingWar"可直接搜索添加作者好友讨论. 更新日志: 2021.11. ...

  4. [李宏毅机器学习2020笔记] 1.introduction

    1. 基本概念 ⚪李宏毅老师眼中机器学习的定义--自动找函数 无论是监督学习.非监督学习.强化学习 都是某种信息或者情境到一种结果的映射 ⚪根据函数映射结果的离散性和连续性,可以分为分类和回归问题 c ...

  5. 李宏毅老师《机器学习》课程笔记-6 GAN

    注:本文是我学习李宏毅老师<机器学习>课程 2021/2022 的笔记(课程网站 ),文中图片均来自课程 PPT.欢迎交流和多多指教,谢谢! 6 Unsupervised Learning ...

  6. 1-2 李宏毅2021春季机器学习教程-第一节(下)-深度学习基本概念简介

    上篇文章1-1 李宏毅2021春季机器学习教程-第一节(上)-机器学习基本概念简介介绍了回归的一些知识,重点介绍了机器学习寻找函式的三个步骤.接着我们继续学习第一节Introduction的内容. 目 ...

  7. 李宏毅2023春季机器学习课程

    目录 2021&2022课程 重磅须知 我维护的其他项目 更新日志 课程地址 课程资料直链 课程作业直链 其他优质课程 2021&2022课程 CSDN Github 重磅须知 为方便 ...

  8. 李宏毅老师《机器学习》课程笔记-5 Transformer

    注:本文是我学习李宏毅老师<机器学习>课程 2021/2022 的笔记(课程网站 ),文中图片除一张来自 transformer论文,其余均来自课程 PPT.欢迎交流和多多指教,谢谢! L ...

  9. 李宏毅老师《机器学习》课程笔记-3卷积神经网络

    注:本文是我学习李宏毅老师<机器学习>课程 2021/2022 的笔记(课程网站 ),文中图片除了一幅我自己绘制的图和一幅来自 Stanford cs231n 教程的图,其余图片均来自课程 ...

最新文章

  1. lda主题模型的可视化_把LDA主题模型作为自己的硕士课题,有什么可以做的?
  2. java的异常抛出throws和throw的简单使用
  3. 测试服务搭建之centos7下安装java
  4. sniffer使用查网络故障
  5. 【点击模型学习笔记】Predicting Clicks_Estimating the Click-Through Rate for New Ads_MS_www2007...
  6. VTK:可视化算法之FlyingHeadSlice
  7. html5游戏引擎-Pharse.js学习笔记(一)
  8. Loj#3077-「2019 集训队互测 Day 4」绝目编诗【结论,虚树,鸽笼原理】
  9. jsf集成spring_JSF – PrimeFaces和Hibernate集成项目
  10. 运算符面试题(剑指offer,面试宝典,牛客网)
  11. 【OpenCV 例程200篇】59. 非线性滤波—双边滤波
  12. 第六章 软件项目质量管理
  13. 共识算法-PoW(工作量证明)算法
  14. 6阶群的非平凡子群_子群和Lagrange定理
  15. MySQL数据库,创建表空间
  16. ORB-SLAM2-----Frame()
  17. 很多我们以为一辈子都不会忘记的事情,就在我们念念不忘的日子里,被我们遗忘了。
  18. 计算机专业需要用独显吗,集显 or 独显 我的程序用哪个必须由我定
  19. 汽车 Flexry总线-笔记
  20. 消防装备管理系统软件信息化解决方案

热门文章

  1. Hls之播放遇到的坑
  2. educoder 初始mongodb
  3. 华为南太无线解决方案部梁旭阳_华为“测温”手机申请了专利,华为今年共申请了 8,607 项无线专利...
  4. Android Studio如何查找和替换
  5. Qt使用Qtxlsx读写xlsx文件
  6. 2017交大计算机专业分数线,2017上海交大录取分数线历年录取分(2)
  7. php中unset函数是在哪一章_PHP引用(amp;)使用详解
  8. espresso java_java – Espresso单击菜单项
  9. 获取当前html的名字,c#获取当前页面名字
  10. 创建一个滚动的文本字幕。