Lecture 3 Types Of Learning 学习的类型

ppt

3.1 Learning with Different Output Space YYY 根据不同的输出空间学习

  • 分类分析:二元分类、多元分类
  • 回归分析:输出是实数
  • 结构化学习

3.2 Learning with Different Data Label yn" role="presentation" style="position: relative;">ynyny_n 根据不同的y标签学习

  • 监督式学习
  • 无监督式学习
  • 半监督式学习
  • 强化学习

3.3 Learning with Different Protocol f=>(xn,yn)f=>(xn,yn)f => (x_n,y_n)

Batch Learning 成批学习

  • 成批学习是业界最普遍的机器学习方式。它是将一批xn,ynxn,yn{x_n,y_n}统统喂给学习系统,期望系统能通过学习给出一个良好的ggg。

Online Learning 在线学习

  • 与成批学习不同,在线学习是“循序”的学习。
  • 以“垃圾邮件过滤”为例,成批学习会根据所有的训练数据email,.spam?" role="presentation" style="position: relative;">email,.spam?email,.spam?{email,.spam?}对,输出一个合适的ggg。
  • 而在线学习会“循序的”
    • 拿到一个x" role="presentation" style="position: relative;">xxx,学习系统根据当前的ggg预测出相应的y" role="presentation" style="position: relative;">yyy
    • 学习系统从用户上获得yyy是否正确的反馈,用于更新自己的g" role="presentation" style="position: relative;">ggg
    • PLA和在线学习很搭
    • 强化学习一般是通过在线学习完成的
    • 在线学习中的假设ggg,通过“循序地”接收数据实例来“改进”

    Active Learning 主动学习

    • 如果说成批学习像填鸭式教育,在线学习像老师讲课那种教育,那么主动学习就是学生主动向老师问问题来获取知识的学习。
    • 也就是说,学习系统如果对某个数据实例对应的输出结果拿不准,它会主动地询问用户,这个令人疑惑的xn" role="presentation" style="position: relative;">xnxnx_n对应的ynyny_n是什么。
    • 主动学习的好处在于,它可以通过有针对性地地提问来提升ggg,同时它可以节省标签的成本。比如说给医药类数据打标签是一件十分昂贵的事情,通过主动学习可以减少给药物打标签的成本(只需要给令系统疑惑的数据打标签即可)。

    Mini Summary 简单的总结

    3.4 Learning with different input space X" role="presentation" style="position: relative;">XXX 根据不同的输入特征学习

    Concrete Features 具体特征

    • 具体的特征指,XXX的每个维度都具有复杂的物理含义。比如说年龄,性别,年收入等等,这些特征一般包含了学习任务中“人类的智慧”,即“领域知识”。
    • 使用具体的特征来进行学习,是机器学习中比较简单的学习方式。

    Raw Features 原始特征

    • 考虑一个“手写数字识别”任务,如果使用具体特征,我们可以考虑对称性、密度之类的。

      如上图所示,仅仅分类1,5两类,可以注意到1的对称性更强,密度更低。所以1的实例大部分分布在左上角,5在右下角。
      这就是根据具体特征来学习。
    • 考虑更原始的特征,即图片的像素。每张图片的分辨率都是16∗16" role="presentation" style="position: relative;">16∗1616∗1616*16,所以可以将输入图转化为一个256维的向量。每个维度的物理含义很简单,代表一个像素点。
    • 原始特征的物理含义更简单,因此机器根据原始特征进行学习过程更难。
    • 原始特征经常需要人工或机械地转化为具体特征,转化的过程叫做特征工程,深度学习也是特征工程的一种。

    Abstract Features 抽象特征

    • 抽象特征如用户id,广告id这种,几乎没有物理含义,更需要进行特征工程。

    Mini Summary 简单总结

[林轩田]机器学习基石(三)相关推荐

  1. 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...

  2. 林轩田机器学习基石(Machine Learning Foundations)笔记(一)

    要求两周之内看完林轩田机器学习基石和技法,速度是要的,但是感觉看得太快我会不久就会忘记.因此记录一下梗概,顺便写写看视频时解决的不懂的地方(有种思想就是把知识传播给更多人,有时候就是靠大佬们善意的一句 ...

  3. 台大林轩田·机器学习基石记要

    台大林轩田·机器学习基石记要 昨天开始看林轩田的机器学习基石,从今天起开始去粗取精 第一讲比较基础,一些概念自己早已经理解了,所以不再做笔记,有点印象的是讲到了ML.DL.AI的一些联系与区别,ML主 ...

  4. 台湾大学林轩田机器学习基石课程学习 笔记资料汇总

    笔记: 红色石头的专栏(写得非常好) 课后练习: 機器學習基石(Machine Learning Foundations) 机器学习基石 课后习题链接汇总 https://download.csdn. ...

  5. 机器学习系列笔记:林轩田机器学习基石——机器学习的可行性

    机器学习系列笔记:林轩田机器学习基石--机器学习的可行性

  6. 台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem

    红色石头的个人网站:redstonewill.com 最近在看NTU林轩田的<机器学习基石>课程,个人感觉讲的非常好.整个基石课程分成四个部分: When Can Machine Lear ...

  7. 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

    红色石头的个人网站:redstonewill.com 上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决.在之前的EinEinE_{in}上加上一个reg ...

  8. 台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization

    红色石头的个人网站:redstonewill.com 上节课我们介绍了过拟合发生的原因:excessive power, stochastic/deterministic noise 和limited ...

  9. 台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了分类问题的三种线性模型,可以用来解决binary classification和multiclass classificati ...

  10. 台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Logistic Regression问题,建立cross-entropy error,并提出使用梯度下降算法gradient ...

最新文章

  1. android美拍相机
  2. 1.5 对象类型转换:向上转型和向下转型
  3. dede问答模块 那个php文件相对重要,DEDE问答(ask)模块游客匿名提问和解答
  4. appium 驱动 对应9.0 系统_以后做Appium自动化测试,再也不会踩这些坑了!
  5. 简历上终于可以写“精通MySQL”!
  6. vs2017 linux工程设置头文件,使用Visual Studio 2017作为Linux C++开发工具
  7. 自定义Excel导出简易组件
  8. 绝对干货:保险公司决策分析系统建设方案
  9. 黑龙江职业学院校赛第二场题解
  10. css中背景的应用及BFC与IFC应用
  11. 快速构建express后端模版从qiya-cli开始
  12. 绝对路径与相对路径cd命令的使用
  13. 服务器不在工作_十次方:服务器租用一般有哪些品牌
  14. Win10下配置IIS并调试ASP程序
  15. 淘宝搜索页面爬取数据
  16. VMware10虚拟机请选择要安装OS X的磁盘解决方法
  17. usb3.0 驱动安装方法
  18. 微信小程序 点击展开收起(点谁谁展开/收起)
  19. linux(centos7)测试带宽
  20. python-关于时间处理的知识

热门文章

  1. oki5530sc打印错误_四通OKI5530常见故障分析
  2. Typora简易教程
  3. 解决VB6控件对象库未注册的问题
  4. 剑桥: 一个完美的读书地方
  5. 天正双击墙体不能编辑_20个天正CAD常备技巧,助你神速绘图!
  6. Editplus破解
  7. [转载]PT建站源码(PT服务器原程序)汇总(20100815更新)
  8. 一台电脑能装两个版本的cad吗_同一台电脑装多个cad 电脑怎么装cad软件步骤
  9. LM5117 学习板-BUCK 大功率降压稳压模块 8~52V输入 5~28 V 8A 输出
  10. 计算机潮流算法一般采用,计算机潮流计算