1 机器学习问题的分类

1)按照输出空间Y类型划分
二分类、多分类、回归问题(y是连续的)、结构化学习(句法分析)注:每个单词的词性标注是一个多分类问题,但是对一句话里的每个词的词性标注并输出前后的关系,则是一个结构化学习问题。

2)按照样本是否有标签y划分
有监督学习(样本集有标签y)、无监督学习(样本集无标签y,聚类、密度分析、异常点检测)、半监督学习(一部分样本有标签,一部分样本无标签)、增强学习(一些行为反馈的奖励或者惩罚)
监督学习和非监督学习很好理解也已经较为成熟,半监督学习和增强学习却是近些年发展的趋势,其应用也很普遍,为什么会出现半监督学习呢?因为数据标记的成本很大,经常会遇到只有一部分标记的样本,例如图像识别和药物效果预测(因为动物实验或者人体实验的成本很高)。那为什么会有增强学习?对于一些很复杂的问题,自己定义数据标记是很困难的,但是会有一些反馈数据存在。

3)按照样本进行训练的方式划分
批量学习(根据已有的所有样本同时输入进行学习)、在线学习(样本是一个一个输入进行学习,每一次在上一次输入学习得到的模型上进行修正)、主动学习(机器主动问问题,适用于样本标记成本很高的场景)。

2 特征工程

将输入样本中的原始数据转换成具体的特征,有利于机器学出更好的效果。

机器学习基石三——机器学习分类相关推荐

  1. 【机器学习基石】机器学习的种类(三)

    目录 写在前面 1. 不同的输出y(Out Space) 2. 不同格式的标签(Data Label) 3.不同的数据样本获取方式(Protocol) 4. 不同的输入x(Input Space) 写 ...

  2. 机器学习基石-作业三-第2题分析以及通过H证明EIN的讨论

    题目: 这是机器学习基石作业三种的第二小题,额,在网上看了很多解答(解答也不多)感觉都没有说清楚为什么,所以励志清楚滴解决一下这个问题,经过努力,自认为得到了详细的解答,内容如下: (一)解决选项(e ...

  3. 机器学习基石笔记(三):学习的类型

    文章目录 Lecture 3: Types of Learning Learning with Different Output Space $Y$ Fun Time Learning with Di ...

  4. 西瓜书+实战+吴恩达机器学习(三)机器学习基础(多分类、类别不平衡)

    文章目录 0. 前言 1. 多分类学习 2. 类别不平衡 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 本篇介绍机器学习中的多分类和类别不平衡问题. 1. 多分 ...

  5. 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

    红色石头的个人网站:redstonewill.com 上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决.在之前的EinEinE_{in}上加上一个reg ...

  6. 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...

  7. 台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了分类问题的三种线性模型,可以用来解决binary classification和multiclass classificati ...

  8. 台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Logistic Regression问题,建立cross-entropy error,并提出使用梯度下降算法gradient ...

  9. 台湾大学林轩田机器学习基石课程学习笔记10 -- Logistic Regression

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Linear Regression线性回归,以及用平方错误来寻找最佳的权重向量w,获得最好的线性预测.本节课将介绍Logist ...

最新文章

  1. html无序列表的滚动效果,html无序列表标签和有序列表标签使用示例
  2. php 单一职责原则,Laravel深入学习8 - 单一责任原则
  3. JavaScript闭包理解【关键字:普通函数、变量访问作用域、闭包、解决获取元素标签索引】...
  4. 网站 测试服务器配置,安装调试、软件测试、网站测试 配置维护环境配置、安全维护、安全运维等与服务器相关业务...
  5. VB数据库中EOF和BOF的认识与用法
  6. 逻辑为基、数企赋能(NO.7)—非逻辑思维
  7. mysql索引失效口诀
  8. 27种主流编程语言分类及优劣
  9. Jetpack-Compose
  10. 概率论与数理统计之随机试验与随机时间样本空间与事件的集合表示
  11. i了i了,这简直就是2020全网最全最强的MyBatis面试题!
  12. Genesis公链确定亮相Consensus 2022大会
  13. 关于SparkHashJoin等值和不等值连接
  14. Unable to locate tools jar Expected to find it in C /Progra
  15. Home, sweet home.
  16. 电竞计算机专业,电竞专业主要学什么的
  17. python绘制对数坐标图描点_Python3.0科学计算学习之绘图(一)
  18. 成功进行射频与模拟混合信号PCB设计需要考虑的因素
  19. Excel根据表格月份内容创建1-12月的文件夹?
  20. 常见中文编码方式介绍

热门文章

  1. FTP 获取远程目录列表返回421错误
  2. C语言:L1-039 古风排版 (20 分)
  3. Eclipse体系结构介绍(一)
  4. 常用放射性核素名称及半衰期表
  5. remote_message
  6. 使用 minikube 安装 k8s-cluster
  7. markdown图片左对齐问题
  8. 最新行业薪资排行榜:IT行业超13万,稳居第一!
  9. 【Kafka】Kafka的Rebalance机制可能造成的影响及解决方案
  10. Kotlin骚气写法 三