第一章 绪论

  • 机器学习的目标
  • 基本术语
  • 假设空间
  • 归纳偏好

机器学习的目标

机器学习致力于研究如何通过计算的手段,利用经验来玫善系统自身的性能。在计算机中,经验通常以数据形式存在,因此,机器学习研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。

基本术语

假定我们收集了一批关于西瓜的数据,例如(色泽=青绿;根蒂=蜷缩;敲声=浊响), (色泽=乌黑;根蒂:稍蜷;敲声=沉闷), (色泽=浅自;根蒂 硬挺;敲声=清脆),……,每对括号内是一条记录,“=”意思是"取值为"。
这组记录的集合称为一个数据集,其中每条记录是关于一个事件或对象的描述,称为一个 示例样本。反映事件或对象在某方面的表现或性质的事项,例如“色泽”,称为属性特征;属性取值例如“青绿”称为属性值;属性张成的空间称为属性空间样本空间。我们把一个示例也称为一个特征向量

从数据中学的模型的过程叫做学习或者训练,训练过程中使用的数据称为训练数据,其中每个样本称为训练样本,训练样本组成的集合叫做训练集

分类:预测的是离散值
回归:预测的是连续值
聚类:将训练集的样本分成若干簇,在学习过程中使用的训练样本通常没有标记信息。

根据训练数据是否有标记信息将学习任务分为两大类
监督学习:分类和回归
无监督学习:聚类

泛化能力:学的模型适用于新样本的能力

我们假设样本空间中的全体样本服从一个未知的分布,获得的每个样本都是独立地从这个分布上采样获得的,即独立同分布

假设空间

归纳:从特殊到一般的泛化
演绎:从一般到特殊的特化

归纳偏好

若模型对于同样的新样本会产生不同的结果,则学习算法的偏好会起到关键作用,例如尽可能特殊或者尽可能一般,这种称为归纳偏好

“奥卡姆剃刀” (Occam’s razor) 是一种常用的、自然科学研究中最基本的原则,即"若有多个假设与观察一致,则选最简单的那个"如果采用这个原则,并且假设我们认为"更平滑"意味着"更简单" 。

脱离具体问题,空泛地谈论"什么学习算法更好"毫无意义,因为若考虑所有潜在的问题,所有学习算法都一样好。要谈论算法的相对优劣,必须要针对具体的学习问题;在某些问题上表现好的学习算法,在另一些问题上却可能不尽如人意,学习算法自身的归纳偏好与问题是否相配,往往会起到决定性的作用.

【周志华机器学习】绪论相关推荐

  1. 周志华机器学习--绪论

    周志华机器学习–绪论 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周志华机器学 ...

  2. 周志华机器学习(西瓜书)学习笔记(持续更新)

    <周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...

  3. 周志华机器学习--模型评估与选择

    周志华机器学习–模型评估与选择 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周 ...

  4. 周志华机器学习-决策树

    周志华机器学习-决策树 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周志华机器 ...

  5. 周志华机器学习-支持向量机

    周志华机器学习-支持向量机 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 – 文章目录 周 ...

  6. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  7. 周志华机器学习(6):支持向量机

    周志华机器学习(6):支持向量机 6 支持向量机 6.1 间隔与支持向量 6.2 对偶问题(dual problem) 6.3 核函数 6.4 软间隔与正则化 基本是大段摘录西瓜书加上一些自己的解释补 ...

  8. 【读书笔记】周志华 机器学习 第二章 模型评估和选择

    第二章 模型评估和选择 1 欠拟合和过拟合 偏差和方差 1.1 欠拟合和过拟合 1.2 偏差和方差 2 评估方法 性能度量 2.1 评估方法 2.1.1 留出法 2.2.2 交叉验证法 2.2.3 自 ...

  9. 《周志华机器学习详细公式推导版》发布,Datawhale开源项目pumpkin-book

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」全日程揭晓,请扫码咨询 ↑↑↑ 来源 | Datawhale(ID:Datawhale) 如果让你推荐两本国内机器学习的入门经典作,你会 ...

  10. 【强烈推荐】Github star 10K+,周志华机器学习详细公式推导!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]:今天给大家推荐一本超级nice的机器学习理论推导书籍,它就是<西瓜 ...

最新文章

  1. 除了数据属性,Vue 实例还提供了一些有用的实例属性与方法。它们都有前缀 $,以便与用户定义的属性区分开来。
  2. EasyUI中datagrid的行编辑模式中,找到特定的Editor,并为其添加事件
  3. Spring MVC -- 国际化
  4. 【剑指offer】面试题63:股票的最大利润(Java)
  5. windows设置开机启动项
  6. Spring的AOP面向切面编程
  7. 《The Django Book 2.0》中文版笔记
  8. 无线安全相关介绍及Windows下扫描WiFi
  9. jpg格式电脑怎么弄_jpg格式图片电脑怎么弄
  10. 程序员有文化,多可怕!
  11. 阿米巴经营会计报表复习
  12. 家用游戏机主机的发展历史
  13. 新手剪辑师秒变大神 高级感视频剪辑的几种常用技巧
  14. Win10、Win11打开远程桌面连接方法
  15. 一套近乎完美的公司财务流程
  16. CSV文件批量合并/转XLSX(无需任何软件,傻瓜式操作)
  17. 日本味之素EB21二丁基乙基己酰基谷氨酸酰胺型胶凝化剂TDS产品说明书
  18. SC系列 (SC-32S) 低频率小型SMD石英晶振 SC-32S 32.768KHZ 12.5PF/20PPM
  19. Win7安装完成后对系统的优化设置
  20. esp8266烧录Html文件

热门文章

  1. 输入一个不为0的整数,判断它是正数还是负数,并且计算正负数的个数
  2. 运放单的电源供电和双电源供电
  3. C++模板函数的声明和定义是否可以分开?
  4. bzoj 1064 noi2008 假面舞会题解
  5. iOS something is trying to start the receiver simultaneously from more than one thread
  6. 解决Could not determine artifacts for XXXX: Skipped due to earlier error
  7. Unity 生成原始LUT用于外部校色相机不透明物体截图
  8. html掷骰子游戏的代码,jquery实现掷骰子小游戏
  9. 微波技术在计算机的应用论文,计算机数据自动处理在微波实验中的应用.doc
  10. Android程序如何全屏显示