机器学习:研究如何通过计算的手段,利用     经验改善系统自身的性能。
1.训练模型
  数据集:一组数据记录的集合。
  实例或样本:每条记录是关于一个事件或对      象的描述。
  属性:反映事件或对象在某方面的表现或性      质的事项。
  属性值:属性上的取值。
  属性空间、样本空间或输入空间:属性张成      的空间。
  特征向量:在上述张开空间中每个样本都能      找到自己对应的点,而每一个点都对应一个      向量坐标。
  属性值:属性上的取值。
  学习或训练:从数据中学得模型的过程。
  训练数据:这个过程通过执行某个学习算法      来完成,训练过程中使用的数据。
  训练样本:训练数据中的每个样本。
  训练集:训练样本组成的集合。
  假设:学得模型对应了关于数据的某种潜在      的规律。
  真相或真实:潜在规律自身。(学习过程就      是为了找出或逼近真相)
  学习器:模型。(可看作学习算法在给定数      据和参数空间上的实例化)

2.预测模型(如果希望学得一个能帮助我们判    断所得目标的模型,还需要要建立预测模          型,我们需获得训练样本的结果信息)
  标记:实例结果的信息。
  样例:拥有标记信息的实例。
  标记空间或输出空间:一般地用(xi,yi)表示第    i 个样例,其中yi∈Y ,是示例Xi的标记,Y
  是所有标记的集合。
3.分类与回归
  分类:若预测的是离散值,例如“好瓜” “坏      瓜”,此类学习任务。
  对只涉及两个类别的二分类" 任务,通常称其    中一个类为正类,另一个类为反类;涉及多    类    别时,则称为多分类任务。
  回归:若预测的是连续值,例如西瓜成熟度      0.95、0.37,此类学习任务。
  测试:学习得模型后,使用其进行预测的过      程。
  测试样本:被预测的样本。
4.聚类
  聚类:将训练集中的样本分成若干组,每组      称为一个簇;这些自动形成的簇可能对应一些    潜在的概念划分,
  有助于了解内在规律,便于建立分析基(1).需    说明的是,在聚类学习中,“本地人” “外地      人"这样的概念我们事先是不知道的(2). 学习      过程中使用的训练样本通常不拥有标记信息
5.学习任务分类
  监督学习: 训练数据拥有标记信息(分类和回    归)
  无监督学习: 训练数据未拥有标记信息(聚        类)
6.假设空间
  泛化能力:学得模型适用于新样本的能力(具有    强泛化能力的模型能很好地适用于整个样本      空间)
  独立同分布:通常假设样本空间中全体样本服   从一个未知分布D.(训练样本越多,得到的关   于 D 的信息越多,这样就越有可能通过学习获   得具有强泛化能力的模型)

归纳: 是从特殊到一般的泛化过程,即从具       体的事实归结出一般性规律。
(广义的归纳学习大体相当于从样例中学习)
(狭义的归纳学习则要求从训练数据中学得概   念,因此亦称为“概念学习”或 “概念形成”)
 演绎: 则是从一般到特殊的特化过程,从基础   原理推演出具体状况。
7.归纳偏好
  奥卡姆剃刀原则: 若有多个假设与观察一致,      则选最简单的那个
  没有免费的午餐定理(简称NFL定理):无      论学习算法a多聪明、学习算法b多笨拙,它    们的期望性能是相同的。

机器学习西瓜书第一章总结相关推荐

  1. 西瓜书第一章阅读笔记

    西瓜书第一章阅读笔记 第一章 绪论 1.机器学习基本术语 2.归纳偏好 3.所有学习算法一样优秀? 4.补充资料 第一章 绪论 1.机器学习基本术语 记录:对一个事件或对象的描述,也称为"示 ...

  2. 西瓜书第一章课后习题答案

    第1章 绪论 1.1 略 1.2 参考链接:西瓜书第一章习题 - 简书 (jianshu.com) 首先明确基本合取式有多少种,设西瓜的三个不同属性的特征分别为(A1,A2),(B1,B2,B3),( ...

  3. 机器学习西瓜书-1-2章

    学习目标: 概览机器学习西瓜书 1.2章 学习内容: 第一章 绪论 1.1 基本术语 1.2 假设空间 1.3 归纳偏好 1.4 发展历程 第二章 模型评估与选择 2.1 经验误差与过拟合 2.2 评 ...

  4. 机器学习-西瓜书第一、二章

    第一章:绪论 基本概念 数据集:所有数据的集合 训练集:训练样本的集合 属性(特征):某事物或对象在某方面表现的性质 属性值:属性的取值 属性空间/样本空间/输入空间:属性张成的空间 泛化能力:学得模 ...

  5. 机器学习西瓜书各章详细目录定位

    第一章 绪论 1.1 引言(P1) 1.2 基本术语(P2) 1.3 假设空间(P4) 1.4 归纳偏好(P6) 1.5 发展历程(P10) 1.6 应用现状(P13) 1.7 阅读材料(P16)   ...

  6. 西瓜书第一章课后题答案(一)

    1.1 针对西瓜分类分题进行讲解 属性: 3个属性 色泽:(青绿,乌黑,浅白) 根蒂:(蜷缩,硬挺,稍蜷) 敲声:(浊响,清脆,沉闷) 假设空间: 属性所有可能取值组成的可能的样本 假设空间的个数:4 ...

  7. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  8. 小白学机器学习西瓜书-第三章对数几率回归

    小白学机器学习西瓜书-第三章对数几率回归 3.3 对数几率回归 3.3.1 对数几率函数 3.3.1 估计参数 上一部分我们介绍了线性回归,包括简单的二元回归和多元回归,这两个主要解决的是拟合预测的问 ...

  9. 机器学习西瓜书(周志华)第七章 贝叶斯分类器

    第七章 贝叶斯分类器 1. 贝叶斯决策论 1.1 先验分布 1.2 后验分布 1.3 似然估计 1.4 四大概率在贝叶斯分类中指代含义 1. 朴素贝叶斯 7. 课后练习参考答案 1. 贝叶斯决策论 贝 ...

最新文章

  1. 函数的参数与函数的嵌套调用
  2. luogu1975 [国家集训队]排队
  3. 抢人饭碗了!推荐一款全自动的机器学习建模神器PyCaret
  4. go语言实现斐波那契
  5. 利用 LotusScript 灵活操作 Lotus Notes 富文本域
  6. 为什么SimpleDateFormat不是线程安全的?
  7. C语言打包解包文件程序(简易版)
  8. 人的“肥胖”基因FTO可促进水稻和土豆增产50% - 中国粮食、中国饭碗
  9. linux下eclipse找不到插件位置,Linux 下安装Eclipse时所遇到的问题
  10. vagrant 的安装与使用
  11. c语言从入门到精通第四版电子书_C语言从入门到精通(第4版)
  12. 点云入门笔记(一):点云数据及获取
  13. Xilinx FPGA bit 文件加密
  14. sel2000服务器自动关闭,实用贴:轻松处理SQL 2000数据库自动停止
  15. 2011盘点国内外24款免费个人防火墙
  16. 代码题 10进制转任意进制
  17. “网络三结义”--mpls 进阶实验详细配置
  18. ECC内存和普通内存有什么不同?为什么对金融和医疗业务至关重要?
  19. Matlab深度学习笔记——深度学习工具箱说明
  20. APP渗透测试检查-checklist

热门文章

  1. STM32开发GPRS传输的GPS定位器 C#编写服务器转发程序,客户端显示轨迹
  2. 大型直播平台应用架构浅谈
  3. 梅森数-形如2n−1的素数称为梅森数
  4. windows 2003 R2+IIS ssl证书认证
  5. 【allegro 17.4软件操作保姆级教程八】布线操作基础之三
  6. 一次线上服务器cpu使用率超过1250%的排查与优化
  7. 如何用hadoop自带的包计算pi值
  8. linux查看某个nas盘io,每天学习一个命令:pidstat 查看进程消耗资源
  9. 2020.05.26
  10. VBoxManager很强大哈!