1.基本概念

1)"示例" (instance) 或"样本" (sample):

        这组记录的集合称为一个"数据集" (data set) ,其中每条记录是关于一 个事件或对象的描述。

2)"属性" (attribute) 或"特征" (feature):

反映事件或对象在某方面的表现或性质的事项

3)"属性空间" (attribute space) "样本空间" (sample space) 或"输入 空间":

属性上的取值,属性张成的空间。

        4)"泛化" (generalization) 能力:
        学得模型适用于新样本的能力。

2.监督与非监督

       1)根据训练数据是否拥有标记信息,学习任务可大致划分为两大类"监督学习" (supervised learning) 和"无监督学习" (unsupervised learning) ,分类和回归是前者的代表,而聚类则是后者的代表

2) 预测的是离散值即为分类、预测的是连续值即为回归;(根据已知类别进行分类)

       3) 聚类即将训练集中的西瓜分成若干组,每组称为 个"簇" (cluster); 这些自动形成的簇可能对应一些潜在的概念 划分,例如"浅色瓜"、 "深色瓜”。(能够根据特征分成不同的未知类别)
3.假设空间和版本空间
        假设空间就是每一种映射的合集,即每一种情况的合集,比如《“青绿、蜷缩、浊响”为好瓜》这是一种映射;
        
        版本空间就是与训练集一致的所有假设所构成的集合,也就是假设空间的一个最大子集,该子集内的每一个元素都不与训练集相冲突。
4.两个算法对于一个问题并没有孰优孰劣,他们的性能差距由归纳偏好决定:
以下为数学证明:

1)f为完美符合样本的目标函数(绝对准确映射),X表示全体训练样本,La为该归纳偏好下的算法;

2)Eote表示:假设f为完美符合样本的目标函数,X为全体训练样本,采用La算法所带来的误差的期望;

3)H为假设空间,即对假设空间里的所有h求和;

4)表示对训练集外的所有数据进行求和;

5)P(x)*II(h(x)≠f(x))*P(h|X,La):目标是求误差,那些符合准确映射的假设h(h(x)=f(x))的误差自然为0;反之(h(x)≠f(x)),对于这个集合中的一个样本而言(h0(x0)≠f(x0)),他出现的概率即为h0出现的概率×x0出现的概率(x和h相互独立,可以想象从训练集中随便取一个点和映射集里随便取一个点完全无关),故误差的期望为P(x)(这样的样本点出现的概率)×P(h|X,La)(算法La基于训练数据产生假设h的概率,h为假设空间H中的一个)。
(30条消息) 周志华机器学习---训练集外误差_小怪兽的博客-CSDN博客_训练集外误差https://blog.csdn.net/qq_43465223/article/details/117261480?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link&utm_relevant_index=1

机器学习——周志华(1)相关推荐

  1. 机器学习(周志华) 参考答案 第十四章 概率图模型 14.9

    机器学习(周志华西瓜书) 参考答案 总目录 http://blog.csdn.net/icefire_tyh/article/details/52064910 机器学习(周志华) 参考答案 第十四章 ...

  2. 机器学习 周志华 第一章课后习题

    机器学习 周志华 第一章课后习题 1.1 1.2 1.3 1.4 1.5 1.1 在下面这张图片中若只包含编号为1和4的两个样例,试给出相应的版本空间. 书上实例: 1.表 1.1 对应的假设空间如下 ...

  3. 小吴的《机器学习 周志华》学习笔记 第二章 模型评估与选择

    小吴的<机器学习 周志华>学习笔记 第二章 模型评估与选择 上一周我们介绍了第一章的基础概念,这一次将带来第二章的前三节.后面的2.4 比较检验与2.5 偏差与方差,涉及概率论与数理统计概 ...

  4. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

  5. 小吴的《机器学习 周志华》学习笔记 第二章 2.4 比较检验、2.5 偏差与方差

    小吴的<机器学习 周志华>学习笔记 第二章 2.4 比较检验. 2.5 偏差与方差 2.4 比较检验 上一周提到了实验的评价方法和性能量度,步骤简单可以看成:先使用某种实验评估方法测得学习 ...

  6. 机器学习 周志华 课后习题3.5 线性判别分析LDA

    机器学习 周志华 课后习题3.5 线性判别分析LDA 照着书上敲了敲啥都不会,雀食折磨 python代码 # coding=UTF-8 from numpy import * # 我安装numpy的时 ...

  7. 机器学习-周志华-学习记录-第一章绪论

    文章目录 绪论 一.什么是机器学习 二.基本术语 三.假设空间 四.归纳偏好 总结 参考链接 绪论 为了更早地适应研究生的生活,我决定重新学习周志华老师的机器学习这本书.同时也为了能够养成博客记录的习 ...

  8. 机器学习-周志华教授

    机器学习 南京大学周志华教授网课视频:https://www.xuetangx.com/learn/nju0802bt/nju0802bt/14363483/video/26163027 202210 ...

  9. 西瓜书入门辅助【机器学习 周志华】一些关于机器学习的重要基础概念提炼

    周志华. 机器学习 = Machine Learning. 清华大学出版社, 2016. Print. 文章目录 周志华. 机器学习 = Machine Learning. 清华大学出版社, 2016 ...

  10. 机器学习(周志华) 习题 参考答案 第十三章

    周志华老师的<机器学习>的第13章的习题答案较少,只找到了三篇,分别为链接一和链接二,这两篇文章有几乎所有题目的个人解答.第三个人只对部分题目进行了解答,相关链接将放在题目下方. 以下是个 ...

最新文章

  1. I/O模型之一:Unix的五种I/O模型
  2. java取余时前者前者小于后者_Java基本语法
  3. java之java.sql.SQLException: ResultSet is from UPDATE. No Data.
  4. Windows Server 2008网络基础结构的实现与管理
  5. maven下载spring
  6. ConsurrentDictionary并发字典知多少?
  7. 使用java中的String类操作复杂的字符串
  8. atomic在linux编译不通过,内存障碍和在linux上的atomic_t
  9. Python AttributeError: 'module' object has no attribute 'posseg'
  10. 苹果手机怎么拍星空_手机怎么拍星空
  11. hadoop 文件介绍
  12. [转]C++操作oracle数据库
  13. 筛选DataTable数据的方法
  14. 以线虫为模型模拟的神经网络,让机器人无需训练即可自动避开障碍物
  15. Acme CAD ConverterDWG文件查看器 2021
  16. DevExpress GridView 排序状态下新增行不参与排序
  17. Vue中点击复制文本功能
  18. 利用QT实现中国象棋
  19. Service Mesh(服务网格)——后 Kubernetes 时代的微服务
  20. 无尽对决怎么修改服务器地区,无尽对决怎么更改账号 | 手游网游页游攻略大全...

热门文章

  1. 天涯明月刀java_天涯明月刀61副本 天涯明月刀副本详情介绍
  2. XP高仿win7宽栏风格主题
  3. VBA版本获取ClientKey
  4. 电影台词搜索引擎,英语学习和视频创作的必备神器
  5. 传染病模型(4)——SIRS模型和SIER模型及matlab具体程序
  6. 利用“栈”快速计算——逆波兰表达式
  7. Openlayers GPS(度分秒)和经纬度坐标相互转换
  8. 说说 SpringMVC 工作原理
  9. 华为光猫上线流程、注册失败、常见语音故障处理
  10. iOS 中高级面试题(附答案)