1.1引言

概念1:基于经验做出的预判

机器学习定义:通过计算手段,利用经验数据产生模型用于改善系统自身性能。

更形式化的定义 假设用P 评估计算机在某任务类T的性能,若一个程序通过利用经验E在T任务上获得了性能上的改善,就说关于T,P该程序对E进行了学习

1.2基本术语

Data set 数据集:纪录的集合

Instancesample 示例、样本:某条具体的纪录

attributefeature 特征、属性

Attribute value 属性

Attribute spacesample space 属性空间、样本空间

Feature vector 特征向量:in the attribute spaceevery instancecorresponding to a vector

示例:数据集 D={X1,X2,X3,,,Xm}由m个示例组成,

Xi=(xi1,xi2,,,xid),每个示例由d个属性描述 Xid维样本空间的一个向量d称为Xi维数

Label 标记

Example 样例:拥有了标记信息的示例

Label space 标记空间所有标记的集合

一个样例:(Xi,Yi)

学习的任务分类:

1. 预测离散值——classification 分类

binary classification 二分分类,positive class 正类,negative class 反类

multi-class classification 多分类

2. 预测连续值——regression 回归

学习结果:

建立一个从输入空间到输入空间的映射f

聚类:训练集中的样本称为一个簇,这些簇对应一些潜在的分类

Supervised learning 监督学习:训练数据拥有标记信息,分类和回归是这类学习的代表

Unsupervised learning 无监督学习:不用有标记信息,聚类是这类学习的代表

Generalization 泛化能力:学习得到的模型适用于新样本的能力

通常假设整个样本空间遵从一个未知的分布 D

Independent and identical distributed 独立同分布 i.i.d: 在概率统计中,指随机过程中,任何时刻取值都为随机变量如果这些随机变量遵从同一分布并且相互独立那么这些随机变量是独立同分布

1.3 假设空间

假设是所有可能结果的集合

学习过程是在所有假设组成的空间中寻找符合训练集的假设的过程

版本空间:多个与训练集相匹配的假设所组成的集合

1.4 归纳偏好:

机器学习算法在学习过程中对某类型假设的偏好,称为归纳偏好

选择归纳偏好的原则有:

奥卡姆剃刀原则——当有多个假设符合观察的时候,选择最简单的那个

没有免费的午餐定理 NFL定理,任何两个算法的期望值都是相等的——重要前提:所有问题出现的机会相同,重要性相同——启发:针对具体的问题选择归纳偏好,因为对于所有潜在的可能性,任何算法期望是相等的这样的假设对解决具体问题是没有意义的

1.5机器学习发展历程:

推理期:赋予机器逻辑推理能力

知识期:使得机器拥有知识

1.6机器学习的应用

1.7 阅读材料:推荐各种阅读材料+重要国际、区域性会议+期刊

习题解答:

  1. 注意点,版本空间的每一假设都能单独地符合(退出)给定的示例
    解题思路,先列出假设空间,根据给定的训练数据进行筛选。

后面习题有些难,附上链接 http://blog.csdn.net/icefire_tyh/article/details/52064910

周志华西瓜书笔记——第一章相关推荐

  1. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

  2. 周志华西瓜书第三章学习笔记

    第三章学习笔记 文章目录 第三章学习笔记 1.知识脉络 2.我的笔记 参考 1.知识脉络 2.我的笔记 这一章公式推导实在太多了,需要补充的推导过程也有很多,就不写电子档了.扩展公式推导和LDA部分补 ...

  3. 20190107周志华西瓜书笔记第一二章

    第一章 绪论 第二章 模型评估与选择 经验误差与过拟合 错误率 精度=1-错误率 评估方法(留出法 交叉验证法 自助法 调参与最终模型) 性能度量 (错误率与参数 查准率 ROC AUC 偏差 方差 ...

  4. 机器学习 周志华 西瓜书 第1章 绪论复习总结

    如果有看不清或其他问题请评论反馈.

  5. 周志华西瓜书学习笔记(一)

    周志华西瓜书学习笔记 第一章 绪论 数据处理分为三个阶段:收集,分析,预测. 一.基本概念 机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能. Mitchell给出的更形式化的定义为 ...

  6. 《机器学习》(周志华)西瓜书读书笔记

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 第1章 绪论 第2章 模型评估与选择 第3章 线性模型 第4章 决策树 第5章 神经网络 第6章 神经网络 第7章 贝 ...

  7. 周志华西瓜书《机器学习》习题提示——第2章

    2.1:分层采样, [ ( 500 500 × 70 % ) ] 2 \left[ \binom{500}{500\times 70\%} \right]^2 [(500×70%500​)]2 2.2 ...

  8. 周志华西瓜书课后习题答案总目录

    https://blog.csdn.net/icefire_tyh/article/details/52064910 机器学习(周志华西瓜书)参考答案总目录 从刚开始学习机器学习到现在也有几个月了,期 ...

  9. 小吴的《机器学习 周志华》学习笔记 第二章 模型评估与选择

    小吴的<机器学习 周志华>学习笔记 第二章 模型评估与选择 上一周我们介绍了第一章的基础概念,这一次将带来第二章的前三节.后面的2.4 比较检验与2.5 偏差与方差,涉及概率论与数理统计概 ...

最新文章

  1. SVN centos6.3
  2. 软件测试理论之测试用例设计六把刀
  3. Handler消息机制(二):一个线程有几个Handler
  4. Realm数据库存储 使用详解
  5. 日志模板html源码,HTML红色欧美形式教堂动态日志网页模板代码
  6. oracle簇表 数据抽取,Oracle聚簇表
  7. 大叔公开课~微服务与持久集成
  8. LeetCode 254. 因子的组合(回溯)*
  9. LeetCode7. 整数反转
  10. mysql redo log 几个组_必须了解的mysql三大日志,你知道几个?
  11. putty怎么进入文件夹_putty常用命令
  12. Dijkstra 算法+fibonacci堆的逐步c实现
  13. 向量叉乘公式_向量外积的高中数学运用
  14. 创意小发明:使用51系列单片机的DIY点焊机控制项目(程序+原理图)
  15. 区块链通证经济——资产流动性的变革
  16. Spring MVC之redirect、forward和普通跳转
  17. linux存储群组名称的文件是,群组管理(分组,群组密码,身份切换,常见问题)- 系统管理 -Deepin深度系统用户手册...
  18. PMI-ACP练习题(17)
  19. 3步了解APP渠道应该怎样建设评估体系(上)
  20. java 万能解压zip工具类

热门文章

  1. C#仿qq窗体项目 登录 注册 聊天 点赞 更换头像 添加好友 删除好友 基础功能
  2. 银河麒麟桌面操作系统V10 SP1 屏幕亮度调整方法
  3. 苹果x和xsmax有什么区别_手机资讯:Apple 认证的翻新产品是什么苹果官方翻新机和全新设备有什么区别...
  4. 用在线的Macaulay2把曲线参数方程变成隐函数形式
  5. 在美国租房 如果转租也要收押金吗 - hoolilaw
  6. C++23种设计模式(四)--Decorate(装饰模式)
  7. java G1垃圾收集器
  8. Cannot open a library at 'FileMapping
  9. redis监控redis-stat安装教程
  10. PHP转Java一年体会