博主在4月学完西瓜书时,一头雾水,觉得还是一知半解。9月开学后上完了必修的《machine learning》课程,并且自己编程实现了多种机器学习算法和论文复现后,才对机器学习有一点了解,现在再次翻阅西瓜书,很多知识点看到都豁然开朗。所以出这一系列文章,对机器学习进行回顾,总结和记录!为大家揭开机器学习的神秘面纱!

学习目录

  • 1、引言
  • 2、基本术语
  • 3、假设空间
  • 4、归纳偏好
  • 5、发展历程

1、引言


我想大家肯定都听过机器学习,作为开场,我们先来了解一下什么是机器学习。

我们人都会根据乌云密布判断今天可能会下雨,今天天气冷要多穿衣服,买西瓜时候会敲敲瓜看看是否浊响,这些都是依据我们自己的生活经验。那么我们能否用计算机来实现上面的过程?

机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,因此,机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“机器学习算法”。

斯坦福大学人工智能教授吴恩达的总结更加简介:

机器学习就是我们获得一些数据,通过计算机建立模型,然后处理新的数据的。

2、基本术语


学习一门学科,专业术语肯定要说对,这是最基本的。

我们先收集一批关于西瓜的数据,例如下面的这些记录,“=”的意思是“取值为”
![在这里插入图片描述](https://img-blog.csdnimg.cn/501eb0bae4bf412c95262a9803ca1e55.png!
数据集:这组记录的集合我们称为一个数据集。
样本:其中每条记录是关于1个事件/对象的描述,也就是每条记录称为1个样本。
属性:像“色泽”、“根蒂”、“敲声”这些描述事件或对象性质的条目称为“特征”,或者“属性”。
属性值:属性上的取值也就叫属性值,比如“浅白”。
样本空间:属性长成的空间,例如这里,我们把色泽、根蒂和敲声三个属性作为三个坐标轴,那就张成了一个用于描述西瓜的三维空间。每个西瓜(样本)都可以找到一个点和自己对应,这样一个样本其实也叫做一个“特征向量”。


训练:从数据中获得模型的过程称为“训练”,这个过程提供执行某个机器学习算法(逻辑回归等等)来实现。
训练过程中使用的数据称为“训练数据”,其中每个样本称为“训练样本”,“训练样本”组成的集合称为“训练集”。学习的过程就是将机器每次对事物的假设(hypothesis)和我们的真实(ground-truth)无限逼近。


这里有关于样本的结果的信息,例如“好瓜”就称为“标记”(label),拥有了标记的样本(sample)称为样例(example)。

分类:如果我们预测的是离散值,比如“好瓜”、“坏瓜”,此学习称为分类。
回归:如果我们预测的是连续值,比如西瓜成熟度0.95、0.36,此学习任务称为回归。

二分类:只涉及两个类别的分类任务,其中一个类为正类,另一个为反类,输出一般为{-1,+1}或{0,1}。
多分类:涉及多个类别的分类任务,输出空间一般|y|>2。

测试:学得模型后使用它进行预测的过程,被测试的样本称为“测试样本”(因为测试样本不包含标签)。

根据训练数据是否拥有标记信息,学习任务大致分为两类:

  • 监督学习:分类和回归,也就是有导师学习,带着你学。
  • 无监督学习:聚类,也就是无导师学习,简称自学。

3、假设空间


归纳是从特殊到一般的“泛化”,演绎是从一般到特殊的“特化”。
从样例中学习,显然是一个归纳的过程,因此机器学习也称归纳学习

一个西瓜数据集就应该长这样,X1、X2、X3就是输入特征,Y就是标记:


如果只是记住训练样本,不能对新样本进行判断和预测,就叫机械学习。
而我们机器学习不仅是记住,而且还能判断和预测。

4、归纳偏好

机器学习算法在学习过程中会对某种类型假设的偏好,称为“归纳偏好”。简单来理解就是,每个特征对应的权重不同,比如我给色泽设定的权重是0.5,给根蒂设定的权重是0.1,给敲声设定的权重是0.8,那么Y=0.5X1+0.1X2+0.8*X3+b,这里b是常量,代表偏置值,那么X3几乎决定了Y的值。

奥卡姆剃刀:多个假设与观察一致时,选最简单的那个。并且机器学习中,我们认为“更平滑”意味着“更简单”。
“没有免费的午餐”定理:无论学习算法a有多么聪明,学习算法b多么笨拙,它们(对于所有样例)的数学期望都是相同的。

5、发展历程

《机器学习》二刷超详细笔记| 第一章 绪论相关推荐

  1. 西瓜书(机器学习 周志华)读书笔记--第一章 绪论

    1.1 引言 略 1.2 基本术语 1.2.1 数据集相关的基本概念 假定我们收集了一批关于西瓜的数据,例如(色泽=青绿;根蒂=蜷缩;敲声=浊响), (色泽=乌黑;根蒂=稍蜷;敲声=沉闷), (色泽= ...

  2. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

  3. 机器学习-周志华-学习记录-第一章绪论

    文章目录 绪论 一.什么是机器学习 二.基本术语 三.假设空间 四.归纳偏好 总结 参考链接 绪论 为了更早地适应研究生的生活,我决定重新学习周志华老师的机器学习这本书.同时也为了能够养成博客记录的习 ...

  4. 【机器学习】周志华 读书笔记 第一章 绪论

    1..什么是机器学习? 引言部分关于各种情景,是基于经验做出的的预判,机器学习的本质任务是预测. 特征 学习经验          =>从而做出有效的决策 def:① 机器学习是一门学科, ②  ...

  5. 《机器学习》 周志华学习笔记第一章 绪论(课后习题)

    最近需要学习机器学习,有一点点基础但是很少,希望能通过写博客的方式和大家交流以及学习达到共同进步的目的. 绪论 : 一.内容 1.基本术语 2.假设空间与版本空间 3.归纳偏好(常用的有奥卡姆剃刀) ...

  6. 玩转二算法课的笔记-第一章

    1 问题:对一组数据进行排序 回答:快速排序算法o(NLOGN),错误. 关键词:思考 应该问面试官,这组数据有什么样的特征? 比如;有没有可能包含大量重复的元素? 如果有这个可能的话,=三路快排是更 ...

  7. 【数据结构与算法】学习笔记——第一章 绪论1

    ✔前言: 新的专栏开启啦. 持续更新~ 关注我,我们一起学习

  8. 西瓜书读书笔记整理(二)—— 第一章 绪论

    第一章 绪论 第一章 绪论 1.1 引言 1. 什么是机器学习 2. 机器学习的主要内容 3. 模型与模式 1.2 基本术语 1. 数据集 / 训练集 / 验证集 / 测试集 2. 示例 / 样本 3 ...

  9. 学习javascript这一篇就够了超详细笔记(建议收藏)上

    学习javascript这一篇就够了超详细笔记(建议收藏)上 1.初识 计算机基础导读 编程语言 计算机基础 初识js 浏览器执行 js组成 js初体验-三种书写位置 js注释 js输入输出语句 2. ...

最新文章

  1. 7-4 BCD解密(C语言)
  2. CentOS7编译安装mysql-5.6.28和编译参数
  3. Hive表路径修改和分区表数据加载命令
  4. ArcGIS几种数据格式2
  5. 腾讯正式开源图计算框架Plato,十亿级节点图计算进入分钟级时代
  6. SAP Spartacus初始化时和user token相关的APP INITIALIZER
  7. python3 os_Python3 标准库:os
  8. (王道408考研数据结构)第五章树-第四节2:平衡二叉树(AVL)及其旋转
  9. asp.net页面事件:顺序与回传
  10. 尚学堂java培训_送给 Java 自学者或者初学者的最全知识清单,2020 年 Java 就该这么学...
  11. 韩信点兵php,说说大脑的“同时性信息加工功能”
  12. 第2章企业管理中的经济学原理
  13. jQuery WeUI学习笔记一
  14. 八种常规常用的SQL查询语句
  15. 蚂蚁金服前端实习生二面面经
  16. web开发html如何把图片居中,css中怎么让img图片居中
  17. UI设计从业者,怎样才能成为月薪过万的UI设计师?
  18. STM32L051 低功耗模式和踩坑随笔(自用)
  19. mysql 1813_ERROR 1813 (HY000) at line 404: Tablespace for table '`xxx`.`xxxxx`' exists.
  20. 使用mybatis-plus批量插入遇到的两个问题记录

热门文章

  1. 计算机桌面变色怎么办,电脑屏幕变色了怎么办
  2. python钉钉机器人发送excel附件_Python自动化办公|如何在钉钉上自动发送定制消息或通知给同事...
  3. mysql更新一条语句_讲讲一条MySQL更新语句是怎么执行的?
  4. 【Linux】文件描述符与重定向
  5. php7新特性的理解和比较
  6. IIS 常见异常及解决办法
  7. 贝塞尔曲线初识 (数学)
  8. 线程池——JAVA并发编程指南
  9. 每日英语:Electronics Develop A Sixth Sense
  10. 处理顶点——通过切线空间的凹凸映射添加逐像素细节