上训练集

训练后的假设

上面是训练集学习后的假设空间中的三个假设(Y=(好瓜) )。

去水果摊看到一个新瓜(色泽=青绿; 根蒂=蜷缩;敲声=沉闷)

用左上假设判断是好瓜,用右上假设判断是坏瓜,用中下假设判断是坏瓜。哪个判断更好?

归纳偏好:

1- 尽可能特殊(属性值更具体)就用右上,中下的假设。

2- 尽可能一般(属性值更包容)就用左上。这个代表我们认为属性“根蒂”作为判断维度更有把握。

选取个假设更适合解决我们的问题呢?

书中给出上图,A和B是训练集训练后的版本空间中不同的假设。根据奥卡姆剃刀的"若有多个假设与观察一致,则选最简单的那个”显然我们要选择更平滑的曲线A。但实际有可能我们发现B的泛化能力更好。如下图的分析。

通过没有免费午餐定理,总结出A,B算法的期望值相同。(公式1.1,1.2,1.3)

但是我们实际遇到的问题中,我们还是做出了选择,并且这种选择是因人而异的,其本身就蕴含着着决策者的偏好。我们偏向于“捷径”,偏向于更采取易于掌握变量作为权重更高的手段。一些可能牵强附会的例子。譬如RFM模型找到客户的价值,在我实际分析的时候,我发现分箱的业务策略影响着最后的人群分类,而这个业务策略根本不是从模型角度决定的;而且为什么用RFM三个维度分析客户价值?客户的购买行为有很多因素影响,这三个是否是权重最大的?;2B业务更不能简单用数学模型来分析,譬如突然国家限电了,以前训练集给出的假设就完全不够准确了。(当然这意味着变量不随机,受到外力影响下,甚至做不到i.i.d)。

理论上我认为模型肯定是无限接近真理的,但是里面需要考虑的参数太多,导致我们的算力不足,成本产出比低,这样的模型需要进行主因素分析进行降维,甚至就不能用建模思维处理。

了解模型对具体问题的解决前提和局限,带着问题和经历学习才能提高生产力。废话不说了,我学习南瓜书的手撕公式推导去了。

[学渣啃西瓜书]绪论-基本概念辨析(4)-归纳偏好相关推荐

  1. 机器学习之西瓜书绪论--关于机器学习的简单介绍

    机器学习的简单介绍 绪论 1.1机器学习是能够用来干嘛的 1.2 机器学习的基本术语 1.3 假设空间 1.4归纳偏好 总结 参考链接 绪论 1.1机器学习是能够用来干嘛的 我们在辨别一个西瓜的好坏的 ...

  2. 比啃西瓜书更高效的“机器学习”方法

    相信很多朋友对机器学习算法都有所了解,有尝试学习并利用机器学习算法以及工具做一些AI产品!但是仅仅停留在"调包"的阶段.想去深入理解一些算法的核心内涵却被 XGBoost | GB ...

  3. 西瓜书读书笔记整理(二)—— 第一章 绪论

    第一章 绪论 第一章 绪论 1.1 引言 1. 什么是机器学习 2. 机器学习的主要内容 3. 模型与模式 1.2 基本术语 1. 数据集 / 训练集 / 验证集 / 测试集 2. 示例 / 样本 3 ...

  4. 读西瓜书笔记(一)绪论

    读西瓜书笔记(一)绪论 (一)什么是机器学习 机器学习致力于研究如何通过计算的手段,利用经验来改善自身的性能. 机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型"的算法 ...

  5. 西瓜书学习记录-绪论

    西瓜书学习记录-绪论 看了一下大神录的西瓜书读书记录,学习到很多东西,这里记录一下自己学习的一些截屏记录,方便以后再来复习,致敬大神们的讲解,感谢感谢. 看的大佬的教学视频,标明一下出处: https ...

  6. 如何啃透周志华的《机器学习》西瓜书?

    嘿,如果让你推荐两本国内机器学习的入门经典作,你会推荐哪些呢? 相信大家和我一样,非李航的<统计学习方法>和周志华的<机器学习>莫属. 周志华老师的<机器学习>,相 ...

  7. 机器学习西瓜书学习——绪论

    在我们日常生活中,我们有时候会根据自己的生活经验,对即将发生的事进行预估.当我们有了足够多的经验,我们就可以对一些情况做出有效的决策.比如说"朝霞不出门 晚霞行千里",就是根据我们 ...

  8. 机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)

    目录 前言 主要符号表 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 前言 本博客为博主在学习 机器学习[西瓜书 / 南瓜书]过程中的学习笔记,每一章都是对<西瓜书> ...

  9. 西瓜书读书笔记—绪论

    文章目录 机器学习 典型的机器学习过程 基本术语 归纳偏好 机器学习 机器学习:致力于研究如果通过计算的手段,利用经验来改善系统自身的性能 在计算机系统中,"经验" 通常以 &qu ...

最新文章

  1. APP抓链接工具(Fiddler版)
  2. P3916 图的遍历
  3. 微信小程序 用户权限部分
  4. Android软件开发之盘点自定义View界面大合集(二)
  5. python模块下载失败_python 安装tushare模块出错的一个解决方法
  6. upc组队赛15 Supreme Number【打表】
  7. 只需五步学会Maven 3.6.1OR 3.6.3及其他版本的下载安装与配置【图文详解】
  8. document.addEventListener的使用介绍
  9. 1.XML的基础和DOCTYPE字段的解析 DTD——文档类型定义(Document Type Definition)/ 由于XML可以自定义标签,那么自然各人编写的标签不一样,这样同步数据便成了问
  10. cad在哪里设置图幅大小_CAD新建图纸怎么设置视图范围太小?
  11. 认识IL代码---从开始到现在 第二篇
  12. php贴吧系统,PhpSay 开源贴吧系统 v2.1
  13. C++算法——字幕校对问题
  14. 如何在资源管理器中恢复“最近文件夹”
  15. Javascript实现手机发送验证码
  16. J3061《信息物理融合系统网络安全指南》
  17. java大鱼吃小鱼_大鱼吃小鱼Java课程设计
  18. 使用VLC组播测试及VLC收不到UDP组播数据
  19. [NCTF 2018]签到题
  20. element中关于el-autocomplete和validate规则trigger/change之间的问题

热门文章

  1. 正版推荐 -Macs Fan Control 控制苹果电脑上风扇工具软件
  2. 夜深人静写算法(三十一)- 欧拉函数
  3. 微前端之实现方式和项目分析、实践主子应用启动配置、vue2、vue3、react15、react16 子应用的配置
  4. 运行vue项目报DONE Build complete. The dist directory is ready to be deployed.解决办法
  5. 用ifconfig命令,只有lo,没有eth0
  6. yolov5一些奇奇怪怪的报错解决方案
  7. 多表联合查询(join、union等)
  8. 实时监控网站内容更新,微信来提醒
  9. 修改tp-wr841n-v8的flash
  10. 无锡设计培训——怎么自学室内设计