[学渣啃西瓜书]绪论-基本概念辨析(4)-归纳偏好
上训练集
训练后的假设
上面是训练集学习后的假设空间中的三个假设(Y=(好瓜) )。
去水果摊看到一个新瓜(色泽=青绿; 根蒂=蜷缩;敲声=沉闷)
用左上假设判断是好瓜,用右上假设判断是坏瓜,用中下假设判断是坏瓜。哪个判断更好?
归纳偏好:
1- 尽可能特殊(属性值更具体)就用右上,中下的假设。
2- 尽可能一般(属性值更包容)就用左上。这个代表我们认为属性“根蒂”作为判断维度更有把握。
选取个假设更适合解决我们的问题呢?
书中给出上图,A和B是训练集训练后的版本空间中不同的假设。根据奥卡姆剃刀的"若有多个假设与观察一致,则选最简单的那个”显然我们要选择更平滑的曲线A。但实际有可能我们发现B的泛化能力更好。如下图的分析。
通过没有免费午餐定理,总结出A,B算法的期望值相同。(公式1.1,1.2,1.3)
但是我们实际遇到的问题中,我们还是做出了选择,并且这种选择是因人而异的,其本身就蕴含着着决策者的偏好。我们偏向于“捷径”,偏向于更采取易于掌握变量作为权重更高的手段。一些可能牵强附会的例子。譬如RFM模型找到客户的价值,在我实际分析的时候,我发现分箱的业务策略影响着最后的人群分类,而这个业务策略根本不是从模型角度决定的;而且为什么用RFM三个维度分析客户价值?客户的购买行为有很多因素影响,这三个是否是权重最大的?;2B业务更不能简单用数学模型来分析,譬如突然国家限电了,以前训练集给出的假设就完全不够准确了。(当然这意味着变量不随机,受到外力影响下,甚至做不到i.i.d)。
理论上我认为模型肯定是无限接近真理的,但是里面需要考虑的参数太多,导致我们的算力不足,成本产出比低,这样的模型需要进行主因素分析进行降维,甚至就不能用建模思维处理。
了解模型对具体问题的解决前提和局限,带着问题和经历学习才能提高生产力。废话不说了,我学习南瓜书的手撕公式推导去了。
[学渣啃西瓜书]绪论-基本概念辨析(4)-归纳偏好相关推荐
- 机器学习之西瓜书绪论--关于机器学习的简单介绍
机器学习的简单介绍 绪论 1.1机器学习是能够用来干嘛的 1.2 机器学习的基本术语 1.3 假设空间 1.4归纳偏好 总结 参考链接 绪论 1.1机器学习是能够用来干嘛的 我们在辨别一个西瓜的好坏的 ...
- 比啃西瓜书更高效的“机器学习”方法
相信很多朋友对机器学习算法都有所了解,有尝试学习并利用机器学习算法以及工具做一些AI产品!但是仅仅停留在"调包"的阶段.想去深入理解一些算法的核心内涵却被 XGBoost | GB ...
- 西瓜书读书笔记整理(二)—— 第一章 绪论
第一章 绪论 第一章 绪论 1.1 引言 1. 什么是机器学习 2. 机器学习的主要内容 3. 模型与模式 1.2 基本术语 1. 数据集 / 训练集 / 验证集 / 测试集 2. 示例 / 样本 3 ...
- 读西瓜书笔记(一)绪论
读西瓜书笔记(一)绪论 (一)什么是机器学习 机器学习致力于研究如何通过计算的手段,利用经验来改善自身的性能. 机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型"的算法 ...
- 西瓜书学习记录-绪论
西瓜书学习记录-绪论 看了一下大神录的西瓜书读书记录,学习到很多东西,这里记录一下自己学习的一些截屏记录,方便以后再来复习,致敬大神们的讲解,感谢感谢. 看的大佬的教学视频,标明一下出处: https ...
- 如何啃透周志华的《机器学习》西瓜书?
嘿,如果让你推荐两本国内机器学习的入门经典作,你会推荐哪些呢? 相信大家和我一样,非李航的<统计学习方法>和周志华的<机器学习>莫属. 周志华老师的<机器学习>,相 ...
- 机器学习西瓜书学习——绪论
在我们日常生活中,我们有时候会根据自己的生活经验,对即将发生的事进行预估.当我们有了足够多的经验,我们就可以对一些情况做出有效的决策.比如说"朝霞不出门 晚霞行千里",就是根据我们 ...
- 机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)
目录 前言 主要符号表 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 前言 本博客为博主在学习 机器学习[西瓜书 / 南瓜书]过程中的学习笔记,每一章都是对<西瓜书> ...
- 西瓜书读书笔记—绪论
文章目录 机器学习 典型的机器学习过程 基本术语 归纳偏好 机器学习 机器学习:致力于研究如果通过计算的手段,利用经验来改善系统自身的性能 在计算机系统中,"经验" 通常以 &qu ...
最新文章
- APP抓链接工具(Fiddler版)
- P3916 图的遍历
- 微信小程序 用户权限部分
- Android软件开发之盘点自定义View界面大合集(二)
- python模块下载失败_python 安装tushare模块出错的一个解决方法
- upc组队赛15 Supreme Number【打表】
- 只需五步学会Maven 3.6.1OR 3.6.3及其他版本的下载安装与配置【图文详解】
- document.addEventListener的使用介绍
- 1.XML的基础和DOCTYPE字段的解析 DTD——文档类型定义(Document Type Definition)/ 由于XML可以自定义标签,那么自然各人编写的标签不一样,这样同步数据便成了问
- cad在哪里设置图幅大小_CAD新建图纸怎么设置视图范围太小?
- 认识IL代码---从开始到现在 第二篇
- php贴吧系统,PhpSay 开源贴吧系统 v2.1
- C++算法——字幕校对问题
- 如何在资源管理器中恢复“最近文件夹”
- Javascript实现手机发送验证码
- J3061《信息物理融合系统网络安全指南》
- java大鱼吃小鱼_大鱼吃小鱼Java课程设计
- 使用VLC组播测试及VLC收不到UDP组播数据
- [NCTF 2018]签到题
- element中关于el-autocomplete和validate规则trigger/change之间的问题
热门文章
- 正版推荐 -Macs Fan Control 控制苹果电脑上风扇工具软件
- 夜深人静写算法(三十一)- 欧拉函数
- 微前端之实现方式和项目分析、实践主子应用启动配置、vue2、vue3、react15、react16 子应用的配置
- 运行vue项目报DONE Build complete. The dist directory is ready to be deployed.解决办法
- 用ifconfig命令,只有lo,没有eth0
- yolov5一些奇奇怪怪的报错解决方案
- 多表联合查询(join、union等)
- 实时监控网站内容更新,微信来提醒
- 修改tp-wr841n-v8的flash
- 无锡设计培训——怎么自学室内设计