简介

机器学习中,决策树是一个预测模型,代表对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,每个叶节点则对应从根节点到该叶节点所经历的路径表示的对象的值。决策树仅有单一输出。

提出问题

光看概念会比较抽象,那么举个实际中的问题来帮助理解。

现在我们需要为用户推荐应用,针对不同用户我们要向其推荐最有可能下载的应用。这是一个十分常见的应用场景。

观察数据

以下有一张用来制定推荐规则时参考的数据表

表中数据可以观察到,其中有6组示例用户数据,分别记录了他们的性别、年龄与下载过的应用。

那么,针对以上数据表,性别和年龄哪个特性对预测用户会下载哪个应用更有效?

不难看出,年龄会是更有效的参考指标。假设用性别区分用户,会发现女性用户既下载了Pokeman Go也下载了WhatsApp,而男性用户也下载了PokemanGo,另外还下载了SnapChat,因此体现不出明显差异。用年龄区分用户则很容易发现,20岁以下的年轻用户群体都下载了PokemanGo。接下来,将20岁以下的示例用户数据排除,剩下20岁以上用户则可以用性别再去判断,女性普遍下载WhatsApp,男性普遍下载SnapChat。

绘制决策树

通过分析数据表,我们便可以得出以下决策树,到此决策树的概念也就不难理解了。

通过大数据得出了决策树,之后便可以根据不同目标用户的不同属性值,有针对性进行应用的精准推荐了。

参考

决策树——Wikipedia
机器学习纳米学位课程——Udacity

春节不断电之机器学习 —— 决策树相关推荐

  1. 机器学习——决策树学习

    机器学习--决策树学习 一.什么是决策树 二.决策树的学习过程 特征选择: 决策树生成: 剪枝: 三.决策树的一个具体的实例 导入数据 python strip() 函数和 split() 函数的详解 ...

  2. 3.1 机器学习 --- 决策树

    3.1 机器学习 - 决策树 一 金融评分卡 模型做好后尽量快的上线,以符合要求的模型,尽快上线. 超参数赋予权重,使得模型的参数不一致,而达到均衡样本数据 二 决策树原理 1. 找女朋友 性别:男 ...

  3. 关于《机器学习决策树导出图片、PDF支持中文》解决办法

    很久没有更新博客了,一直以为自己默默无闻,埋头苦干.实际上是一种懒惰! 2020年的春天,是一段难忘的记忆!在这段特殊的时光里,让我静心思考,潜心研究.每每遇到技术困惑,总能在CSDN找到解决办法,由 ...

  4. 机器学习 | 决策树原理剪枝连续值缺失值处理

    机器学习 | 决策树 最近学习了西瓜书决策树一章,简单整理了笔记,后续会继续补充给 文章目录 机器学习 | 决策树 一.基本信息论 1. 信息量 2. 信息熵 二.决策树常用算法 1.ID3 2.C4 ...

  5. 机器学习——决策树(decision tree)

    相关文章链接: 机器学习--人工神经网络(NN) 机器学习--卷积神经网络(CNN) 机器学习--循环神经网络(RNN) 机器学习--长短期记忆(LSTM) 机器学习--决策树(decision tr ...

  6. 机器学习 --- 决策树(educode实训作业)

    引言:本文主要对educoder机器学习 --- 决策树的实训作业进行讲解,创造不易!请您点点关注,点点收藏叭!!! 目录 第1关:什么是决策树 任务描述 相关知识 引例 决策树的相关概念 编程要求 ...

  7. 机器学习 决策树篇——解决离散变量的分类问题

    机器学习 决策树篇--解决离散变量的分类问题 摘要 熵增益和熵增益率计算 熵增益和熵增益率运行结果 离散变量的决策树模型 决策树模型运行结果 摘要 本文通过python实现了熵增益和熵增益率的计算.实 ...

  8. 机器学习——决策树模型:Python实现

    机器学习--决策树模型:Python实现 1 决策树模型的代码实现 1.1 分类决策树模型(DecisionTreeClassifier) 1.2 回归决策树模型(DecisionTreeRegres ...

  9. 机器学习 决策树篇——解决连续变量的分类问题

    机器学习 决策树篇--解决连续变量的分类问题 摘要 信息熵.条件熵.熵增益.熵增益率的计算 GiNi系数.GiNi系数增益的计算 python代码 连续变量决策树分类案例 摘要 本文通过python实 ...

最新文章

  1. 【分块】#6283. 数列分块入门 7(区间乘法、区间加法、单点查询)
  2. mysql 常用操作
  3. 为什么说能源管理是分布式光伏发电的突破口?
  4. 人工智能超强面经:文本检测与GAN篇(含答案)
  5. AI 人工智能学习经典书单
  6. jquery-演练-表格的模态框新增与点击删除功能
  7. msdn安装后怎么用_Win10不好用?安装官方版精简Win10后,运行比win7更快更流畅
  8. 查看mysql中sql语句执行时间
  9. 利用Python进行数据分析--数据聚合与分组运算1
  10. SI 9000 及阻抗匹配学习笔记(三)
  11. 使用 Android PreferenceScreen 偏好显示类(android.preference.PreferenceScreen)
  12. java layoutinflater_安卓 LayoutInflater详解
  13. 识别图片验证码内容 -- ddddocr识别
  14. 思科路由器和交换机的硬件结构
  15. IDEA告警:Field can be converted to a local varible
  16. html中heading标签,Heading标签优化实战经验分享
  17. 连通块(信息学奥赛一本通 - T1335)
  18. 【linux服务器】使用csdn云主机的体验与问题
  19. HarmonyOS报名选择应用,HarmonyOS应用开发系列课,华为内部官方培训来袭!
  20. java相关的外文文献及翻译_外文文献及翻译:JavaandtheInternet

热门文章

  1. ubuntu18.04安装vmware虚拟机
  2. 「 iOS 知识小集 」2018 · 第 24 期
  3. Electron编译报错:include: could not find: ****StdUtils.nsh“的解决
  4. 人不成熟的5大特征,成功人士的7个习惯,成长型思维
  5. 华三模拟器:路由备份路由聚合
  6. hive时间AM PM格式转化为24小时制 按小时分morning,noon 思路+演示
  7. 李宏毅机器学习L6 GAN
  8. SEO中的简单代码优化
  9. Java时间戳与时间互相转换(含毫秒及秒转换方式)
  10. linux内核模块Makefile的解析