问题1:为什么需要学习决策树?
问题2:决策树需要哪些前导知识?
问题3:什么是决策树?它的结构是什么样的?
问题4:决策树生长的过程是什么?
问题5:决策树停止的条件是什么?
问题6:决策树中使用到的算法,在决策树中起到什么作用?它的发展历史(ID3、C4.5、CART)是什么样,都能解决什么样的问题?
问题7:什么场景下可以使用决策树?
问题8:什么情景下不可使用决策树?
问题9:理论中的决策树,和sklearn中的决策树有区别嘛?如果有的话,具体是什么?
问题10:能否根据现有的决策树的不足,提出一些改进的方法?

博客的目录如下所示:

1  为什么要学习决策树

2  前导知识

3  决策树的组成结构和样例

4  决策树的生长过程和终止条件

5  决策树的算法

6  决策树的应用场景和局限性

7  理论和sklearn的差异

8  改进点

搜索到的面试问题:

1.简述决策树的原理

2.简述决策树的构建过程

3.信息增益率有什么优缺点?

4.如何对决策树进行剪枝?

5.为什么决策树需要进行剪枝?

6.C4.5对ID3做了哪些改进?

7.C4.5决策树算法如何处理连续数值型属性?

8.C4.5与CART的区别

9.简述一下分类树和回归树

10.CART如何生成回归树?

11.CART树对离散特征取值数目>=3的特征如何处理?

12.决策树对缺失值如何处理?

13.如果决策树属性用完了仍未对决策树完成划分应该怎么办?

14.如何避免决策树的过拟合?

15.决策树需要进行归一化处理吗?

16.常用的决策树一定是二叉树吗?二叉决策树与多分支决策树相比各有什么特点?

17.你认为在一棵决策树构建过程中较为耗时的步骤是什么?

18.你正在一个时间序列数据集上工作,开始用决策树算法,因为你知道它在所有类型数据上的表现都不错。后来,你尝试了时间序列回归模型,并得到了比决策树模型更高的精度。这种情况会发生吗?为什么?

19.决策树在选择特征进行分类时一个特征被选择过后,之后还会选择到这个特征吗?

20.和其他模型比,决策树有哪些优点和缺点?

1. 为什么CART可以做回归而ID3、C4.5只能做分类?

主要原因是特征分裂的评价标准不一样,cart有两种评价标准:Variance和Gini系数。

而ID3(信息增益)和C4.5(信息增益率)的评价基础都是信息熵。

信息熵和Gini系数是针对分类任务的指标,而Variance是针对连续值的指标因此可以用来做回归。

2. C4.5如何处理连续值特征?

C4.5决策树算法[Quinlan,1993]采用的二分法(bi-partition)机制来处理连续属性。对于连续属性a,首先将n个不同取值进行从小到大排序,选择相邻a属性值的平均值t作为候选划分点,划分点将数据集分为两类,因此有包含n-1个候选划分点的集合,分别计算出每个划分点下的信息增益,选择信息增益最大对应的划分点,仍然以信息增益最大的属性作为分支属性。

决策树first task之框架搭建和提出问题相关推荐

  1. JAVA线程池管理及分布式HADOOP调度框架搭建

    平时的开发中线程是个少不了的东西,比如tomcat里的servlet就是线程,没有线程我们如何提供多用户访问呢?不过很多刚开始接触线程的开发攻城师却在这个上面吃了不少苦头.怎么做一套简便的线程开发模式 ...

  2. ASP.NET MVC+EF框架+EasyUI实现权限管理系列(14)-主框架搭建

    ASP.NET MVC+EF框架+EasyUI实现权限管理系列(14)-主框架搭建 原文:ASP.NET MVC+EF框架+EasyUI实现权限管理系列(14)-主框架搭建    ASP.NET MV ...

  3. git web框架搭建_Git,Python Web框架,AI,机器学习,Android,Linux和更多必读内容

    git web框架搭建 上周最受关注的是Kedar Vijay Kulkarni编写的新Git系列中的最新一期,随后是Nicholas Hunt-Walker编写的 Python Web框架系列中的最 ...

  4. 基于全注解的SpringMVC+Spring4.2+hibernate4.3框架搭建

    概述 从0到1教你搭建spring+springMVC+hibernate整合框架,基于注解. 本教程框架为基于全注解的SpringMVC+Spring4.2+hibernate4.3,开发工具为my ...

  5. Android MVVM框架搭建(十)Hilt、ViewBinding、Activity Result API

    Android MVVM框架搭建(十)Hilt.ViewBinding.Activity Result API 前言 正文 一.依赖 二.Hilt使用 1. Hilt 应用类 2. ViewModel ...

  6. 生信工作流框架搭建 | 从零开始入门指南 - 00工作流之华山论剑

    本篇为biodoge<生信工作流框架搭建>系列笔记的开篇作,该系列将持续更新. 导语 小白生信工程师一枚,写这样的系列其实是个大工程,出发点很简单,工作是宏基因组相关,我司长期使用的流程p ...

  7. 生信工作流框架搭建 | 02-nextflow 实战

    目录 生信工作流框架搭建 | 02-nextflow 前情提要 开始使用 依赖 安装 核心概念 一个fastqc的示例,加深理解 快速搭建你的程序 你需要仔细阅读的: 可以快速浏览(但需要知道大概有什 ...

  8. webapi框架搭建-创建项目(三)-webapi owin

    webapi框架搭建系列博客 上一篇:创建项目(二) 在上一篇里,我们已经创建好了webapi应用,并已经部署到iis里,本篇讲如何用owin自宿主或是iis宿主来部署webapi应用. owin介绍 ...

  9. WEB UI自动化测试框架搭建(一)_公用方法Utils

    本栏目内的所有项目使用的都是PyCharm 2020.1专业版,可以下载后自行在网上找教程破解. WEB UI自动化测试框架搭建(一)~(七)源代码:https://download.csdn.net ...

  10. Unity 游戏框架搭建 2018 (一) 架构、框架与 QFramework 简介

    约定 还记得上版本的第二十四篇的约定嘛?现在出来履行啦~ 为什么要重制? 之前写的专栏都是按照心情写的,在最初的时候笔者什么都不懂,而且文章的发布是按照很随性的一个顺序.结果就是说,大家都看完了,都还 ...

最新文章

  1. JQuery UI库 - Dialog
  2. 动态规划-换钱最少货币数
  3. 常用的CSS属性的英文单词总结及用法、解释
  4. java创建oracle序列_java学习:Hibernate学习-用oracle sequence序列生成ID的配置示例
  5. 用java编写简单Webserver,理解webserver的功能。
  6. Spring基础知识汇总 Java开发必看
  7. 开发运维效率提升 80%,计算成本下降 50%,分众传媒的 Serverless 实践
  8. java 日期类代码_java 日期时间处理类
  9. 【汇编语言学习之路】第一章 汇编语言核心方法论
  10. go 列出已经安装的包_Go 安装教程
  11. 在公司群匿名吐槽后当场“掉马”?QQ回应:真这样程序猿要被祭天
  12. bootstrap tab 组合表头
  13. 最大流Dinic算法
  14. 威纶触摸屏键盘不显示数字_详解 | 威纶触摸屏数值输入元件应用
  15. SplitContainer控件扩展之收缩面板
  16. 数字孪生|成熟度评价
  17. install pecl php_Linux下 PHP 安装pecl_http方法
  18. 网购可到家门口的报亭提货了
  19. dne服务器没检测到有响应,设备或资源dns没检测到有响应 网络无法连接
  20. python如何计算平均分_python脚本如何输入成绩求平均分?

热门文章

  1. php手册chm打开空白
  2. 面试题之10亿正整数问题
  3. 【转载】用Pwnage + Redsnow 制作完美越狱固件
  4. java替换图片_Java 替换 PPT 中的图片
  5. Vue+D3实现直方图与力导向图
  6. pycharm设置python运行根目录
  7. android studio 初始化项目加载时间过长或失败问题解决
  8. 开发那点事(六)php抓取北京实时公交数据
  9. [数论 反演]BZOJ4816 [Sdoi2017]数字表格
  10. winnt/win2003下的分区软件PowerQuest ServerMagic