数据挖掘十大经典算法系列,点击链接直接跳转

  • 数据挖掘简介及十大经典算法(大纲索引)
  • 1. 数据挖掘十大经典算法之——C4.5 算法
  • 2. 数据挖掘十大经典算法之——K-Means 算法
  • 3. 数据挖掘十大经典算法之——SVM 算法
  • 4. 数据挖掘十大经典算法之——Apriori 算法
  • 5. 数据挖掘十大经典算法之——EM 算法
  • 6. 数据挖掘十大经典算法之——PageRank 算法
  • 7 数据挖掘十大经典算法之——AdaBoost 算法
  • 8. 数据挖掘十大经典算法之——KNN 算法
  • 9. 数据挖掘十大经典算法之——Naive Bayes 算法
  • 10. 数据挖掘十大经典算法之——CART 算法

简介

决策树 :采用自顶向下的递归方式,把一组无序的数据整理成类似于流程图的树结构。每个枝节点表示一个属性,每个分枝代表属性的一种选择,每个叶节点存放选择之后对应的结果(类标号)。一旦建立好了决策树,对于一个未给定类标号的样本元组,其跟踪一条由根节点到叶节点的路径,就可以得到一条对应的合取规则。(好理解吗,不好理解就上图!)

决策树的优势在于不需要任何领域知识或参数设置,适合于探测性的知识发现,故而常用于解决机器学习和数据挖掘中的统计分类问题,简单讲,它的目标就是将具有p维特征的n个样本分到c个类别中去。

常见的决策树算法有ID3、C4.5、CART。ID3使用信息熵的概念来做特征选择,然后通过学习数据来建立决策树。C4.5算法是对ID3算法的一个扩展,使用信息增益率来选择属性。

原理

步骤

特性

1. 优点
  • 1、直观易懂
  • 2、分类效率较高
  • 3、可以处理非离散数据
  • 4、可以处理不完整数据
  • 5、通过剪枝调整树模型
2. 缺点
  • 1、不适合处理大量数据。在构造树的过程中,需要对数据集进行多次顺序扫描和排序,因而导致算法的低效。
  • 2、对分类敏感

案例

代码

学术

  • 【算法调优】数据挖掘中改进的C4.5决策树分类算法

应用

凭借其独特的特点及突出的优势,C4.5算法已经在金融、医疗等行业得到了成功的应用,在其他多领域也被广泛接受、研究应用。

  • 【金融】决策树C4.5算法在银行信贷业务工作中的应用研究
  • 【教育】决策树C4.5算法在学生成绩评估中的应用研究
  • 【医疗】基于决策树分类C4.5算法对乳腺肿块计算机辅助诊断的应用研究

参考资料

数据挖掘十大经典算法之——C4.5 算法相关推荐

  1. 决策树C4.5算法 c语言实现,数据挖掘十大经典算法(1) C4.5_决策树算法

    数据挖掘十大经典算法(1) C4.5_决策树算法 机器学习中,决策树是一个预测模型:他代表的是对象属性与对象值之间的一种映射关系.树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每 ...

  2. 数据挖掘十大经典算法之——EM 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  3. 数据挖掘十大经典算法之——Apriori 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  4. 数据挖掘十大经典算法之——PageRank 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  5. 数据挖掘十大经典算法之——Naive Bayes 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  6. 数据挖掘十大经典算法之——KNN 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  7. 数据挖掘十大经典算法之——AdaBoost 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  8. 数据挖掘十大经典算法之——K-Means 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  9. 数据挖掘十大经典算法(转载)

    数据挖掘十大经典算法 一.C4.5      C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基 ...

最新文章

  1. win10系统优化计算机,全面优化win10电脑系统详细教程 | 专业网吧维护
  2. HTTP 错误 404.15 - Not Found请求筛选模块被配置为拒绝包含的查询字符串过长的请求...
  3. webpack打包js文件
  4. Java和Python中类似Kotlin的生成器,续:附加参数
  5. java并发编程实战:第十四章----构建自定义的同步工具
  6. Dubbo项目简单实践
  7. 一个MySQL 5.7 分区表性能下降的案例分析
  8. FlexSPI driver用法
  9. Docker-CE 入门
  10. 【二分法】计蒜客:二分快速幂
  11. Java HashSet的元素内容变化导致的问题
  12. JavaScript从父页面获取子页面的值(子页面又如何访问父页面)
  13. LAMP架构调优(十)——Apache禁止指定目录PHP解析与错误页面优化
  14. asp.net 操作Excel大全
  15. 基于Matlab的 傅里叶变换 绘制图形
  16. ubuntu安装rabbitvcs
  17. IDEA配置方法注释模板
  18. js判断页面第一次加载或者是否执行了刷新操作
  19. JAVA后台随机生成一个中文名字
  20. linux批量处理图片

热门文章

  1. mysql在mac下的data目录_Mysql在mac中目录结构用法命令
  2. python的git_Pygit: 用Python实现Git的功能
  3. python内置函数open_Python的内置函数open()的注意事项
  4. linux命令行ps1变量_Linux下SHELL的PS1变量简介
  5. 环信ease-sdk-3.3.4_r1 集成用户头像 昵称功能的简单处理方法
  6. CCF-CSP 201903-2 二十四点 Python语言 模拟栈实现
  7. C++输入输出类的层次
  8. C++拷贝构造函数(复制构造函数)详解
  9. xgboost防止过拟合
  10. php中调用脚本,PHP中如何调用RScript脚本(附代码)