数据挖掘十大经典算法之——C4.5 算法
数据挖掘十大经典算法系列,点击链接直接跳转:
- 数据挖掘简介及十大经典算法(大纲索引)
- 1. 数据挖掘十大经典算法之——C4.5 算法
- 2. 数据挖掘十大经典算法之——K-Means 算法
- 3. 数据挖掘十大经典算法之——SVM 算法
- 4. 数据挖掘十大经典算法之——Apriori 算法
- 5. 数据挖掘十大经典算法之——EM 算法
- 6. 数据挖掘十大经典算法之——PageRank 算法
- 7 数据挖掘十大经典算法之——AdaBoost 算法
- 8. 数据挖掘十大经典算法之——KNN 算法
- 9. 数据挖掘十大经典算法之——Naive Bayes 算法
- 10. 数据挖掘十大经典算法之——CART 算法
简介
决策树 :采用自顶向下的递归方式,把一组无序的数据整理成类似于流程图的树结构。每个枝节点表示一个属性,每个分枝代表属性的一种选择,每个叶节点存放选择之后对应的结果(类标号)。一旦建立好了决策树,对于一个未给定类标号的样本元组,其跟踪一条由根节点到叶节点的路径,就可以得到一条对应的合取规则。(好理解吗,不好理解就上图!)
决策树的优势在于不需要任何领域知识或参数设置,适合于探测性的知识发现,故而常用于解决机器学习和数据挖掘中的统计分类问题,简单讲,它的目标就是将具有p维特征的n个样本分到c个类别中去。
常见的决策树算法有ID3、C4.5、CART。ID3使用信息熵的概念来做特征选择,然后通过学习数据来建立决策树。C4.5算法是对ID3算法的一个扩展,使用信息增益率来选择属性。
原理
步骤
特性
1. 优点
- 1、直观易懂
- 2、分类效率较高
- 3、可以处理非离散数据
- 4、可以处理不完整数据
- 5、通过剪枝调整树模型
2. 缺点
- 1、不适合处理大量数据。在构造树的过程中,需要对数据集进行多次顺序扫描和排序,因而导致算法的低效。
- 2、对分类敏感
案例
代码
学术
- 【算法调优】数据挖掘中改进的C4.5决策树分类算法
应用
凭借其独特的特点及突出的优势,C4.5算法已经在金融、医疗等行业得到了成功的应用,在其他多领域也被广泛接受、研究应用。
- 【金融】决策树C4.5算法在银行信贷业务工作中的应用研究
- 【教育】决策树C4.5算法在学生成绩评估中的应用研究
- 【医疗】基于决策树分类C4.5算法对乳腺肿块计算机辅助诊断的应用研究
参考资料
数据挖掘十大经典算法之——C4.5 算法相关推荐
- 决策树C4.5算法 c语言实现,数据挖掘十大经典算法(1) C4.5_决策树算法
数据挖掘十大经典算法(1) C4.5_决策树算法 机器学习中,决策树是一个预测模型:他代表的是对象属性与对象值之间的一种映射关系.树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每 ...
- 数据挖掘十大经典算法之——EM 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——Apriori 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——PageRank 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——Naive Bayes 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——KNN 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——AdaBoost 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——K-Means 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法(转载)
数据挖掘十大经典算法 一.C4.5 C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基 ...
最新文章
- win10系统优化计算机,全面优化win10电脑系统详细教程 | 专业网吧维护
- HTTP 错误 404.15 - Not Found请求筛选模块被配置为拒绝包含的查询字符串过长的请求...
- webpack打包js文件
- Java和Python中类似Kotlin的生成器,续:附加参数
- java并发编程实战:第十四章----构建自定义的同步工具
- Dubbo项目简单实践
- 一个MySQL 5.7 分区表性能下降的案例分析
- FlexSPI driver用法
- Docker-CE 入门
- 【二分法】计蒜客:二分快速幂
- Java HashSet的元素内容变化导致的问题
- JavaScript从父页面获取子页面的值(子页面又如何访问父页面)
- LAMP架构调优(十)——Apache禁止指定目录PHP解析与错误页面优化
- asp.net 操作Excel大全
- 基于Matlab的 傅里叶变换 绘制图形
- ubuntu安装rabbitvcs
- IDEA配置方法注释模板
- js判断页面第一次加载或者是否执行了刷新操作
- JAVA后台随机生成一个中文名字
- linux批量处理图片
热门文章
- mysql在mac下的data目录_Mysql在mac中目录结构用法命令
- python的git_Pygit: 用Python实现Git的功能
- python内置函数open_Python的内置函数open()的注意事项
- linux命令行ps1变量_Linux下SHELL的PS1变量简介
- 环信ease-sdk-3.3.4_r1 集成用户头像 昵称功能的简单处理方法
- CCF-CSP 201903-2 二十四点 Python语言 模拟栈实现
- C++输入输出类的层次
- C++拷贝构造函数(复制构造函数)详解
- xgboost防止过拟合
- php中调用脚本,PHP中如何调用RScript脚本(附代码)