在前面的介绍当中,通过代码+注解的方式讲解了决策树的原理,而在可视化中通常调用对应的库会比较方便,这篇文章主要是可视化前的数据处理(若有错误的地方,请大家指教,谢谢!)

1、数据处理

import panda as pd
import numpy as np
#这里我们假设数据集的最后一列时类别标签,其他的都是特征标签
#为excel文件时
data = pd.read_excel(r"数据路径")#前边的r是对斜杠进行转义,当读取报错时可以加上r
index  = data.index#获取数据集的行索引
columns = data.columns#获取数据集的列索引
feature = [];label = []#分别储存特征和类别
m,n = np.shape(data)
for i in data.index:feature.append(data.loc[i].values[0:m])label.append(data.loc[i].values[-1])
print(feature)
print(label)#为csv文件时
# data = pd.read_csv("数据路径")#注意这里的csv格式要是utf-8编码的,若报错则改成data1 = pd.read_csv("百香果.csv",encoding = 'utf-8'),其他的代码跟上面excel文件的时一样的#为txt文件时
filepath = '数据路径'
f = open(filepath)
f = f.readlines()
feature = [];label = [];feature_name = []
n=1
for line in f:line = line.strip()#将回车符去掉line = line.split('\t')#将各数据分开L = len(line)#读取行的长度if(n==1):feature_name.append(line)#若第一行是特征和类别的名称,则添加这一循环else:feature.append(line[0:L-1])label.append(line[-1])n =n+1
print(feature)
print(label)

2、决策树可视化

这里使用的是dtreeviz可视化库,也可以用graphviz库,两个库调用的代码相似,但相比graphviz,dtreeviz可视化更美观。这里的实例是直接导入sklearn.datasets中boston的数据。

from sklearn import tree
from sklearn.datasets import load_boston
from dtreeviz.trees import dtreevizboston = load_boston()
graph = tree.DecisionTreeRegressor(max_depth=3)
graph.fit(boston.data, boston.target)viz = dtreeviz(graph,x_data=boston.data,#x_data即feature特征y_data=boston.target,#y_data即label类别target_name='price',#类别的名称feature_names=boston.feature_names,#特征的名称title="Decision Tree - Boston housing",show_node_labels=True)
# viz.save('dtreeviz.svg')#保存的图
# viz.view()#查看决策树图

决策树可视化以及数据所要的处理(查漏补缺)相关推荐

  1. 关于决策树可视化各项展示数据的解读(泰坦尼克号预测生还案例Titanic)

    本人是业余的编程爱好者,非职业程序员,如有解读错误的地方,欢迎大牛评论指正. 我写这个的动力是:我一晚上花了大量的时间在网上找了各种关于决策树可视化的图中sex=male<0.5或sex=fem ...

  2. 独家 | 全面!手把手教你决策树可视化(附链接代码)

    作者: Terence Parr, Prince Grover 翻译:王雨桐 校对:詹好 本文长度约为9500字,建议阅读10+分钟 本文分析了决策树可视化中的关键因素,比较了现有的可视化工具.并通过 ...

  3. python决策树可视化_「决策树」| Part3—Python实现之可视化

    文章首发于微信公众号:AlgorithmDeveloper,专注机器学习与Python,编程与算法,还有生活. 1.前言 「决策树」| Part2-Python实现之构建决策树中我们已经可以基于给定数 ...

  4. 决策树可视化保姆级教程

    决策树可视化指南 决策树是机器学习的一种经典的模型,因其泛化性能好,可解释性强而被广泛应用到实际商业预测中.通常在我们完成决策树模型搭建后,我们会进一步研究分析我们搭建好的模型,这时候模型的可视化就显 ...

  5. 泰坦尼克号沉船数据分析与可视化、数据建模与分类预测【Python | 机器学习-Sklearn】

    泰坦尼克号沉船数据之美--起于悲剧,止于浪漫 前言:泰坦尼克号,不只是卡梅隆导演的经典电影,它是一个真实存在的悲剧,也是电影的故事背景与题材.作为一个IT人,分析事实还得看数据,了解到泰坦尼克号沉船幸 ...

  6. 利用sklearn中 ID3算法实现简单的课程销量预测+决策树可视化

    决策树中ID3算法是一种贪心算法,用来构造决策树.ID3算法主要用到每个属性的信息增益,使用到信息熵.ID3算法计算每个属性的信息增益,并选取具有最高增益的属性作为给定集合的测试属性.对被选取的测试属 ...

  7. java+决策树结构_机器学习——决策树,DecisionTreeClassifier参数详解,决策树可视化查看树结构...

    释放双眼,带上耳机,听听看~! 0.决策树 决策树是一种树型结构,其中每个内部节结点表示在一个属性上的测试,每一个分支代表一个测试输出,每个叶结点代表一种类别. 决策树学习是以实例为基础的归纳学习 决 ...

  8. 决策树可视化及模型评估 SE SP AUC

    目录 2.1 决策树 2.1.1 样本数据集 2.1.2 决策树可视化 2.2 模型分类性能预测 2.2.1 模型稳定性 2.2.2 SE.SP.ACC分类性能预测 # 代码实现 2.1 决策树 2. ...

  9. 全面 :手把手教你决策树可视化(附链接代码)

    作者: Terence Parr, Prince Grover 翻译:王雨桐 校对:詹好 本文长度约为9500字,建议阅读10+分钟 本文分析了决策树可视化中的关键因素,比较了现有的可视化工具.并通过 ...

最新文章

  1. 翻译Python编程无师自通——专业程序员的养成
  2. mysql保存数据提示:Out of range value for column错误
  3. loadrunner—参数化
  4. vuecli3配置webpack_vue CLI3的优化
  5. c语言常用符号与英文,C语言常用符号与英文(7页)-原创力文档
  6. 利用Redis实现消息队列原理
  7. 【转】ASPX和HTML获取系统根目录的路径
  8. 用session实现html登录页面跳转页面跳转页面跳转,js判断登录与否并确定跳转页面的方法...
  9. 如何绑定多个action到一个slot
  10. java 异常处理向处机制笔记
  11. python的datetime.strptime_Python strptime()和时区?
  12. 从谷歌浏览器复制不带样式_文字特效游戏海报特效字体photoshop字体图层样式
  13. mysql存储过程 begin_MySQL存储过程的BEGIN和END
  14. 当自监督遇上语言-图像预训练,UC伯克利提出多任务框架SLIP
  15. 操作系统学习笔记以及个人见解
  16. 微软补丁日安全公告|11月份
  17. apkg格式怎么打开_干货:pdf转换器简单、好用,还能在线互转文件格式!
  18. 贪心科技机器学习训练营(十二)
  19. 【生活中的逻辑谬误】功利误导和情感误导
  20. 为什么使用用友盟的摇一摇截屏功能,截出来的地图图片是黑屏的,渴求大师解答,感激不尽

热门文章

  1. 微信营销与博客营销的区别
  2. H型钢的尺寸的设计与使用(市场上可以轻松采购)
  3. 判断点P是否在三角形ABC内
  4. 中标麒麟系统下(Neokylin7)达梦数据库的安装(DM8)
  5. 基于神经网络识别抑郁症附matlab代码
  6. 腾讯通报内部反腐情况:开出48人惩治名单;华为预计2022年全员每股分红1.61元;Chromium使用Rust语言|极客头条
  7. java练习-String类、StringBuilder类、StringBuffer类10
  8. 大型语言模型的推理演算
  9. mac软件卸载不干净?你没用对工具!!试试这款mac卸载神器!
  10. 计算机常用的颜色模式有,ps的颜色模式有哪些