【机器学习实战】使用sklearn中的决策树对红酒数据集进行分类(Jupyter)
1. sklearn中的决策树
2. sklearn基本建模流程
3.决策树的基本流程
4.代码实现
4.1 数据集 —— 红酒
- 特征值(前13列)
- 目标值(3类)
4.2 代码及结果
4.2.1 预测部分
# 获取数据集
wine = load_wine()
# 划分数据集
x_train, x_test, y_train, y_test = train_test_split(wine.data, wine.target, test_size=0.3)
# 建模
clf = tree.DecisionTreeClassifier(criterion='entropy',random_state=30)
clf = clf.fit(x_train, y_train)
score = clf.score(x_test, y_test) # 分类的精确度
print(score)
结果:
4.2.2 绘制分类树
# 绘制树
feature_name = ['酒精','苹果酸','灰','灰的碱性','镁','总酚','类黄酮','非黄烷类酚类','花青素','颜色强度','色调','od280/od315稀释葡萄酒','脯氨酸']
class_name = ["琴酒","雪莉","贝尔摩德"]
dot_data = tree.export_graphviz(clf,feature_names = feature_name,class_names = class_name,filled = True,rounded = True)
graph = graphviz.Source(dot_data)
graph
结果:
4.2.3 特征重要性
# 特征重要性
clf.feature_importances_
[*zip(feature_name, clf.feature_importances_)]
结果
5.参数选择
5.1 max_depth 选择
%matplotlib inline
import matplotlib.pyplot as plttest = []for i in range(10): clf = tree.DecisionTreeClassifier(max_depth = i+1,criterion='entropy',random_state=30)clf = clf.fit(x_train, y_train)score = clf.score(x_test, y_test)test.append(score)plt.plot(range(1,11), test, color='red', label='max_depth')
plt.legend()
plt.show()
结果:
参考: sklearn菜菜的b站视频以及文档。
【机器学习实战】使用sklearn中的决策树对红酒数据集进行分类(Jupyter)相关推荐
- 利用sklearn中的Kmeans对seeds_dataset数据集进行分类分析
目录 前言 一.k-means主要步骤 二.数据集 三.不使用PCA降维 1.读入数据 2.找簇心 3.训练以及评估 4.完整代码 四.使用PCA降维 五.对比结果 前言 本篇文章是主要讲述利用skl ...
- 【阿旭机器学习实战】【13】决策树分类模型实战:泰坦尼克号生存预测
[阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. 本文用机器学习中的决策树分类模型对泰坦尼克号生存项目进行预测. 关于决策树的详细介绍及原理参见前一 ...
- 【ML/DL】python3学习《机器学习实战》书中的报错及解决办法
python3学习<机器学习实战>书中的报错及解决办法(更新中) <机器学习实战>是一本很不错的书,其采用的是py2的语法格式,在用最新的python3.6编写代码的过程中,书 ...
- sklearn中的决策树(分类)
本文在我的知乎上同步更新:sklearn中的决策树(分类) - 知乎 Sklearn库有很多机器学习模型,不同的模型有着不同的特点,针对不同的问题,选取对应的模型,可以很好地解决问题.树模型作为经典的 ...
- sklearn中的决策树(回归)
本文在我的知乎上同步分享:sklearn中的决策树(分类) - 知乎 前面提到,sklearn中的tree模组有DecisionTreeClassifier与DecisionTreeRegressor ...
- 机器学习实验:使用sklearn的决策树算法对葡萄酒数据集进行分类
机器学习实验:使用sklearn的决策树算法对葡萄酒数据集进行分类 问题如下: 使用sklearn的决策树算法对葡萄酒数据集进行分类,要求: ①划分训练集和测试集(测试集占20%) ②对测试集的预测类 ...
- 【机器学习实战】利用sklearn中的随机森林对红酒数据集进行分类预测
1. sklearn中的集成算法 sklearn中的集成算法模块ensemble 2.预测代码及结果 %matplotlib inline from sklearn.tree import Decis ...
- 免费课程 | 云脑机器学习实战训练营,中美大咖携手带你飞!
随着机器学习的不断发展,人工智能掀起了新一轮的热潮.这次人工智能的复兴,最大的特点就是AI能够走入业界的真实应用场景,与商业模式紧密结合,开始在产业界发挥出真正的价值. 在业界的真实应用中,如何挖掘用 ...
- 决策树5:剪枝与sklearn中的决策树
0x01 剪枝 当训练数据量大.特征数量较多时构建的决策树可能很庞大,这样的决策树用来分类是否好?答案是否定的. 决策树是依据训练集进行构建的,为了尽可能正确地分类训练样本,结点划分过程将不断重复,有 ...
最新文章
- int整数型转换char*字符串
- 实现一个对象验证库系列 -- 1) 接口介绍以及总体思路概述 (请大神批评)
- opencv python 生成画布_用Python做自己的2020专属Flag动图
- dorado 刷新_5.dorado查询开发:使用flushData方法 (T1)
- Vue.js + Nuxt.js 项目中使用 Vee-validate 表单校验
- gfi截图_GFI Backup Home Edition是Windows的免费数据备份实用程序
- 深入浅出Dotnet Core的项目结构变化
- 全新尝试|ComponentOne WinForm和.NET Core 3.0
- 开发一个大数据网站做的铺垫
- MySQL 5.7.10 免安装配置
- 项目研发流程及管理之我见
- DSP定点与浮点计算
- 大学四年,因为这8个网站,我成为同学眼中的学霸。
- C语言设计农历万年历论文,万年历设计报告
- spring boot 和spring mvc区别
- LiteSpeed Web服务器“恢复所有侦听器”解决方法
- JZ6-旋转数组的最小数字
- 浙江省高考计算机重点知识,2017届浙江省新高考信息技术考试标准
- 曼昆《经济学原理》-微观经济学-随记(一)
- 分布式机器学习主要笔记