利用决策树进行鸢尾花数据集分类预测

  • 2 利用决策树进行鸢尾花数据集分类预测
    • 2.1 导入模块与加载数据
    • 2.2 划分数据
    • 2.3 模型创建与应用
    • 2.4 模型可视化

手动反爬虫,禁止转载: 原博地址 https://blog.csdn.net/lys_828/article/details/122045161(CSDN博主:Be_melting)

 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息

2 利用决策树进行鸢尾花数据集分类预测

2.1 导入模块与加载数据

在进行逻辑回归分类的过程中已经有使用过iris数据集,这里直接加载数据,并进行字段名称的修改。

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(color_codes=True)
%matplotlib inlineiris_df = pd.read_csv('../data/iris.csv',header=None)
col_name =   ['sepal length', 'sepal width', 'petal length', 'petal width', 'class']
iris_df.columns = col_name

输出结果如下。

通过info()方法查看各个字段的基本详情,输出结果如下。字段中数据已经是处理完整,没有需要清洗的部分。

2.2 划分数据

首先进行特征数据和标签数据的划分。

X = iris_df.drop(columns=['class'])
X.head(5)
y = iris_df['class']
y.head(5)

输出结果如下。

接着就是对数据集进行训练数据和测试数据的划分。在前一个案例中,数据量不超过20条,全部应用在模型中,而真实的环境中,为了保证模型的稳定性,需要进行训练和测试数据的划分,代码操作如下。

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.2)

输出结果如下。

2.3 模型创建与应用

#第一步:导入模型
from sklearn.tree import DecisionTreeClassifier
#第二步:模型初始化
model = DecisionTreeClassifier()
#第三步:模型训练
model.fit(X_train,y_train)
#第四步:模型预测
predictions = model.predict(X_test)
predictions
#第五步:模型评估
from sklearn.metrics import accuracy_score
score = accuracy_score(y_test,predictions)
score

输出结果如下。

如果日后有需要,觉得当前模型得分还行,可以进一步将模型保存本地。(根据个人需要选择)

import joblib
joblib.dump(model,'iris.joblib')

输出结果如下。

2.4 模型可视化

有了案例一的操作,对于模型预测的流程和结果可视化就简单了,对前面提及到了五个参数进行修改就可以了,代码如下。

from sklearn import tree
tree.export_graphviz(model,out_file='iris.dot',feature_names=['sepal length', 'sepal width', 'petal length', 'petal width'],class_names=sorted(y.unique()),label='all',rounded=True,filled=True)

输出结果如下。

对生成的文件,用软件打开后,生成的决策树图形结果如下。也可以参照案例一中的操作,将图片加载到jupyter notebook中,有兴趣可以进行数据的核验。

【机器学习】决策树案例二:利用决策树进行鸢尾花数据集分类预测相关推荐

  1. 利用神经网络对鸢尾花数据集分类

    利用神经网络对鸢尾花数据集分类 详细实现代码请见:https://download.csdn.net/download/weixin_43521269/12578696 一.简介 一个人工神经元网络是 ...

  2. (决策树,朴素贝叶斯,人工神经网络)实现鸢尾花数据集分类

    from sklearn.datasets import load_iris # 导入方法类iris = load_iris() #导入数据集iris iris_feature = iris.data ...

  3. 机器学习入门案例:鸢尾花数据集分类 绘制PR曲线

    案例使用鸢尾花数据集进行分类预测,并绘制评价分类性能的PR曲线图 认识分类任务和数据集 Iris(鸢尾花)数据集 案例演示中使用的是有监督的机器学习算法:SVM 支持向量机 建立模型的流程如下: 训练 ...

  4. orange实现逻辑回归_分别用逻辑回归和决策树实现鸢尾花数据集分类

    学习了决策树和逻辑回归的理论知识,决定亲自上手尝试一下.最终导出决策树的决策过程的图片和pdf.逻辑回归部分参考的是用逻辑回归实现鸢尾花数据集分类,感谢原作者xiaoyangerr 注意:要导出为pd ...

  5. 机器学习应用篇(七)——基于LightGBM的分类预测

    机器学习应用篇(七)--基于LightGBM的分类预测 文章目录 机器学习应用篇(七)--基于LightGBM的分类预测 一.Introduction 1 LightGBM的优点 2 LightGBM ...

  6. 用逻辑回归实现鸢尾花数据集分类(1)

    鸢尾花数据集的分类问题指导 -- 对数几率回归(逻辑回归)问题研究 (1) 这一篇Notebook是应用对数几率回归(Logit Regression)对鸢尾花数据集进行品种分类的.首先会带大家探索一 ...

  7. 实验一:鸢尾花数据集分类

    实验一:鸢尾花数据集分类 一.问题描述 利用机器学习算法构建模型,根据鸢尾花的花萼和花瓣大小,区分鸢尾花的品种.实现一个基础的三分类问题. 二.数据集分析 Iris 鸢尾花数据集内包含 3 种类别,分 ...

  8. ML机器学习算法(一): 基于逻辑回归的分类预测

    机器学习算法(一): 基于逻辑回归的分类预测 1 逻辑回归的介绍和应用 1.1 逻辑回归的介绍 逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个 ...

  9. 基于Adaboost实现鸢尾花数据集分类

    写在之前 提交内容分为两大部分: 一为Adaboost算法实现,代码在文件夹<算法实现>中,<提升方法笔记>为个人学习笔记. 二为基于Adaboost模型实现鸢尾花数据集分类, ...

最新文章

  1. Redis学习(2)-redis安装
  2. 怎么学JavaScript?
  3. Eclipse svn代码提交冲突
  4. Python实用笔记 (2)list和tuple
  5. mysql字符串逆时针旋转180度_mysql 函数示例(转)
  6. twisted系列教程十–可以变化的诗
  7. 贝壳“进社区”,让商业向文明靠拢
  8. Python生成词云
  9. asp.net简单的投票系统代码 转载牛腩兄弟的
  10. 财神:如何快速打造一个5万粉的微信公众号
  11. GitHub项目下载链接
  12. 【mpeg4】xvid参数分析
  13. 实战四:Kaggle自行车租赁预测比赛
  14. 软件专业面试心理测试题,面试心理测试题目,据说很准
  15. [禅悟人生]心不动才能真正认清自己
  16. 淘宝装修前需要了解的css小技巧
  17. 使用网络摄像头进行眼睛注视估计
  18. FICO 财务替代创建
  19. 中国矿业大学算法概论作业一A、锯木棒
  20. 深度学习方面的论文整理

热门文章

  1. Cocos2d-x碰撞检测原理与英雄要打死怪物--之游戏开发《赵云要格斗》(7)
  2. mybatis学习(四)连接池、事务、动态SQL、多表查询
  3. 创建Maven项目报错
  4. 什么是微服务以及微服务的技术点
  5. access自动自动累计余额_云表:逐行累计余额的设计方法(填报篇)
  6. 一些好的免费网络电视软件!!
  7. 小型web服务器的编写
  8. 高职高专计算机类教师招聘计划,2021年这类教师招聘8.4万人,专科生的福利,服务期满就能入编?...
  9. 网站应加强个性化建设 提升SEO优化效果分析
  10. 词根生词要打印加上汉译