(一)iris数据集简介

Iris数据集是机器学习任务中常用的分类实验数据集,由Fisher在1936收集整理。Iris中文名是安德森鸢尾花卉数据集,英文全称是Anderson’s Iris data set,是一类多重变量分析的数据集。Iris一共包含150个样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

通俗地说,iris数据集是用来给莺尾花做分类的数据集,每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度四个特征(下表中的前4列),我们需要建立一个分类器,该分类器可通过样本的四个特征来来判断样本属于山鸢尾(Setosa)、变色鸢尾(Versicolour)还是维吉尼亚鸢尾(Virginica)中的哪一个,即机器学习中的分类问题。

iris的每个样本都包含了品种信息,即目标属性(第5列,也叫target或label)。

样本局部截图:

将样本中的4个特征两两组合(任选2个特征分别作为横轴和纵轴,用不同的颜色标记不同品种的花),可以构建12种组合(其实只有6种,另外6种与之对称),如图所示:

(二)基于ski-kit的iris数据集

python的数据挖掘/机器学习库scikit已经内置了iris数据集,如果运行环境并没有安装sklearn,可通过pip install sklearn命令进行安装。

这里使用pychram环境来查看sklearn内置的iris数据集,如下所示:

import sklearnif __name__ == '__main__':iris = sklearn.datasets.load_iris()# data对应了样本的4个特征,150行4列print('>> shape of data:')print(iris.data.shape)# 显示样本特征的前5行print('>> line top 5:')print(iris.data[:5])# target对应了样本的类别(目标属性),150行1列print('>> shape of target:')print(iris.target.shape)# 显示所有样本的目标属性print('>> show target of data:')print(iris.target)

每条命令的运行结果如下:

其中,iris.target用0、1和2三个整数分别代表了花的三个品种
关于分类,我们使用了Iris数据集,这个scikit-learn自带了,在pkgs目录下搜索:iris.csv即可。

from sklearn.datasets import load_iris
iris = load_iris()

(转载)基于sklearn的iris数据集及简介相关推荐

  1. Dataset之IRIS:莺尾(Iris)数据集的简介、安装、使用方法之详细攻略

    Dataset之IRIS:莺尾(Iris)数据集的简介.安装.使用方法之详细攻略 莺尾(Iris)数据集的简介      IRIS数据集,也称鸢尾花卉数据集,是一类多重变量分析的数据集.数据集包含15 ...

  2. Dataset之IRIS:莺尾(Iris)数据集的简介、下载、使用方法之详细攻略

    Dataset之IRIS:莺尾(Iris)数据集的简介.下载.使用方法之详细攻略 目录 莺尾(Iris)数据集的简介 莺尾(Iris)数据集的下载 莺尾(Iris)数据集的使用方法 莺尾(Iris)数 ...

  3. 混淆矩阵是什么?Python多分类的混淆矩阵计算及可视化(包含原始混淆矩阵及归一化的混淆矩阵):基于skelarn框架iris数据集

    混淆矩阵是什么?Python多分类的混淆矩阵计算及可视化(包含原始混淆矩阵及归一化的混淆矩阵):基于skelarn框架iris数据集 目录

  4. [机器学习-sklearn]鸢尾花Iris数据集

    鸢尾花数据集 1. 鸢尾花Iris数据集介绍 2. Sklearn代码获取Iris 2. 描述性统计 3. 箱线图 4. 数据分布情况 1. 鸢尾花Iris数据集介绍 Iris flower数据集是1 ...

  5. 机器学习笔记2 – sklearn之iris数据集

    前言 本篇我会使用scikit-learn这个开源机器学习库来对iris数据集进行分类练习. 我将分别使用两种不同的scikit-learn内置算法--Decision Tree(决策树)和kNN(邻 ...

  6. 机器学习(一) 基于sklearn库的数据集划分(交叉验证)

    机器学习中首要环节就是数据集的处理,其中数据集的处理从个人理解(如有错误敬请谅解)的角度来说包括两个方面:数据集划分和数据清理.其中数据集划分是指训练集.验证集和测试集的数据类别划分:数据清理是指数据 ...

  7. python聚类分析散点图_使用sklearn对iris数据集进行聚类分析

    导入库 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns fro ...

  8. Sklearn学习-iris数据集学习

    Sklearn学习-逻辑回归(iris数据集) 使用load_iris加载数据集,查看包含的keys 查看数据的列名,分类目标的名称 获取data和target,并打印各自的shape 拆分训练集和测 ...

  9. 利用SVM,sklearn对iris数据集进行分类

    摘要 hello,又见面了,这次写的是New York university homework4 ,题目是SVM Classifier with different kernels 首先,了解一下数据 ...

最新文章

  1. HDOJ 2546饭卡(01背包问题)
  2. android surfaceview 图片,为啥从SurfaceView中获取不到图片?
  3. 毫米波雷达数据处理_基于毫米波雷达的桥梁静挠度采集系统
  4. 订单派送中多久能送到_美森卡派送到仓库后多久能上架呢?
  5. HUE Load Balancer 启动失败
  6. matlab虚拟现实之V-Realm Builder2建模第二部分
  7. 【JSOI2007】【BZOJ1029】建筑抢修(贪心,堆)
  8. idea查看git分支快捷键_开发常用Git/Linux/idea命令快捷键总结(持续更新)
  9. selenium webdriver——鼠标事件
  10. 郑州大学期末php试题,郑州大学英语期末考试试题及答案
  11. 一款使用RxJava+Retrofit+MVP的快播App开源啦!
  12. 代理 傲澜智伴机器人_机器人厂家_智伴机器人代理,莆田智伴机器人,傲澜智伴机器人(查看)_一呼百应网...
  13. Google Ads关键词不展示原因及解决方案
  14. 安全测试-渗透性测试
  15. YDOOK: Python:requests: Scanic: 客户端 client 向服务器请求照片并返回 post请求
  16. 2022-2028全球阿兹夫定片行业市场现状及未来发展趋势
  17. 破解蛋白质结构秘密的AlphaFold
  18. 你一定没见过的windows操作系统——windows93
  19. 德云一哥岳云鹏,准备录制河南和东方卫视节目,央视春晚还参加吗
  20. Metaverse 元宇宙入门-02-Hardware 硬件与元宇宙

热门文章

  1. python系列11:python的游戏引擎
  2. android 7.0原生room,小米5S 安卓9.0 原生体验 LineageOS16.0 ROOT
  3. 文墨绘学【书法双师】
  4. 五款免费同步备份软件介绍
  5. wegame 取消直播提醒
  6. JVM、JDK、JRE分别表示什么含义
  7. 微信小程序+云开发+数据库使用
  8. 【EGE】五子棋小游戏 (鼠标控制)
  9. 《Python编程:从入门到实践》配套资源 官方网站免费下载
  10. 记录使用Elasticsearch报错:FORBIDDEN/12/index read-only / allow delete (api)];]; nested exception is Elasti