目录

  • 一、iris数据集简介
  • 二、基本数据操作

一、iris数据集简介

iris数据集的中文名是安德森鸢尾花卉数据集,英文全称是Anderson`s Iris data set。iris包含150个样本,对应数据集的每行数据。每行数据包含每个样本的四个特征,所以iris数据集是一个150行4列的二维表。

通俗地说,iris数据集是用来给花做分类的数据集,每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度四个特征,我们需要建立一个分类器,分类器可以通过样本的四个特征来判断样本属于山鸢尾(setosa)、变色鸢尾(versicolor)、维吉尼亚鸢尾(virginica)这三个品种中的哪一个。
iris常用于监督式学习中分类模型:根据花的四个特征预测鸢尾花卉属于(iris-setosa,iris-versicolour,iris-virginica)中的哪一品种。

二、基本数据操作

# iris数据集加载
from sklearn import datasets
iris = datasets.load_iris()
#展示数据
#print(iris.data)
#展示每列的属性名
print(iris.feature_names)
#展示输出目标结果以及结果的含义
print(iris.target)
print(iris.target_names)
#查看输入和输出数据类型
print(type(iris.data))
print(type(iris.target))
#确认行列维度
print(iris.data.shape)
print(iris.target.shape)

[‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’]
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2]
[‘setosa’ ‘versicolor’ ‘virginica’]
<class ‘numpy.ndarray’>
<class ‘numpy.ndarray’>
(150, 4)
(150,)

import pandas  as pd
from sklearn import datasets
iris = datasets.load_iris()
df =pd.DataFrame(data =iris.data,columns = iris.feature_names)
df['class'] =iris.target
df['class'] =df['class'].map({0: iris.target_names[0], 1: iris.target_names[1], 2: iris.target_names[2]})
print(df.head(10))
#print(df.describe())

机器学习:iris数据集相关推荐

  1. Python机器学习iris数据集预处理和模型训练

    机器学习模型训练 一.iris数据集简介 二.基本数据操作和模型训练 一.iris数据集简介 iris数据集的中文名是安德森鸢尾花卉数据集,英文全称是Anderson`s Iris data set. ...

  2. 机器学习--Iris数据集的Fisher线性分类以及数据可视化技术的学习

    Iris数据集的Fisher线性分类以及数据可视化技术的学习 1.Iris数据集的Fisher线性分类 2.数据可视化技术的学习 1.数据集介绍 2.观看数据前5行 3.特征工程 1.数据清洗 2.数 ...

  3. [机器学习-sklearn]鸢尾花Iris数据集

    鸢尾花数据集 1. 鸢尾花Iris数据集介绍 2. Sklearn代码获取Iris 2. 描述性统计 3. 箱线图 4. 数据分布情况 1. 鸢尾花Iris数据集介绍 Iris flower数据集是1 ...

  4. 机器学习笔记2 – sklearn之iris数据集

    前言 本篇我会使用scikit-learn这个开源机器学习库来对iris数据集进行分类练习. 我将分别使用两种不同的scikit-learn内置算法--Decision Tree(决策树)和kNN(邻 ...

  5. 从Iris数据集开始---机器学习入门

    代码多来自<Introduction to Machine Learning with Python>. 该文集主要是自己的一个阅读笔记以及一些小思考,小总结. 前言 在开始进行模型训练之 ...

  6. 【机器学习算法】手动Python实现KNN分类算法,并用iris数据集检验模型效果

    目录 一.KNN算法Python实现 1.导入包 2. 画图,展示不同电影在图上的分布 3.训练样本和待测样本准备 4.计算待测样本点到每个训练样本点的距离 5.查找离待测样本点最近的K个训练样本点的 ...

  7. Python机器学习实验二:1.编写代码,实现对iris数据集的KNN算法分类及预测

    Python机器学习实验二:编写代码,实现对iris数据集的KNN算法分类及预测 1.编写代码,实现对iris数据集的KNN算法分类及预测,要求: (1)数据集划分为测试集占20%: (2)n_nei ...

  8. 机器学习之多模型融合预测iris数据集

    一.多模型融合 众所周知,机器学习可以通过多个模型融合来提升模型的性能,近些年的各种算法大赛中前几名几乎都是多模型融合,比如在kaggle上的otto产品分类挑战赛中取得冠军和亚军成绩的模型都是融合了 ...

  9. 【统计学习方法】线性可分支持向量机对鸢尾花(iris)数据集进行二分类

    本文摘要 · 理论来源:[统计学习方法]第七章 SVM · 技术支持:pandas(读csv).numpy.sklearn.svm.svm思想.matplotlib.pyplot(绘图) · 代码目的 ...

最新文章

  1. 【C++语法】回车与换行(vs2008)
  2. log4j配置不生效
  3. java 数据合并算法_Java与算法之(11) - 合并排序
  4. python程序实例教程基础-Python简单基础小程序的实例代码
  5. 糗事百科的网络爬虫(v0.2)源码及解析 .
  6. java实现连拍_Camera2连拍相关问题
  7. 西瓜书+实战+吴恩达机器学习(八)监督学习之朴素贝叶斯 Naive Bayes
  8. delphi dbgrideh 遍历每一个单元格_BFS 的使用场景:层序遍历、最短路径问题
  9. 多旋翼无人机动力系统发展历程
  10. 关于人工智能数据标注学习
  11. Oracle之同义词(SYNONYM)
  12. php微信客服,微信客服管理 - 微信公众平台开发者文档 - php中文网手册
  13. 德保罗大学计算机专业,德保罗大学计算机金融申请要求及专业介绍
  14. 23西南大学电子信息907专硕考研经验贴
  15. APP专项测试-弱网测试
  16. 如何在Google Chrome中手动设置位置信息
  17. 700m信号测试软件,5G(NR)中同步信号的测量(SS-RSRP)
  18. 什么是HashMap?
  19. 计算机基础考证强化训练范文,计算机基础知识题强化训练.doc
  20. 中企海外周报 | 华为企业业务将首登MWC;中国平安加速印尼金融业数字化转型...

热门文章

  1. 敢越级的电视画质卷王 TCL Q10G新品首发价4499元起
  2. Amazon EC2 CPU steal
  3. 浏览器WebSocket连接apollo的MQTT实现消息推送(WEB系统微信扫码登录)
  4. 数据库表中多对多关系怎么设计?
  5. word文档批量插入图片及其文件名
  6. 用Python保住“设计大哥“的头发,直接甩给他10000张参考图,爬虫采集【稿定设计】平面模板素材
  7. 块级作用域和函数作用域
  8. 差分盒维数的计算方法
  9. Mybatis报误错: Type interface com.xu.dao.IAccountDao is not known to the MapperRegistry.
  10. 数据库时间 用bigint_mysql数据库字段bigint使用