机器学习:iris数据集
目录
- 一、iris数据集简介
- 二、基本数据操作
一、iris数据集简介
iris数据集的中文名是安德森鸢尾花卉数据集,英文全称是Anderson`s Iris data set。iris包含150个样本,对应数据集的每行数据。每行数据包含每个样本的四个特征,所以iris数据集是一个150行4列的二维表。
通俗地说,iris数据集是用来给花做分类的数据集,每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度四个特征,我们需要建立一个分类器,分类器可以通过样本的四个特征来判断样本属于山鸢尾(setosa)、变色鸢尾(versicolor)、维吉尼亚鸢尾(virginica)这三个品种中的哪一个。
iris常用于监督式学习中分类模型:根据花的四个特征预测鸢尾花卉属于(iris-setosa,iris-versicolour,iris-virginica)中的哪一品种。
二、基本数据操作
# iris数据集加载
from sklearn import datasets
iris = datasets.load_iris()
#展示数据
#print(iris.data)
#展示每列的属性名
print(iris.feature_names)
#展示输出目标结果以及结果的含义
print(iris.target)
print(iris.target_names)
#查看输入和输出数据类型
print(type(iris.data))
print(type(iris.target))
#确认行列维度
print(iris.data.shape)
print(iris.target.shape)
[‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’]
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2]
[‘setosa’ ‘versicolor’ ‘virginica’]
<class ‘numpy.ndarray’>
<class ‘numpy.ndarray’>
(150, 4)
(150,)
import pandas as pd
from sklearn import datasets
iris = datasets.load_iris()
df =pd.DataFrame(data =iris.data,columns = iris.feature_names)
df['class'] =iris.target
df['class'] =df['class'].map({0: iris.target_names[0], 1: iris.target_names[1], 2: iris.target_names[2]})
print(df.head(10))
#print(df.describe())
机器学习:iris数据集相关推荐
- Python机器学习iris数据集预处理和模型训练
机器学习模型训练 一.iris数据集简介 二.基本数据操作和模型训练 一.iris数据集简介 iris数据集的中文名是安德森鸢尾花卉数据集,英文全称是Anderson`s Iris data set. ...
- 机器学习--Iris数据集的Fisher线性分类以及数据可视化技术的学习
Iris数据集的Fisher线性分类以及数据可视化技术的学习 1.Iris数据集的Fisher线性分类 2.数据可视化技术的学习 1.数据集介绍 2.观看数据前5行 3.特征工程 1.数据清洗 2.数 ...
- [机器学习-sklearn]鸢尾花Iris数据集
鸢尾花数据集 1. 鸢尾花Iris数据集介绍 2. Sklearn代码获取Iris 2. 描述性统计 3. 箱线图 4. 数据分布情况 1. 鸢尾花Iris数据集介绍 Iris flower数据集是1 ...
- 机器学习笔记2 – sklearn之iris数据集
前言 本篇我会使用scikit-learn这个开源机器学习库来对iris数据集进行分类练习. 我将分别使用两种不同的scikit-learn内置算法--Decision Tree(决策树)和kNN(邻 ...
- 从Iris数据集开始---机器学习入门
代码多来自<Introduction to Machine Learning with Python>. 该文集主要是自己的一个阅读笔记以及一些小思考,小总结. 前言 在开始进行模型训练之 ...
- 【机器学习算法】手动Python实现KNN分类算法,并用iris数据集检验模型效果
目录 一.KNN算法Python实现 1.导入包 2. 画图,展示不同电影在图上的分布 3.训练样本和待测样本准备 4.计算待测样本点到每个训练样本点的距离 5.查找离待测样本点最近的K个训练样本点的 ...
- Python机器学习实验二:1.编写代码,实现对iris数据集的KNN算法分类及预测
Python机器学习实验二:编写代码,实现对iris数据集的KNN算法分类及预测 1.编写代码,实现对iris数据集的KNN算法分类及预测,要求: (1)数据集划分为测试集占20%: (2)n_nei ...
- 机器学习之多模型融合预测iris数据集
一.多模型融合 众所周知,机器学习可以通过多个模型融合来提升模型的性能,近些年的各种算法大赛中前几名几乎都是多模型融合,比如在kaggle上的otto产品分类挑战赛中取得冠军和亚军成绩的模型都是融合了 ...
- 【统计学习方法】线性可分支持向量机对鸢尾花(iris)数据集进行二分类
本文摘要 · 理论来源:[统计学习方法]第七章 SVM · 技术支持:pandas(读csv).numpy.sklearn.svm.svm思想.matplotlib.pyplot(绘图) · 代码目的 ...
最新文章
- 【C++语法】回车与换行(vs2008)
- log4j配置不生效
- java 数据合并算法_Java与算法之(11) - 合并排序
- python程序实例教程基础-Python简单基础小程序的实例代码
- 糗事百科的网络爬虫(v0.2)源码及解析 .
- java实现连拍_Camera2连拍相关问题
- 西瓜书+实战+吴恩达机器学习(八)监督学习之朴素贝叶斯 Naive Bayes
- delphi dbgrideh 遍历每一个单元格_BFS 的使用场景:层序遍历、最短路径问题
- 多旋翼无人机动力系统发展历程
- 关于人工智能数据标注学习
- Oracle之同义词(SYNONYM)
- php微信客服,微信客服管理 - 微信公众平台开发者文档 - php中文网手册
- 德保罗大学计算机专业,德保罗大学计算机金融申请要求及专业介绍
- 23西南大学电子信息907专硕考研经验贴
- APP专项测试-弱网测试
- 如何在Google Chrome中手动设置位置信息
- 700m信号测试软件,5G(NR)中同步信号的测量(SS-RSRP)
- 什么是HashMap?
- 计算机基础考证强化训练范文,计算机基础知识题强化训练.doc
- 中企海外周报 | 华为企业业务将首登MWC;中国平安加速印尼金融业数字化转型...
热门文章
- 敢越级的电视画质卷王 TCL Q10G新品首发价4499元起
- Amazon EC2 CPU steal
- 浏览器WebSocket连接apollo的MQTT实现消息推送(WEB系统微信扫码登录)
- 数据库表中多对多关系怎么设计?
- word文档批量插入图片及其文件名
- 用Python保住“设计大哥“的头发,直接甩给他10000张参考图,爬虫采集【稿定设计】平面模板素材
- 块级作用域和函数作用域
- 差分盒维数的计算方法
- Mybatis报误错: Type interface com.xu.dao.IAccountDao is not known to the MapperRegistry.
- 数据库时间 用bigint_mysql数据库字段bigint使用