鸢尾花数据集

Iris 鸢尾花数据集内包含 3 类分别为山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica),共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度。

  • sepallength:萼片长度
  • sepalwidth:萼片宽度
  • petallength:花瓣长度
  • petalwidth:花瓣宽度

以上四个特征的单位都是厘米(cm)

1、如何导入存在数字和文本的数据集。

2、求出鸢尾属植物萼片长度的平均值、中位数和标准差。

3、创建一种标准化形式的鸢尾属植物萼片长度,其值正好介于0和1之间,这样最小值为0,最大值为1。

4、找到鸢尾属植物萼片长度的第5和第95百分位数。

5、把iris_data数据集中的20个随机位置修改为np.nan值。

6、在iris_data的sepallength中查找缺失值的个数和位置。

7、筛选具有 sepallength(第1列)< 5.0 并且 petallength(第3列)> 1.5 的 iris_data行。

8、选择没有任何 nan 值的 iris_data行。

9、计算 iris_data 中sepalLength(第1列)和petalLength(第3列)之间的相关系数。

10、找出iris_data是否有任何缺失值。

11、在numpy数组中将所有出现的nan替换为0。

12、找出鸢尾属植物物种中的唯一值和唯一值出现的数量。

13、将 iris_data 的花瓣长度(第3列)以形成分类变量的形式显示。定义:Less than 3 -->‘small’;3-5 --> ‘medium’;’>=5 --> ‘large’。

14、在 iris_data 中创建一个新列,其中 volume 是 (pi x petallength x sepallength ^ 2)/ 3 。

15、随机抽鸢尾属植物的种类,使得Iris-setosa的数量是Iris-versicolor和Iris-virginica数量的两倍。

16、根据 sepallength 列对数据集进行排序。

17、在鸢尾属植物数据集中找到最常见的花瓣长度值。

18、在鸢尾花数据集的 petalwidth(第4列)中查找第一次出现的值大于1.0的位置。

数据分析——鸢尾花数据集相关推荐

  1. 【python数据挖掘课程】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

    这是<Python数据挖掘课程>系列文章,也是我这学期上课的部分内容.本文主要讲述鸢尾花数据集的各种分析,包括可视化分析.线性回归分析.决策树分析等,通常一个数据集是可以用于多种分析的,希 ...

  2. Iris鸢尾花数据集可视化、线性回归、决策树分析、KMeans聚类分析

    在进行可视化及聚类分析前,我们需要为IDLE安装sklearn库,scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上能够为用户提 ...

  3. orange实现逻辑回归_分别用逻辑回归和决策树实现鸢尾花数据集分类

    学习了决策树和逻辑回归的理论知识,决定亲自上手尝试一下.最终导出决策树的决策过程的图片和pdf.逻辑回归部分参考的是用逻辑回归实现鸢尾花数据集分类,感谢原作者xiaoyangerr 注意:要导出为pd ...

  4. 机器学习之有监督学习实例_01 —— 鸢尾花数据集的分类

    Iris 数据集简介 : Iris Data Set(鸢尾属植物数据集)首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文<The use of multiple ...

  5. 鸢尾花数据集、月亮数据集二分类可视化分析

    鸢尾花数据集.月亮数据集二分类可视化分析 目录 鸢尾花数据集.月亮数据集二分类可视化分析 一.线性LDA算法 1.LDA算法 2.鸢尾花数据集 2.月亮数据集 二.K-Means算法 1.K-Mean ...

  6. python机器学习之门之sklearn的使用(使用鸢尾花数据集)

    sklearn全称为scikit learn 专门提供了python机器学习的模块 是一个高效的数据分析算法工具 建议在numpy scipy matplotlib上 对于大多数机器学习 通常有以下四 ...

  7. 机器学习(1)机器学习基础 鸢尾花数据集

    目录 一.机器学习基础理论 1.机器学习过程 2.机器学习分类 3.数据集返回值介绍 二.鸢尾花数据集(实战) 1.首先是获取数据集 2.显示数据集信息(可以不要) 三.数据集划分 1.数据集划分AP ...

  8. TensorFlow基础1(波士顿房价/鸢尾花数据集可视化)

    记录TensorFlow听课笔记 文章目录 记录TensorFlow听课笔记 一,波士顿房价数据集可视化 1.1介绍波士顿房价数据集 1.2波士顿房价数据集加载 1.3将平均房间数与房价之间的关系可视 ...

  9. tensorflow下载鸢尾花数据集

    代码 #!/usr/bin/env python # -*- encoding: utf-8 -*- """ @Introduce : tensorflow从指定地址下载 ...

  10. 线性回归实例-鸢尾花数据集

    文章目录 一.具体实现步骤 1. 导入Iris鸢尾花数据集 2. 提取花瓣数据 3. 拆分数据 4. 训练模型 二.可视化结果展示 1. 训练集 2. 测试集 三.相关知识点讲解 1. train_t ...

最新文章

  1. 用通配符解决mappingResources的繁琐配置
  2. Captain Icon – 350+ 有趣的矢量图标免费下载
  3. 关于#!/bin/sh 和 #!/bin/bash 的差别
  4. sql时间转换时分秒_SQL数据库中的是年月日时分秒格式的,什么语句能实现年月日的查询?...
  5. linux lvm 系统快照,利用Linux LVM进行快照备份
  6. A folder failed to be moved——Android SDK的安装问题解决方案
  7. 阿里巴巴成立云原生技术委员会,云原生升级为阿里技术新战略
  8. 斐波那契数列矩阵快速幂
  9. 安装ORACLE 11.2.0.3 错误
  10. Zookeeper基于Java访问-权限
  11. 战神4 幕后花絮 概念艺术_幕后花絮:品牌更新的背后
  12. 栈应用_将算式转成按运算符优先级分布(代码、分析、汇编)
  13. 政策解读:《智能硬件产业创新发展专项行动(2016-2018年)》(上)
  14. 机器学习算法(5)——决策树(ID3、C4.5、CART)
  15. java xml 表达式语言_中级Java开发工程师笔试题
  16. arduino水温度传感器数字显示_液晶显示屏应用示例以及程序详解
  17. java button jbutton_java程序将Button改成JButton,该如何改?
  18. docker容器别人访问很卡_docker容器下远程访问jupyter的方式
  19. “一天搞懂深度学习”笔记
  20. 虚拟机游戏服务器更新物品,【青云志】虚拟机镜像一键服务端+全物品ID配套客户端+图文架设教程+GM工具...

热门文章

  1. python模拟火车票订票系统_除夕火车票明天开售,上海各大火车站售票时间都在这...
  2. android ios9 rom,安卓党也能用上IOS9了 奇兔刷机首发24款机型仿IOS9 ROM
  3. 提取关键字 结巴分词_结巴分词5--关键词抽取
  4. 国军标GJB 151B-2013军用设备和分系统电磁发射和敏感度要求与测量(海军10项)
  5. 最大同性恋交友网站 github 被微软收购,我不服!
  6. 金万维异速联客户端 盛装入驻苹果应用商店
  7. Linux程序设计(虚拟机 Ubuntu 编译程序)
  8. Linux批量更改文件后缀名
  9. 进销存excel_Excel进销存管理套表,自动库存显示应收应付,全函数快捷轻松
  10. 字节跳动 录屏功能_非常值得推荐,字节跳动出品的一款协同办公软件。