1
2
3
4
5
6
<br><br># 1. 安装scipy,numpy,sklearn包
import numpy
from sklearn.datasets import load_iris
# 2. 从sklearn包自带的数据集中读出鸢尾花数据集data
print(data.data)

  

1
2
3
# 3.查看data类型,包含哪些数据
data = load_iris()
print(data.keys())

  

1
2
3
4
# 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
print(data.target_names)
print(data.target)
type(data.target)

  

1
2
# 5.取出所有花的花萼长度(cm)的数据
print(numpy.array(list(len[0for len in data['data'])))

  

1
2
3
# 6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
print(numpy.array(list(len[2for len in data['data'])) )
print(numpy.array(list(len[3for len in data['data'])))

  

1
2
3
# 7.取出某朵花的四个特征及其类别。
print(data.data[0])
print(data.target_names[0])

  

1
2
3
4
# 8.将所有花的特征和类别分成三组,每组50个
setosa_data = []
versicolor_data = []
virginica_data = []

  

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# 9.生成新的数组,每个元素包含四个特征+类别
for in range(0,150):
    #生成为setosa类的鸢尾花花数据
    if  data.target[i] == 0:
        data1 = data.data[i].tolist()
        data1.append('setosa')
        setosa_data.append(data1)
    #生成为versicolor类的鸢尾花数据 
    elif data.target[i] == 1:
        data1 = data.data[i].tolist()
        data1.append('versicolor')
        versicolor_data.append(data1)
    #剩下的为virginica类的鸢尾花数据 
    else:                        
        data1 = data.data[i].tolist()
        data1.append('virginica')
        virginica_data.append(data1)
#生成新的数组,每个元素包含四个特征+类别
newdata=(setosa_data ,versicolor_data,virginica_data)
print(newdata)

  

转载于:https://www.cnblogs.com/yulinzzz/p/9869796.html

NUMPY数据集练习 ----------SKLEARN类相关推荐

  1. DL之NN:基于(sklearn自带手写数字图片识别数据集)+自定义NN类(三层64→100→10)实现97.5%准确率

    DL之NN:基于(sklearn自带手写数字图片识别数据集)+自定义NN类(三层64→100→10)实现97.5%准确率 目录 输出结果 核心代码 输出结果 核心代码 #DL之NN:基于sklearn ...

  2. 08_sklearn数据集,数据集划分train_test_split,sklearn.datasets及其api,sklearn分类数据集,sklearn回归数据集,转换器与预估器

    1.sklearn数据集 1.1 数据集划分 机器学习一般的数据集会划分为两个部分 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用来评估模型是否有效 1.1.1 sklearn数据集划分 ...

  3. 【ML】机器学习数据集:sklearn中分类数据集介绍

    目录 1.乳腺癌分类数据集(二分类) 2.鸢尾花分类数据集(三分类) 3.葡萄酒分类数据集(三分类) 4.手写数字分类数据集(十分类) 5.其他数据集 参考资料 在机器学习的教程中,我们会看到很多的d ...

  4. sEMG项目总结(6)NinaPro肌电数据集(52类动作)

    NinaPro肌电数据集(52类动作) 目录 NinaPro肌电数据集52类动作 目录 1sEMG Data 2简单ANN分类 3Deep learning applied to Ninapro sa ...

  5. 【Python】实训6:基于wine和wine_quality数据集练习sklearn构建模型方法(预处理、聚类、分类、回归)

    题目来源: <Python数据分析与应用>第6章 使用 scikit-learn 构建模型 实训部分 [ 黄红梅.张良均主编 中国工信出版集团和人民邮电出版社] 本博客题目文字主要来自: ...

  6. python中matrix函数_使用python解线性矩阵方程(numpy中的matrix类)

    这学期有一门运筹学,讲的两大块儿:线性优化和非线性优化问题.在非线性优化问题这里涉及到拉格朗日乘子法,经常要算一些非常变态的线性方程,于是我就想用python求解线性方程.查阅资料的过程中找到了一个极 ...

  7. ArcGIS改变数据集或要素类的的坐标系(投影)

    数据管理工具-投影和变换-投影-输入数据集或要素类-输出数据集或要素类-输出坐标系(选择合适的投影坐标系)

  8. 【ML】机器学习数据集:sklearn中回归数据集介绍

    目录 1. Boston房价预测数据集 2. California房价预测数据集 3. 糖尿病预测数据集 在机器学习的教程中,我们会看到很多的demo,这些demo都是基于python中自带的数据集. ...

  9. 将cityscapes数据集转换为19类 convert cityscapes to 19 categories

    在用DANet网络时候,Readme里面提到了处理数据集时,提到了要把cityscapes数据集转换为19类: Download the Cityscapes dataset and convert ...

最新文章

  1. java面试题(转载其他人,方便日常看)
  2. 原地置换法寻找数组中重复的数
  3. .NET 页面刷新方式总结
  4. 学linux做笔记本,linux学习之笔记本安装CentOS7
  5. c语言怎么运行出星星,C语言打印星星的问题
  6. Win10右键添加notepad++
  7. JAVA和tomcat 环境变量配置
  8. 阻塞、非阻塞、同步、异步的区别
  9. 6-vue-component
  10. 嵌入式C语言自我修养分享课件
  11. 关于灰鸽子和黑软的一些看法
  12. C语言实现倒计时关机程序(goto语句、strcpm函数、system函数)
  13. Thinkphp5.1整合支付宝APP支付
  14. 误删 Win10 应用商店应该如何恢复?
  15. H5制作视频网页的架构
  16. FITC-Dextran,Dextran-FITC,右旋糖酐荧光素,一种被标记的多糖
  17. Educoder -Java面向对象-Java语言之数组(第1关:数组的遍历:给小朋友分糖果)
  18. input输入框禁止修改的方法
  19. RFID-MFRC522射频识别模块,S50卡M1
  20. PyPubMed|好用的免费文献检索神器

热门文章

  1. python题目推荐_python题目
  2. python拼接两个数组_在Python中连接两个数组
  3. php fopen插入文本_PHP 文件创建/写入
  4. 【无标题】线程池中阻塞队列的作用,为什么是先添加队列而不是先创建最大线程
  5. final关键字与static对比
  6. 网络知识:电脑无线网连接不上问题汇总!
  7. 嵌入式计算机的发展阶段,嵌入式发展经历了哪四个阶段?
  8. 贝叶斯分析好坏_贝叶斯统计 | 第五章第一部分 决策基本概念
  9. 未来ui设计的发展趋势_2025年的未来UI趋势?
  10. 爬取淘宝定价需要多久时间_如何对设计工作进行定价—停止收​​取时间并专注于价值