一、UCI 数据集介绍

进行机器学习学习过程中,会使用到 UCI 公开数据集,UCI 数据集网址:UCI Machine Learning Repository。

点击进入之后,页面显示如下:

以 iris 数据集为例,点击进入:

该页面展示了该数据集的相关信息,包括:数据及相关介绍、相关任务、样本个数、特征个数、是否有缺失值等。

        常见数据集及其样本个数、特征个数总结:

更为详细的数据集介绍和使用方法见下面参考链接,因为本文是利用 Python 读取数据集,所以就不在此赘述了~

(参考:UCI数据集整理(附论文常用数据集))

(参考:UCI数据集详解及其数据处理(附148个数据集及处理代码))

二、使用 Python 读取 UCI 数据集,并保存成 .mat 数据

在 UCI 网站下载数据集固然可行,但突然想到 Python 中的 sklearn.datasets 可以直接 load 数据集,所以直接借用 Python 了。

代码如下:

import numpy as np
from sklearn import datasets  # UCI 数据集在sklearn.datasets中有
from scipy import io as scio  # 用来save .mat数据# 载入wine数据集
Data = datasets.load_wine()feaName = Data.feature_names  # 数据集特征名称
tarName = Data.target_names  # 数据集标签名称myData = np.array(Data.data)  # 数据集数据
labels = np.array(Data.target)  # 数据集标签DataSet = {}
DataSet['feature_names'] = feaName
DataSet['class_names'] = tarName
DataSet['data'] = myData
DataSet['label'] = labels# 保存数据到 .mat 文件中
scio.savemat('DataSet_UCIwine.mat', DataSet)

(参考:python读取文件——python读取和保存mat文件 )

三、sklearn.datasets.load_wine() 使用方法

本节详细介绍 sklearn.datasets.load_wine() 的返回值,即 Data 是什么?

from sklearn import datasetsData = datasets.load_wine()

可以看出,Data 是一个 Bunch 模式的数据,其中包含 data(数据集数据)、feature_names(特征名字)、target(数据集标签)、target_names(分类后的类别名字)等信息,所以可以通过 Data.data, Data.target 等的方法获取数据和相应标签等。

(参考:【20210924】【机器/深度学习】以鸢尾花卉数据集为例,使用K折交叉验证选取KNN算法最优的模型参数实例)

四、知识点

1. Bunch 模式

Bunch 模式继承自 Dict 类,所以它具有 Dict 类的所有属性。

Bunch 模式非常灵活,其属性可以动态设置,可以使用它实现多种类型,尤其适用于建立树形结构。

(参考:Python中的Bunch模式)

(参考:python函数——Bunch配置加载)

(参考:Python中的Bunch模式)

【20211208】【Python】UCI数据集的简单介绍和使用Python保存UCI数据集为.mat文件相关推荐

  1. php枚举属于什么类型,python枚举类型是什么?python枚举类型的简单介绍

    本篇文章给大家带来的内容是关于python枚举类型是什么?python枚举类型的简单介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 一:枚举类型的定义 二:枚举类和普通类的区别 ...

  2. ciaodvd数据集的简单介绍_基于注意力机制的规范化矩阵分解推荐算法

    随着互联网技术的发展以及智能手机的普及, 信息超载问题也亟待解决.推荐系统[作为解决信息超载问题的有效工具, 已被成功应用于各个领域, 包括电子商务.电影.音乐和基于位置的服务等[.推荐系统通过分析用 ...

  3. [python+nltk] 自然语言处理简单介绍和NLTK坏境配置及入门知识(一)

    本文主要是总结最近学习的论文.书籍相关知识,主要是Natural Language Pracessing(自然语言处理,简称NLP)和Python挖掘维基百科Infobox等内容的知识.此篇文章主要参 ...

  4. python网站设计理念_简单介绍下python Django框架的历史,设计理念及优势_Django讲解2...

    简单介绍下python Django框架的历史,设计理念及优势 Django是一个高层次的 Python Web 框架,它是一个鼓励快速开发和干净,实用的框架设计.Django可以更容易地快速构建更好 ...

  5. python自动化测试篇一 简单介绍

    一.什么是 Python Python 是一门编程语言,关于编程语言我们后面再详细讲.首先我们思考,为什么我们要学习 Python 1.为什么要学习 Python 1. 自动化 很多时候,虽然可以通过 ...

  6. Python中class的简单介绍

    类的定义 class classname[(父类名)]: – 成员函数及成员变量 _ init _ 构造函数:初始化对象 _ del_ 析构函数:销毁对象 定义类的成员函数时,必须默认一个变量代表类定 ...

  7. 有python基础学习java简单吗_【Python】Java程序员学习Python(三)— 基础入门

    一闪一闪亮晶晶,满天都是小星星,挂在天上放光明,好像许多小眼睛.不要问我为什么喜欢这首歌,我不会告诉你是因为有人用口琴吹给我听. 一.Python学习文档与资料 一般来说文档的资料总是最权威,最全面的 ...

  8. day1.python变量和数据类型的介绍教程图灵python大海老师

    qq1328044392 day1变量和数据类型的介绍 教程地址 p1 编程基础 1.编程和编程语言 1.1.什么是编程语言 ​ 语言是一个事物与另外一个事物沟通的介质 比如人与人交流汉语,英语,日语 ...

  9. 大学python和vb哪个简单-VB强大还是python强大

    Python好学,易上手.如果你是第一次学习计算机编程语言,推荐你学这个.更重要的是,学会这门语言,也能方便你对电脑中的文档进行处理.而无论是C.还是VB,面对大多数任务,编码速度都不及Python的 ...

  10. 区块链python实现_最简单区块链的python实现

    简单的记录下最近自己在学习区块链的笔记,随着比特币的价格越来越高,区块链的概念也越来越火.我简单的把区块链理解成存储数据的数据库,由一个个区块作为容器存储数据,通过hash值相互连接,类似链表结构. ...

最新文章

  1. 色彩(颜色)空间原理(实现代码)
  2. jenkins php build,PHP+Jenkins 持续集成
  3. Java中测长函数_Core Java测试题
  4. 可信云十年,重磅研究成果与2021云计算十大关键词悉数发布
  5. Eclipse中安装TestNG插件
  6. 可解释性系列论文:Mathematics of Deep Learning
  7. OpenSSL 修复可导致 DoS攻击的高危漏洞
  8. aws终止实例后还收费吗_「技术选型」AWS 和 AZURE的全面比较
  9. Hive 之collect_list/collect_set(列转行)
  10. PMP-PMBOK(第六版)--49个过程ITTO记忆口诀(第一辑)
  11. vue cil安装axios
  12. vue 前端使用 element-ui 实现省市级联动
  13. SPSS Modeler18.0数据挖掘软件教程(六):聚类分析-K-means
  14. 射极跟随器实验报告数据处理_实验五射极跟随器实验报告.doc
  15. Oracle VM VirtualBox虚拟机新建教程(包括镜像文件的下载和安装)
  16. APK安装流程:点击下载应用了解安装的全过程
  17. SQL常用脚本大全,建议收藏!
  18. 《世界历史》—史前时期的分期
  19. java零基础学习第九天
  20. Ubuntu下清除DNS缓存的方法

热门文章

  1. Mac OS 如何批量转换图片格式
  2. 大数据学习入门难,给初学者支招
  3. Mbed OS :DMX512 灯光控制协议
  4. 软件(自动化)测试面试基础知识点汇总
  5. 软件测试基础知识大全
  6. 没有基础怎么学习PLC编程?
  7. windows xp下 usb驱动编写
  8. 实用干货:电放提单详解,与海运单、一般提单到底有什么区别?
  9. 跟周鸿祎学互联网思维 ——《周鸿祎自述|我的互联网方法论》读后感
  10. java 抽象工厂 类图_Java 抽象工厂模式