2.8数据-paddlepaddle数据集uci_housing
UCI Housing数据集
- 该模块将从 https://archive.ics.uci.edu/ml/machine-learning-databases/housing/ 下载数据集,并将训练集和测试集解析为paddle reader creator
- 每个样本都是正则化和价格编号后的特征
paddle.dataset.uci_housing:https://www.paddlepaddle.org.cn/documentation/docs/zh/api_cn/data/dataset_cn/uci_housing_cn.html
import paddle
import paddle.fluid as fluid
import numpy as np
import paddle.dataset.uci_housing as uci_housing# 返回一个reader creator,reader中的每个样本都是正则化和价格编号后的特征
train=uci_housing.train() # <function paddle.dataset.uci_housing.train.<locals>.reader()>
'''
[==================================================]i_housing/housing.data not found, downloading http://paddlemodels.bj.bcebos.com/uci_housing/housing.data
'''
test=uci_housing.test() # <function paddle.dataset.uci_housing.train.<locals>.reader()>a_sample=next(train())print(len(a_sample)) # 2
print(a_sample[1]) # [24.]
print(a_sample[0].shape) # (13,)
print(a_sample[0]) # [-0.0405441 0.06636364 -0.32356227 -0.06916996 -0.03435197 0.05563625 -0.03475696 0.02682186 -0.37171335 -0.21419304 -0.33569506 0.10143217 -0.21172912]len(uci_housing.feature_names) # 13
uci_housing.feature_names
'''
['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT']
''' # 13 var x ,1 var y
# uci_housing.UCI_TEST_DATA.shape:(102, 14)
# uci_housing.UCI_TRAIN_DATA.shape:(404, 14)
uci_housing.UCI_TEST_DATA
'''
array([[ 0.42616306, -0.11363636, 0.25525005, ..., -0.0686218 ,0.40637243, 8.5 ],[ 0.72279828, -0.11363636, 0.25525005, ..., 0.07134996,0.28495962, 5. ],[ 0.19222996, -0.11363636, 0.25525005, ..., 0.03415696,0.2948934 , 11.9 ],...,[-0.03993221, -0.11363636, 0.02907703, ..., 0.10143217,-0.1935172 , 23.9 ],[-0.03938337, -0.11363636, 0.02907703, ..., 0.09273279,-0.17033839, 22. ],[-0.04008226, -0.11363636, 0.02907703, ..., 0.10143217,-0.13170704, 11.9 ]])
'''
2.8数据-paddlepaddle数据集uci_housing相关推荐
- 汇总同一时间段的数据_数据集干货:一文读懂Mapsidejoin
我们知道数据分析的第一步是准备数据,所以在前面的课程里,我们介绍了元数据.今天这篇文章,主要介绍大数据量组合数据集在永洪中的应用实例:Mapsidejoin. 什么是Mapsidejoin?按照字面意 ...
- 数据增强 数据集扩充_数据扩充的抽象总结
数据增强 数据集扩充 班级分配不均衡的创新解决方案 (A Creative Solution to Imbalanced Class Distribution) Imbalanced class di ...
- python数据建模数据集_Python中的数据集
python数据建模数据集 There are useful Python packages that allow loading publicly available datasets with j ...
- 数据开放 数据集_除开放式清洗之外:叙述是开放数据门户的未来吗?
数据开放 数据集 There is growing consensus in the open data community that the mere release of open data - ...
- 数据开放 数据集_您可以使用开放数据做什么?
数据开放 数据集 玩单词联想游戏,单词" open"几乎肯定会跟随" source". 开源无疑是维护用户自由和访问计算的重要力量. 但是,代码并不是唯一重要的 ...
- MaxCompute SQL大数据公开数据集实战
MaxCompute公开数据集简介 目前阿里云MaxCompute已经免费向全部用户开放了多种公用数据集,包括: 股票价格数据 房产信息 影视及其票房数据 TPC-DS数据集 这些公开数据现已免费开放 ...
- 凯斯西储轴承数据CWRU数据集制作十分类
凯斯西储轴承数据CWRU数据集制作 问题描述 解决办法 问题描述 凯斯西储轴承数据CWRU数据集制作预处理代码. 解决办法 基于开源代码的改进. import os from scipy.io imp ...
- VTK修炼之道11:基本数据结构_数据对象数据集
1.前言 前面学习了VTK的一个重要概念--可视化管线,了解了VTK数据的流动过程.好比我们做一道菜,在做每一道菜之前,首先要掌握这道菜的做法,什么时候放盐什么时候放酱油等调料,除了需要弄清楚做每一道 ...
- 航空发动机数据-C-MAPSS数据集的个人理解
数据来源:https://www.nasa.gov/intelligent-systems-division 数据集介绍: NASA的C-MAPSS(商用模块化航空推进系统仿真)数据集(涡扇发动机退化 ...
- js访问新浪股票数据接口-数据集
应用ISLR包里的Smarket数据集.先来看一下数据集的结构: Smarket是2001年到2005年间1250天的股票投资回报率数据,Year是年份,Lag ...
最新文章
- DeepMind 打造 AI 游戏系统,可以玩扑克、国际象棋、围棋等,战斗力爆表
- 生产者/消费者问题的多种Java实现方式--转
- DeepLearning:CNN网络学习之LetNet-5解读(论文+分析+代码)
- 两个重要而又容易被忽视的角色
- sql unicode转中文_汉字转拼音的Java类库 JPinyin
- 默认参数和命名关键字参数(1)
- 关于TcpClient,Socket连接超时的几种处理方法
- centos 网络开启
- jieba分词的原理
- linux串口结构termios,linux串口termios.doc
- Docker安装phpmyadmin
- 室内定位中非视距的识别和抑制算法研究综述(部分)
- 通过数据分析找出Netflix最适合学习英语的电影和电视剧
- 景联文科技:关于语音标注,你知道多少?
- (读书笔记) 暗时间 (2016.12.17更)
- 物联网发展的基石——传感器
- NO.2-24 [网鼎杯 2020 朱雀组]Nmap
- Python输入三角形的三条边求面积,输入圆的半径输出面积周长的两个程序的代码
- 保证你会爱上的软件--私藏
- 子墨庖丁Android的ActionBar源代码分析 (一)实例化
热门文章
- matlab解超越函数,矩阵的超越函数Matlab提供的矩阵函数.PPT
- 【编译原理】理解BNF
- GNU ARM Toolchain 初学者入门指南
- Python下载Wyoming怀俄明大学探空数据(数据网址更新)
- PowerBuilder 计算器
- 14种最佳的PHP帮助台脚本和5种免费选项
- c语言课程火车售票报告,C语言课程设计报告书火车票务管理系统.doc
- excel教程自学网_企业Office办公软件自学视频教程word/excel/ppt 2003 2013 2016全套
- php 百度地图 云存储,jspopular3.0 | 百度地图API SDK
- 【ROM制作工具】线刷包转卡刷包制作教程