every blog every motto: Learn and live

0. 前言

本节实战,生成csv文件

1. 代码部分

1. 导入模块

import matplotlib as mpl
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import sklearn
import pandas as pd
import os
import sys
import time
import tensorflow as tf
from tensorflow import kerasprint(tf.__version__)
print(sys.version_info)
for module in mpl,np,pd,sklearn,tf,keras:print(module.__name__,module.__version__)

2. 读取数据

from sklearn.datasets import fetch_california_housing# 房价预测
housing = fetch_california_housing()

3. 划分样本

# 划分样本
from sklearn.model_selection import train_test_splitx_train_all,x_test,y_train_all,y_test = train_test_split(housing.data,housing.target,random_state=7)
x_train,x_valid,y_train,y_valid = train_test_split(x_train_all,y_train_all,random_state=11)print(x_train.shape,y_train.shape)
print(x_valid.shape,y_valid.shape)
print(x_test.shape,y_test.shape)

4. 数据归一化

# 归一化
from sklearn.preprocessing import StandardScalerscaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train)
x_valid_scaled = scaler.transform(x_valid)
x_test_scaled = scaler.transform(x_test)

5.1 保存文件

output_dir = 'generate_csv'
if not os.path.exists(output_dir):os.mkdir(output_dir)def save_to_csv(output_dir,data,name_prefix,header=None,n_parts=10):path_format = os.path.join(output_dir,'{}_{:02d}.csv')filenames = []for file_idx,row_indices in enumerate(np.array_split(np.arange(len(data)),n_parts)):part_csv = path_format.format(name_prefix,file_idx)filenames.append(part_csv)with open(part_csv,'wt',encoding='utf-8') as f:if header is not None:f.write(header + '\n')for row_index in row_indices:f.write(','.join([repr(col) for col in data[row_index]]))f.write('\n')return filenamestrain_data = np.c_[x_train_scaled,y_train]
valid_data = np.c_[x_valid_scaled,y_valid]
test_data = np.c_[x_test_scaled,y_test]header_cols = housing.feature_names + ['MiddianHouseValue']header_str = ','.join(header_cols)

5.2 保存文件

train_filenames = save_to_csv(output_dir,train_data,'train',header_str,n_parts=20)
valid_filenames = save_to_csv(output_dir,valid_data,'valid',header_str,n_parts=10)
test_filenames = save_to_csv(output_dir,test_data,'test',header_str,n_parts=10)

从零基础入门Tensorflow2.0 ----四、13.生成csv文件相关推荐

  1. 视频编码零基础入门(0):零基础,史上最通俗视频编码技术入门

    [来源申明]本文引用了微信公众号"鲜枣课堂"的<视频编码零基础入门>文章内容.为了更好的内容呈现,即时通讯网在引用和收录时内容有改动,转载时请注明原文来源信息,尊重原作 ...

  2. SQL零基础入门学习(四)

    SQL零基础入门学习(三) SQL INSERT INTO 语句 INSERT INTO 语句用于向表中插入新记录. SQL INSERT INTO 语法 INSERT INTO 语句可以有两种编写形 ...

  3. 零基础入门学习Python(13)-字符串

    字符串和元组是非常相似的,一旦被定义就不能被轻易修改 非要修改可以用切片和连接符 这样旧的字符串str1还在哦,赋值之后才会覆盖哦,python的垃圾回收机制过会就会把没有标签指向的字符串剔除 字符串 ...

  4. Apache Flink 零基础入门(十四)Flink 分布式缓存

    Apache Flink 提供了一个分布式缓存,类似于Hadoop,用户可以并行获取数据. 通过注册一个文件或者文件夹到本地或者远程HDFS等,在getExecutionEnvironment中指定一 ...

  5. 【转】Dynamics CRM 365零基础入门学习(四)Dynamics 使用profiler插件调试流程

    今天我们介绍一种在dynamics开发中经常会用到的调试操作,其中一种调试方式即是profile调试.以下是我在项目开发中记录的调试流程,可供参考使用. 1.打开插件注册工具,会看到install P ...

  6. PHP 零基础入门笔记(8):PHP 文件包含include/require

    PHP 文件包含include/require 在一个 PHP 脚本中,去将另一个文件包含进来 文件包含的作用 实现代码共享重用,协作共同完成一件事 使用被包含文件中的内容:向上包含(所要) 自己的东 ...

  7. bat 变量 文件内容第一行_VBA基础入门(38)FSO生成bat文件后执行的实例

    1.首先,我们回顾下FSO是什么? 文件系统对象FSO的英文全称是File System Object ,这种对象模型提出了有别于传统的文件操作语句处理文件和文件夹的方法.通过采用object.met ...

  8. Pr零基础入门指南笔记三-------------视频效果与转场

    目录 精剪第一步--视频效果与转场 1.三大面板 2.位置 3.效果库 4.常用视频效果 [干货]PR零基础入门指南第四集:PR常用的效果和转场,视频防抖.宽银幕效果.设置默认效果等_哔哩哔哩_bil ...

  9. Java从键盘输入n行字符串_Java十四天零基础入门-Java布尔类型

    不闲聊!!!不扯淡!!!小UP只分享Java相关的资源干货 Java布尔类型 在Java语言中布尔类型的值只包括true和false,没有其他值,不包括1和0,布尔类型的数据在开发中主要使用在逻辑判断 ...

  10. java短除法获取二进制_Java十四天零基础入门-Java的数据类型介绍

    不闲聊!!!不扯淡!!!小UP只分享Java相关的资源干货 本章节目标: 理解数据类型的作用.Java中包括哪些数据类型?常见的八种基本数据类型都有哪些?会用八种基本数据类型声明变量?什么是二进制?原 ...

最新文章

  1. python中install语法错误_在“ npm install”之后,出现有关python中语法错误的错误吗?...
  2. android 屏幕保持唤醒 不锁屏 android.permission.WAKE_LOCK
  3. 生成器模式 - 让配置代码更优雅
  4. java常用API之DateFormat
  5. leetcode -- 357. Count Numbers with Unique Digits
  6. 河内之塔算法_如何解决河内问题之塔-图解算法指南
  7. html img属性text,TextField的htmlText属性中img标签的有趣现象
  8. spring官方文档列表
  9. 7.Kong入门与实战 基于Nginx和OpenResty的云原生微服务网关 --- 日志收集与分析
  10. POJ1001 高精度浮点数幂运算
  11. iOS 如何把图片资源打包成bundle文件及遇到的坑(详解)
  12. 014-JVM-查看class文件的工具Binary viewer、ue、classlib Bytecode viewer
  13. 3D打印gcode命令大全及解析
  14. 风尚云网学习-js实现禁用右键以及F12
  15. chrome 打开网页速度很慢的可能原因
  16. geopandas read_file报错RTreeError: Coordinates must be in the form (minx,
  17. ODOO11报价单确认订单创建入库单(_run_move)
  18. error LNK2023: bad DLL or entry point 'msobj80.dll' 解决方法
  19. 10.如何在Linux下解除PDF文件的密码?
  20. 计算机发展对建筑的意义,BIM能给建筑业带来什么?BIM在我国发展的意义是什么?...

热门文章

  1. 工具组件_从零认知BI: BI组件、架构、工具、优势、缺点
  2. php disable-ipv6,強迫 PHP Curl 使用 IPv4 , 忽略 IPv6
  3. mongodb查询不等于某个字段_Oracle单表查询多字段,不使用*
  4. python中rawinput用法_Python 中 input()用法 以及与raw_input() 的区别
  5. dovecot 不用mysql,dovecot+mysql 收件服务 和 空壳邮件
  6. linux如何秀爱swap大小,老毛桃PE启动U盘集合CDlinux,BT5可保存设置,wifislax,sliatz中文定制版的方法[存档......
  7. 广州的11个辖区_广州11月展览大全,有12个免费
  8. Java编程:KMP算法
  9. FFmpeg学习(4)——为视频嵌入字幕
  10. Mysql数据库性能优化配置:my.cnf/my.ini配置说明详解(测试机器为16GB内存)