一二维数据的格式化和处理

数据组织的维度

数据组织可以分为一维数据、二维数据和高位数据

一维数据:由对等关系的有序或无序数据构成,采用线性方式组织,对应于数学中的数组和集合等概念。一维数据都具有线性特点。

二维数据:也称为表格数据,由关联关系数据构成,采用表格方式组织,对应于数学中的矩阵,常见的表格都属于二维数据。

高维数据:由键值对类型的数据构成,采用对象方式组织,属于整合度更好的数据组织方式。高维数据在网络系统中十分常用,HTML、XML、JSON等都是高维数据组织的语法结构。

数据包括文件存储程序使用两个状态。存储不同维度的数据需要适合维度特点的文件存储格式,处理不同维度数据的程序需要使用相适应的数据类型或结构。因此,对于数据处理,需要考虑存储格式以及表示和读写等两个问题。

一二维数据的存储格式

一维数据是简单的数据组织类型,有多种存储格式,常用特殊字符分隔,分隔方式如下:

  • 用一个或多个空格分隔。
  • 用逗号分隔(是英文逗号,不是中文逗号)
  • 用其他符号或符号组合分隔,建议采用不出现在数据中的特殊符号
中国 美国 日本 德国 法国 英国 意大利
======================================================================================
中国, 美国, 日本, 德国, 法国, 英国, 意大利
======================================================================================
中国; 美国; 日本; 德国; 法国; 英国; 意大利

二维数据由多条一维数据构成,可以看成是一维数据的组合形式。

国际通用的一二维数据储存格式:CSV格式

逗号分隔数据的存储格式叫做CSV格式(Comma-Separaed Values,, 逗号分隔值),有如下格式:

  • 纯文本格式,通过单一编码表示字符
  • 以行为单位,开头不留空行,行之间没有空行
  • 每行表示一个一维数据,多行表示二维数据
  • 以逗号(英文,半角)分隔每行数据,行数据为空也要保留逗号
  • 对于表格数据,可以包含或不包含列名,包含时列名防治在文件第一行

CSV格式存储的文件一般采用.csv为扩展名,可以通过Windows平台上的记事本或微软Office Excel工具打开,也可以在其他操作平台上用文本编译工具打开。

Python的csv标准库

Python提供了一个读写csv的标准库,可以通过import csv使用。csv库包含操作CSV格式最基本的功能,csv.reader()hecsv.writer()。

一二维数据对的表示和读写

一维数据写入CSV文件

fo = open("D:\\test01.csv", "w")
ls = ['北京','101.5','120.7','121.4']
fo.write(",".join(ls)+ "\n")
fo.close()

可以通过循环结构将一维数据写入文件中,形成二维数据

for row in ls:<输出文件>.write(",".join(row) +"\n")
===================================================================================
fo = open("D:\\test01.csv", "w")
ls = [['城市','环比','同比','定基'],['北京','101.5','120.7','121.4'],['上海','101.2','127.3','127.8'],['广州','101.3','119.4','120.0']
]
for row in ls:fo.write(",".join(row)+ "\n")
fo.close()

从CSV文件读取数据

fo = open("D:\\test01.csv","r")
ls = []
for  line in fo:line = line.replace("\n","")ls = line.split(",")lns = ""for s in ls:lns += "{}\t".format(s)print(lns)
fo.close()
==========================================================================
城市  环比  同比  定基
北京  101.5   120.7   121.4
上海  101.2   127.3   127.8
广州  101.3   119.4   120.0

Python——> 一二维数据的格式化和处理相关推荐

  1. Python一维二维数据的格式化和处理

    本章导言 什么是数据格式化 前言: -学完本章,看待数据会有一种规范/格式化的视角 -方法论:从Python角度理解文件和数据表示 -实践能力:学会编写带有文件输入输出的程序 1. 数据组织的维度 维 ...

  2. 16 二维数据的格式化和处理

    一.二维数据的表示 1.使用列表类型 2.一二维数据的python表示 数据维度是数据组织的形式 二.CSV格式与二维数据存储 1.CSV数据存储格式   三.二维数据的处理 1.二维数据的读入处理 ...

  3. Python 二维数据

    [ 1.二维数据的表示] 列表类型可以表达二维数据. 使用二维列表. 使用两层for循环遍历每个元素. 外层列表中每个元素可以对应一行,也可以对应一列. 一维和二维数据表示的形式差异: [ 2.CSV ...

  4. python二维数据读取对齐_python代码要严格对齐

    此课程与<清华编程高手.尹成.带你实战python入门>大体相同,只需购买其中的一门课程. 本课程由清华大学尹成老师录制,课程的特色在于讲解原理的同时引入了每个程序员都热衷的黑客技术.py ...

  5. 以下关于python二维数据的描述中错误的是_关于二维数据CSV存储问题,以下选项中描述错误的是‪‪‪‪‪‪‫‪‪‪‪‪‫‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‫:...

    [单选题]C语言中最基本的数据类型包括( ). [单选题]计算机的性能可以用很多指标来衡量,除了用其运算速度.字长等指标以外,( )也作为主要指标. [单选题]Word2010文档文件的扩展名是( ) ...

  6. python多维数据_python多维数据

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 平行坐标图中每条垂直的线代表一个特征,表中一行的数据在图中表现为一条折线,不同颜 ...

  7. python多维数据存储_在Python中存储和重新加载大型多维数据集

    我将运行大量的模拟,产生大量的数据,这些数据需要在以后存储和访问.我的模拟程序的输出数据被写入文本文件(每个模拟一个).我计划编写一个Python程序来读取这些文本文件,然后以更便于以后分析的格式存储 ...

  8. 以下关于python二维数据的描述中错误的是_python第二章1

    1. (单选题) Python 3.x 版本的保留字总数是( ) A.27B.29C.33D.62. (单选题) 以下选项中,不是 Python 语言保留字的是( ) A.whileB.passC.d ...

  9. python文件和数据的格式化_Python文件和数据格式化(教程)

    文件是一个存储在副主存储器的数据序列,可包含任何数据内容. 概念上,文件是数据的集合和抽象,类似的,函数是程序的集合和抽象. 用文件形式组织和表达数据更有效也更加灵活. 文件包括两种形式,文本文件和二 ...

最新文章

  1. 用PS制作APP的界面图片
  2. php mysql 降_PHP,MySQL:mysql替代php in_array函数
  3. java杂记-static
  4. python flask 跨域问题 解决方法
  5. 网页的一般布局(标题和脚注100%,内容宽度固定宽度px)
  6. oracle 存储过程打印语句,oracle学习之第一个存储过程:打印Hello World
  7. 鸿海集团否认郭台铭辞任董事长:只是希望退居二线
  8. lm_license_file 冲突怎么办_【微课+语音】孩子一个多月没有上学了怎么办?
  9. 在html中播放链接视频,如何在我的python脚本中使用HTML5在网站链接中播放视频?...
  10. python forward(10)什么意思-Python turtle.forward方法代码示例
  11. 压缩感知重构算法——SP算法
  12. 估值3000亿,中国最神秘电商公司,征服美国年轻人
  13. Unity Shader Color、HSV、HDRColor以及HDRColor面板转换源码分析
  14. GitHub使用教程详细图解
  15. 395计算机毕业设计
  16. 按分类搜索淘宝直播接口API,淘宝直播API接口
  17. 官宣!麻省理工学院官方线上课程之机器学习开启啦
  18. 指标类数据标准如何定义?
  19. oracle12c创建表空间、创建用户、创建权限
  20. win10安装软件时显示:“现在更新设备, 若要继续接收应用建议,请立即更新”

热门文章

  1. 一个通过Rmd文件输出表格到word的简单方法
  2. raid1重建时间_Intel主板RAID1恢复方法图解
  3. Linux:进程管理 | 进程创建 | 进程终止 | 进程等待 | 进程替换
  4. April 2005 停下来回首一下
  5. React实现(Web端)网易云音乐项目(一),错过了真的可惜呀
  6. 洗地机和扫地机器人哪个实用?值得入手的洗地机十大品牌推荐
  7. java闭锁_Java闭锁—CountDownLatch
  8. 最新PHP全自动发信投稿系统源码+带后台
  9. 微信小程序 API的 promise化
  10. 2022.9.19 自学计算机