文章目录

  • 前言
  • 一、CSV文件背景
  • 二、CSV文件用法
  • 三、CSV文件规则
  • 四、CSV文件包含的各种数据
    • 1.常规的内容
    • 2.字段内部有逗号
    • 3.字段内部有引号
    • 4.字段内部有换行符
    • 5.字段内部有空格
  • 五、CSV文件规则

前言

csv是逗号分隔值文件的格式,英文全称comma-separated values。该文件通常都是以纯文本的形式储存,以行为单位,每行有多项数据,每项数据用逗号分隔。用户可以使用Excel,或者系统自带的记事本、写字板,来打开csv文件。

如果电脑安装了Excel软件,csv文件的默认打开方式就会被修改成Excel双击打开后,每项数据之间是不会显示逗号的,因为逗号都被用来分列了。如果右键文件打开方式,选择记事本或者写字板打开,就会看到逗号分隔符。

需要注意的是,Excel表格中的数字,默认采用的都是科学计数的表示方式,如3.48431E+5这种形式。用户在用Excel编辑修改csv文件时,一定要留意数值格式的变化,必要的时候将其修改回来。否则,数据就会出问题。

由于csv文件的存储方式非常简单,可以有效减少存储信息的容量。所以,csv文件经常会被用于不同程序之间的数据交换

一、CSV文件背景

在数据分析时,有时我们会碰到csv格式文件,需要先进行数据处理,转换成所需要的数据格式,然后才能进行分析。

业务侧的同学可能对Excel文件比较熟悉,Excel可以把单个sheet直接保存为csv文件,也可以直接读取csv文件,变成Excel文件。

技术侧的同学有时需要把数据库里面的数据导出到一个csv文件,有时也需要把别人给的csv文件加载到数据库中。

csv文件在各个地方都这么流行,你真的彻底了解它吗?

CSV(逗号分隔值文件格式),逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号)

二、CSV文件用法

广泛应用。最广泛的应用是在程序之间转移表格数据,而这些程序本身是在不兼容的格式上进行操作的(往往是私有的和/或无规范的格式)。因为大量程序都支持某种CSV变体,至少是作为一种可选择的输入/输出格式。

例如,一个用户可能需要交换信息,从一个以私有格式存储数据的数据库程序,到一个数据格式完全不同的电子表格。最可能的情况是,该数据库程序可以导出数据为“CSV”,然后被导出的CSV文件可以被电子表格程序导入。

“CSV”并不是一种单一的、定义明确的格式(尽管RFC 4180有一个被通常使用的定义)。因此在实践中,术语“CSV”泛指具有以下特征的任何文件:

  1. 纯文本,使用某个字符集,比如ASCII、Unicode、EBCDIC或GB2312;
  2. 由记录组成(典型的是每行一条记录);
  3. 每条记录被分隔符分隔为字段(典型分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格);
  4. 每条记录都有同样的字段序列。

在这些常规的约束条件下,存在着许多CSV变体,故CSV文件并不完全互通。然而,这些变异非常小,并且有许多应用程序允许用户预览文件(这是可行的,因为它是纯文本),然后指定分隔符、转义规则等。如果一个特定CSV文件的变异过大,超出了特定接收程序的支持范围,那么可行的做法往往是人工检查并编辑文件,或通过简单的程序来修复问题。因此在实践中,CSV文件还是非常方便的。

三、CSV文件规则

  1. 开头是不留空,以行为单位。
  2. 可含或不含列名,含列名则居文件第一行。
  3. 一行数据不跨行,无空行。
  4. 以半角逗号(即,)作分隔符,列为空也要表达其存在。
  5. 列内容如存在半角引号(即"),替换成半角双引号(“”)转义,即用半角引号(即"")将该字段值包含起来。
  6. 文件读写时引号,逗号操作规则互逆。
  7. 内码格式不限,可为 ASCII、Unicode 或者其他。
  8. 不支持数字。
  9. 不支持特殊字符。

四、CSV文件包含的各种数据

1.常规的内容

表格中:

csv文件中:

2.字段内部有逗号

表格中:

csv文件中:

3.字段内部有引号

表格中:

csv文件中:

4.字段内部有换行符

表格中:

csv文件中:

5.字段内部有空格

表格中:

csv文件中:

五、CSV文件规则

从上面的各种内容可以看出,当字段中包含特殊的字符时,在csv文件中会用双引号进行特殊处理

官方标准:
RFC4180:https://www.rfc-editor.org/rfc/rfc4180.txt
维基百科wiki:https://wiki.lazarus.freepascal.org/CSV

  1. 字段内包含逗号, 双引号, 或是换行符的字段必须放在双引号内。
  2. 字段内包含引号必须在其前面增加一个引号,来实现引号的转码。
  3. 元素中的换行符将被保留下来。
  4. 分隔符逗号前后的空格仍然会被保留。
  1. 每条记录占一行。

  2. 以逗号为分隔符。

  3. 逗号前后的空格会被忽略。

  4. 字段中包含有逗号,该字段必须用双引号括起来。

  5. 字段中包含有换行符,该字段必须用双引号括起来。

  6. 字段前后包含有空格,该字段必须用双引号括起来。

  7. 字段中的双引号用两个双引号表示。

  8. 字段中如果有双引号,该字段必须用双引号括起来。

  9. 第一条记录,可以是字段名。

CSV其实就是COMMA SEPARATED VALUE的缩写,出现在档案总管中的档案类型是「逗号分格」,依计算机原来的设定,如果直接点选该档案,计算机将以EXCEL的模式开启该档案。但建议您千万不要这么做,因为CSV档如果以EXCEL开启,由于计算机档案数据转换的原因,会将其CRC之数值改做科学记号方式储存,而造成档案中的 CRC值发生错误。这也是笔者初出茅庐时所得到的惨痛经验,但如果想一窥CSV档的真实面貌,笔者建议您使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。开启后的CSV档包含了四或五个字段(部分),由左至右分别记载着:文件名称(XXXX.JPG)、档案大小(以BYTE为单位)、CRC32值(八个英文字母或数字组成)、档案路径(档案储存的子目录名称)和档案内容描述(一般来说都是明星的英文姓名甚或是专辑名称,也可能空白)。而其中第四栏「档案路径」因为每个人储存整理图档的方式不同,所以本栏通常不存在,而一般有含有「档案路径」这栏的CSV档,又称为ECSV档案

CSV" 是逗号分隔文件 (Comma Separated Values) 的首字母英文缩写,是一种用来存储数据的纯文本格式,通常用于电子表格或数据库软件。在 CSV 文件中,数据“栏”以逗号分隔,可允许程序通过读取文件为数据重新创建正确的栏结构,并在每次遇到逗号时开始新的一栏。

创建 CSV 文件有许多方法。最常用的方法是用电子表格程序,如 Microsoft Excel。在 Microsoft Excel 中,选择“文件”>“另存为”,然后在“文件类型”下拉选择框中选择 "CSV (逗号分隔) (*.csv)"

csv格式(即文件后缀为.csv,属于用excel软件可编辑的逗号分隔的一种文件格式)。

xls 文件就是Microsoft excel电子表格的文件格式。我想就不用多介绍了吧,学校里多少都学过的。

CSV是最通用的一种文件格式,它可以非常容易地被导入各种PC表格及数据库中。此文件,一行即为数据表的一行。生成数据表字段用半角逗号隔开。

CSV是文本文件,用记事本就能打开,XLS是二进制的文件只有用EXCEL才能打开。

CSV(以逗号分隔)。

CSV (*.csv) 文件格式只能保存活动工作表中的单元格所显示的文本和数值。工作表中所有的数据行和字符都将保存。数据列以逗号分隔,每一行数据都以回车符结束。如果单元格中包含逗号,则该单元格中的内容以双引号引起。

如果单元格显示的是公式而不是数值,该公式将转换为文本方式。所有格式、图形、对象和工作表的其他内容将全部丢失。欧元符号将转换为问号。

文本文件的内容有ASCII字符集中的字符组成。

首先:文本文件和二进制文件是有区别的,对于文本文件来说,每个字节(或每几个字节)的意义相同,你只要一个一个字节的读出来就OK了;而对于二进制文件来说,可能有4个字节保存了一个整形,接下去有4个字节保存了一个浮点型等等……所以要想打开二进制文件需要了解它的文件格式。

要想知道文件格式,你可以用16进制编辑器打开一个二进制文件,然后猜测它的格式。

CSV(Comma-Separate-Values)逗号分隔值文件相关推荐

  1. csv逗号分隔值文件_如何将逗号分隔值(CSV)文件拆分为SQL Server列

    csv逗号分隔值文件 Receiving a comma delimited file is not new technology nor is it difficult to deal with i ...

  2. C#对.CSV格式的文件--逗号分隔值文件 的读写操作及上传ftp服务器操作方法总结(转)

    前言 公司最近开发需要将数据保存到.csv文件(逗号分隔值 文件)中然后上传到ftp服务器上,供我们系统还有客户系统调用,之前完全没有接触过这个,所以先来看看百度的解释:逗号分隔值(Comma-Sep ...

  3. CSV(逗号分隔值文件)简单使用方法

    今天学了什么学了什么?让我想想-CSV!逗号分隔值文件(好神(dou)奇(bi)的名字)!好进入主题,作为记录数据的文件,一定有其和其他数据记录文件不能比的过人之处.比如: 1. 能用excel直接打 ...

  4. CSV逗号分隔值文件

    规则 0 开头是不留空,以行为单位. 1 可含或不含列名,含列名则居文件第一行. 2 一行数据不垮行,无空行. 3 以半角符号,作分隔符,列为空也要表达其存在. 4 列内容如存在半角逗号(即,)则用半 ...

  5. csv(逗号分隔值)文件用Excel编辑

    在阅读<集体智慧编程>时,看到了csv文件,咋看起来跟Excel文件样子很像,具体百度吧. 这里记录下怎么用Excel来编辑csv文件. csv文件直接用记事本打开,可以看见每个字段都是用 ...

  6. 如何将excel表格的.csv(逗号分隔值文件)转换成.xls文件

    在实际应用中,有时需要将.csv文件(其是一种纯文本格式)转换成.xls文件,进行后续的处理. 对于数量较少的文件来说,可直接采用另存为的方法. 即将保存类型进行更改. 最后可通过文件属性进行查看.

  7. python输入逗号分隔值文件_如何在Python(Pygame)中显示逗号分隔值(.txt)文件中的前10个高分...

    我正在为我的游戏创建一个高分表.它以下列格式将值附加到.txt文件: 5.234,0,0,5234 6.345,1,1,8345 1.649,0,1,2649 2.25,0,1,3250 ...等等 ...

  8. Linux给每个数据后边加逗号,Linux awk如何将文件某列按照逗号分隔-逗号分隔值文件...

    Linux开发技术如今在企业中很受重视,有不少的企业很关注Linux开发程序员,因此参加Linux培训学习的小伙伴也在不断地增加.本篇文章小编就给读者们分享一下Linux awk如何将文件某列按照逗号 ...

  9. python输入逗号分隔值文件_Python-从文本文件中读取逗号分隔的值,然后将结果输出到文本fi...

    欢迎来到StackOverflow! 你的想法是对的,让我们先打开一些文件.with open("text.txt", "r") as filestream: ...

最新文章

  1. 前端面经笔记 2021.8.28
  2. 干货!用 Python 快速构建神经网络
  3. linux内核用什么调试,什么是开发/调试Linux内核最有效和最优雅的方式
  4. 无人出租要遍地,Waymo百度这种报告就得常走起
  5. 微信小程序实践_4显示新闻(2)
  6. 随堂小测app(nabcd)
  7. PHP 5.6 开启CURL HTTPS 类型
  8. ffmpeg简单使用小记
  9. 零售业有效利用物联网的几种方法
  10. 变革,是领导者的特质
  11. AutoTile 自动拼接(四) 学习与实践
  12. 定位CoreLocation 使用
  13. Composer + thinkphp5.1安装与使用
  14. 移动开发者Windows装机必备工具
  15. SpringBoot整合高德地图 地理编码\逆地理编码
  16. 北邮矩阵论- 第1章 1.3两个特殊的线性空间
  17. 宏基因组数据分析:差异分析(LEfSe安装使用及LDA score计算)
  18. php ckfinder 无效请求.,解决nginx和php使用ckfinder无法上传大文件的问题
  19. RabbitMQ相关图形,dljd
  20. 继续教育-职场学习法 试题及答案

热门文章

  1. YOLOV5代码理解——类权重系数和图像权重系数
  2. Clickhouse 空缺值处理
  3. iis php添加映射模块,iis7添加.php的 MIME 映射
  4. 2019年区块链教育培训课程研究报告 |链塔智库
  5. “OneFlow U”吴文童:产品和开发者之间是相互作用的
  6. jfreechart java配置_JFREECHART环境安装配置
  7. jsp+springboot基于ssm的人才招聘求职网站推荐模拟考试系统java idea
  8. oam 纯度_我编程中的纯度:Go中的函数
  9. STL算法——常用查找算法(find、find_if、adjacent_find、binary_search、count、count_if)
  10. 2021-06 青少年软件编程(C语言)等级考试试卷(一级)解析