规则

  0 开头是不留空,以行为单位。
  1 可含或不含列名,含列名则居文件第一行。
  2 一行数据不垮行,无空行。
  3 以半角符号,作分隔符,列为空也要表达其存在。
  4 列内容如存在半角逗号(即,)则用半角引号(即"")将该字段值包含起来。(ad中有可能出现逗号:"\""+ ad + "\"" )
  5 列内容如存在半角引号(即")则应替换成半角双引号("")转义。
  6 文件读写时引号,逗号操作规则互逆。
  7 内码格式不限,可为ASCII、Unicode或者其他。
  CSV文件多用于储存数据,EXCEL文件可以方便地另存为CSV文件。
  CSV最常见于图片扫描文件包中,以下为这种用途文件的介绍。
  COMMA SEPARATED VALUE的缩写,出现在档案总管中的档案类型是「逗号分隔」,依计算机原来的设定,如果直接点选该档案,计算机将以EXCEL的模式开启该档案。但建议您千万不要这么做,因为CSV档如果以EXCEL开启,由于计算机档案数据转换的原因,会将其CRC之数值改做科学记号方式储存,而造成档案中的 CRC值发生错误。这也是笔者初出茅庐时所得到的惨痛经验,但如果想一窥CSV档的真实面貌,笔者建议您使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。开启后的CSV档包含了四或五个字段(部分),由左至右分别记载着:文件名称(XXXX.JPG)、档案大小(以BYTE为单位)、CRC32值(八个英文字母或数字组成)、档案路径(档案储存的子目录名称)和档案内容描述(一般来说都是明星的英文姓名甚或是专辑名称,也可能空白)。而其中第四栏「档案路径」因为每个人储存整理图档的方式不同,所以本栏通常不存在,而一般有含有「档案路径」这栏的CSV档,又称为ECSV档案
  所谓“CSV”,是Comma Separated Value(逗号分隔值)的英文缩写,通常都是纯文本文件。 下面是一个实际CSV文件中的部分内容,让大家对他有一个感性的认识。我们选的是Sjojo_Rescan 的CSV文件(Sjojo是ASW-亚洲扫图风的成员之一)。 
  sj_mino1001.jpg,715282,4FB55FE8, 
  sj_mino1002.jpg,471289,93203C5C, 
  sj_mino1003.jpg,451929,C4E80467, 
  通常CSV文件开头是不留空的,以行为单位,每行中记录一张图片的了多项数据,每项数据用逗号 来分隔(标准英文逗号)。一般说来集图用的.CSV文件的格式是这样的: 
  文件名,文件大小(以字节为单位),CRC校验值,注释(可省略) 
  sj_mino1001.jpg,715282,4FB55FE8, 
  | | | | 
  文件名 文件大小 CRC值 注释(已省略) 
  如果你的机器上装了Microsoft Excel的话,.csv文件默认是被Excel打开的。需要注意的是,当你 双击一个.CSV文件,Excel打开它以后即使不做任何的修改,在关闭的时候Excel往往会提示是否要 改成正确的文件格式,这个时候千万记得要选择“否”。因为Excel认为.CSV 文件中的数字是要用 科学记数法来表示的,而我们要的.CSV文件中的数字是普通的。如果你选择了“是”的话,Excel会把CSV文件中所有的数字用科学计数来表示(2.54932E+5这种形式),这个文件就没法用了。 所 以如果你的CSV文件绝大部分都是用在集图上的话,建议把.CSV的默认打开方式改成任意一个文本 编辑器,系统自带的记事本就是个不错的选择。 
  好,让我们回到CSV文件的格式中来。见上面,从左到右 sj_mino1001.jpg是文件名,715282 是以字节表示的文件大小。当文件名中包含逗号的时候,由于逗号在CSV文件中特殊的作用,为了 不至于产生歧义,需要用引号把文件名括起来。比如 "The Art, Fantasy.jpg",384211,...,.... 接着是一个8位的16进制数字 4FB55FE8,这是文件的CRC32校验值。整个CSV文件的精髓都在这里。 
  让我们举个小例子来说明它的意义:Sjojo发布了一张图sj_mino1001.jpg,假设你是从朋友手中拿 到这张图的,那么你肯定常常会有这样的疑问,这张图在传播的过程中是否被改动过呢?是否无意 中遭到了损坏呢?CRC就是为解决这个问题而存在的。一般情况下,扫图家每发布了一套图,就同 时放出一个CSV文件(这种CSV通常叫做Official CSV,也就是官方发布的CSV的意思),这个CSV中 的CRC值是用专门的软件通过CRC32算法(常用的CRC算法还有CRC16)对文件运算后生成的一个值, 这个值可用作文件真身的标志。在绝大多数情况下,如果这个文件在传播过程中无论是大小还是内 容被改动过。那么,用同样的CRC32算法再对文件进行运算后产生的CRC校验值就完全不一样了。如 果得出的CRC值是一样的,则完全有理由认为这个文件是真身,没有被改动过。还有些时候,收来 的图片文件名被改动过了,那么你怎么知道谁是谁呢?这个时候CRC值又起作用了:用专用的软件对图片处理后,可以得到文件的大小和CRC值,然后根据大小和CRC值在CSV中寻找是否有适合的图片。如果有,就会把图片的名字改成CSV里的。举个例子,你收到了一张图片,名字是pic0001.jpg,同时你知道这张图片是Sjojo_Rescan这个集子里面的,但是不知道具体是哪一张。用软件得到它的大小和CRC分别是715282和4FB55FE8,那么软件在CSV文件里找到一行sj_mino1001.jpg,715282,4FB55FE8,大小和CRC都符合,软件就认为这张图片的原名是sj_mino1001.jpg,接着自动把文件的名字改成sj_mino1001.jpg。改动的不是CSV文件而是图片的文件名。接下来的是注释和说明,可以省略掉。需要注意的是注释的后面是没有逗号的,如果要省略注释的话,一定要在CRC值的后面保留一个逗号,否则软件会把CRC值认为是注释的。
  相信看完上面的一大堆东西后,你不但对CSV文件有了个大概地了解,对它的用途应该也有些模糊的概念了吧。我们收集图片往往是通过各种各样不同的渠道,比如从网站上,IRC上,抑或干脆是朋友送的光盘。在整个的传播过程中,图片有可能遭受到各种各样的非人待遇。尤其是从网站上收来的图片。有些时候仅仅是简单的改了一下名字,更多的时候由于很多PLMM站空间有限,常把图片的尺寸缩小,或者把图片文件缩小。一张1356x588的图被改成了678x294,或者一个四五百K的文件被缩成了几十K都是常有的事。比较可恶的是,许多网站把原来扫图家的Logo去掉,打上自己网站的Logo。还有些许搞笑派的玩家,把各种各样的图片移花接木,改头换面。这些对于一般的看 
  图娱乐无伤大雅,但是对于集图来说,收到这样的图片是无法容忍的。如何验明图片的正身,这是扫图家和集图者共同面对的问题。CSV文件就是为了解决这样的问题而出现的。CSV文件最早用在简单的数据库里,由于其格式简单,并具备很强的开放性,所以起初被扫图家用作自己图集的标记。 如上面所说的,CSV文件是个纯文本文件,每一行表示一张图片的许多属性。你在收一套图集时,只要能找到它的CSV文件,用专用的软件校验后,你对该图集的状况就可以了如指掌。比如这套图一共有多少张,你收到了多少张,哪些是原图,那些是可能被改动过或者损坏了的图片......我们可以把.CSV文件看作一份索引,你不但可以“按图索骥”,还可以检查自己收来的“马子”血统是 否纯正。 
  CSV文件的来源通常有两种:一种是扫图家自己发布的CSV,一般称作Official CSV。也就是官方发布的CSV,通常说来是有相当的权威性的。比较特殊的是亚洲的许多扫图家,除了公开发布的图以外,还有一些私下发布的Special图,或者一些专门送给朋友的图。加上扫图家不愿意或者不会做CSV,所以他们图集的CSV往往由集图界中一些资深前辈出头来做。在这种情况下,往往会出现一个图集有好几个版本的CSV文件,并且每个版本之间都有不小的差别。此时的CSV不仅是验明真身的依据,同时也给了集图者一个希望:即使缺的再多,即使用这个版本csv收全的人再少,一定会有一个人是全的,就是此CSV的作者!集图界前辈LiQing有一句名言:“有CSV就表示一定有图!” 自然而然的,民间现了一些权威的做CSV的玩家。比如早期的EDZONE,现在依然活跃的OSun,shum,vsam,TE,Paul... 还有偶们COC图盟的WQC 
  好了,说了那么多,大家可能会问,CSV文件那么好用,到底要怎么用呢?不会要自己手工来检测吧?呵呵,还记得上文中一再出现的“软件”这个字眼吗?有专用的软件可以帮助我们完成这项工作。常用的软件有The!Checker和The Hunter。目前这两个软件都有汉化的简体中文版,汉化人是来自北方的snowtank

http://www.cnblogs.com/wangdongxu1984/archive/2010/01/28/1658327.html

CSV逗号分隔值文件相关推荐

  1. csv逗号分隔值文件_如何将逗号分隔值(CSV)文件拆分为SQL Server列

    csv逗号分隔值文件 Receiving a comma delimited file is not new technology nor is it difficult to deal with i ...

  2. csv(逗号分隔值)文件用Excel编辑

    在阅读<集体智慧编程>时,看到了csv文件,咋看起来跟Excel文件样子很像,具体百度吧. 这里记录下怎么用Excel来编辑csv文件. csv文件直接用记事本打开,可以看见每个字段都是用 ...

  3. CSV(Comma-Separate-Values)逗号分隔值文件

    文章目录 前言 一.CSV文件背景 二.CSV文件用法 三.CSV文件规则 四.CSV文件包含的各种数据 1.常规的内容 2.字段内部有逗号 3.字段内部有引号 4.字段内部有换行符 5.字段内部有空 ...

  4. C#对.CSV格式的文件--逗号分隔值文件 的读写操作及上传ftp服务器操作方法总结(转)

    前言 公司最近开发需要将数据保存到.csv文件(逗号分隔值 文件)中然后上传到ftp服务器上,供我们系统还有客户系统调用,之前完全没有接触过这个,所以先来看看百度的解释:逗号分隔值(Comma-Sep ...

  5. CSV(逗号分隔值文件)简单使用方法

    今天学了什么学了什么?让我想想-CSV!逗号分隔值文件(好神(dou)奇(bi)的名字)!好进入主题,作为记录数据的文件,一定有其和其他数据记录文件不能比的过人之处.比如: 1. 能用excel直接打 ...

  6. CSV逗号分隔值格式文件(示例分析)

    CSV全称Comma Separated Values是"逗号分隔值"的英文缩写.通常是纯文本文件,可以被文本编辑软件,Excel或WPS表格打开. 基本规则 开头不留空,以行为单 ...

  7. [概念]CSV逗号分隔值

    csv(Comma Separated Values)逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序列,不 ...

  8. (转)csv — 逗号分隔值文件格式

    原文:https://pythoncaff.com/docs/pymotw/csv-comma-separated-value-files/125 csv 模块主要用于处理从电子数据表格或数据库中导入 ...

  9. 如何将excel表格的.csv(逗号分隔值文件)转换成.xls文件

    在实际应用中,有时需要将.csv文件(其是一种纯文本格式)转换成.xls文件,进行后续的处理. 对于数量较少的文件来说,可直接采用另存为的方法. 即将保存类型进行更改. 最后可通过文件属性进行查看.

最新文章

  1. 20道常见初级Java面试题
  2. Mondrain支持kylin问题解决
  3. 东方和西方的两个视角的摘抄
  4. 2021广西对口中职高考成绩查询,教育资讯:2021广西本科对口中职分数线公布时间 几号查分...
  5. Microsoft Edge 83 稳定版发布
  6. LINE:不得不看的大规模信息网络嵌入
  7. 我的linux 常用命令
  8. [转]解决mySQL占用内存超大问题
  9. mac matlab 模糊,MATLAB 2014a 在Mac OS X yosemite 10.10 Retina显示模糊的解决办法
  10. linux ipk,openwrt下ipk生成过程及原理
  11. 计算机配置更新怎么关闭,如何关闭戴尔电脑自动更新系统配置
  12. 官网USB读卡器移植(TF卡SDIO模式 + SPI-flash)
  13. 电视机丢失卫星信号出现花屏——Shader
  14. 数学之美:各个击破算法和Google云计算的基础
  15. 电子章怎么做(电子公章怎么生成),只要三步
  16. web前端期末大作业:美食网站设计与实现——HTML+CSS+JavaScript休闲美食餐饮公司网站静态模板(6个页面)
  17. 将无处不在的网络爬虫引向合法的轨道已迫在眉睫!
  18. centos 挂载iso光盘镜像文件
  19. imx6芯片通过EIM总线外扩多路sja1000 CAN控制器
  20. 打造 PE 和 Linux 二合一U盘启动盘

热门文章

  1. 超调量怎么计算公式_超调量
  2. 如何获取网页下载按钮背后的真实下载地址?
  3. android relativelayout 比例,Android RelativeLayout 常用属性
  4. 交通事故等级预测(附代码)
  5. CSS - CSS代码格式及使用
  6. RabbitMQ的三种模式-----主题模式(Topic)
  7. AR(3)模型递推最小二参数估计的MATLAB实现
  8. Apollo配置中心-手把手教你搭建Apollo配置中心运行环境
  9. linux rz下载文件,Linux使用rz sz上传下载文件
  10. 使用家庭电脑做属于自己的服务器