csv 文件本质上是文本文件,用来保存表格数据,它使用逗号来分隔行内的单元,使用换行符来分隔不同的行。下面是一个普通的 csv 文件,包含两行和两列,内容如下:

第一行第一列,第一行第二列

第二行第一列,第二行第二列

在 Excel 中的显示效果如图 1 所示。

图 1 普通的csv文件

如果某个单元格中包含“,”分隔符,那么它将使用双引号将单元格的内容包裹起来。如下面的 csv 文件内容就是包裹有“,”分隔符的情形。

"包括,的单元",第一行第二列

第二行第一列,第二行第二列

注意,第一行第一列是用双引号包裹的,显示效果如图 2 所示。

图 2 带有“,”分隔符的单元

如果某个单元格包含多行,也是将该单元格的内容包裹在双引号内。例如,下面的 csv 文件的第一行第一列就包含多行。

"包含换行符的单元

第2行

第三行",第一行第二列

第二行第一列,第二行第二列

在 Excel 中的显示效果如图 3 所示。

图 3 包含多行内容的单元格

如果单元格的内容包含双引号呢?其还是用双引号来包裹,内容中的双引号用两个连续的双引号来表示。例如下面的csv文件的第一行第一列就包含“””字符:

图 4 带有双引号的单元格

可以看出 csv 文件的格式还是比较简单的,通过“,”和“””就能完整表示一个仅包含文本内容的表格数据。在 Python 中,可以不通过操作文本文件的方式来对 csv 文件进行处理,因为其可以通过很多库来直接操作单元格内容,而不用关心 csv 文件格式的细节。本节将介绍一个比较常见的处理 csv 文件的模块——csv。

csv 模块是 Python 的一个内置模块,不需要安装只需要在使用之前将其引入即可,方式如下:

import csv

对 csv 文件的操作主要有两个,一个是读入,一个是写出。首先来介绍读入,在 csv 模块中有一个类 reader,该类实例对象是可迭代的,就是可以用 for...in... 语句来变量所有的 csv 的行。同时其还有一个属性 line_num,表示当前读入的行号。

下面以图 1 所示的 csv 文件为例来演示相关操作:

>>> import csv # 引入csv模块

>>> reader_obj = csv.reader(open('demo1.csv', 'r', encoding="utf-8"))

>>> for line in reader_obj: # 对每行进行操作

... print("line number: %d" % reader_obj.line_num) # 显示当前行号

... print("content: %s" % str(line)) # 显示当前行的内容

... print("") # 输出换行

... # 结束for循环

line number: 1 # 行号为1

content: ['第一行第一列', '第一行第二列'] # 内容为列表

# 第6行的输出

line number: 2 # 行号为2

content: ['第二行第一列', '第二行第二列'] # 第二行的内容

下面是一个查找诈骗电话的例子。诈骗电话有这样一个特点,就是这些电话仅往外拨,从来不接听别人的电话。现在我们拿到一个完整的通话记录,内容显示如图 5 所示。

图 5 通话记录

其中第一列是呼叫方的号码,第二列是被叫方的电话号码,第三列是呼叫开始的时间,第四列是通话时长。我们希望通过这些数据来找到其中的诈骗电话号码。我们依次读出所有的行,然后在呼叫方号码列表中查找没有出现在被叫方号码列表的号码,它们就可能是诈骗电话号码。

实现代码如下:

import sys, csv

# 打开通话记录文件

if sys.version_info.major == 3: # python3

f = open("telephone.csv", "r",encoding="utf-8", newline="\n")

else: # Python 2

f = open("telephone.csv", "r")

reader = csv.reader(f)

caller_list = [] # 呼叫方号码列表

callee_list = [] # 被叫方号码列表,最开始都为空

for record in reader: # 对每个记录进行处理

# 第一行是表头,不进行处理

if reader.line_num == 1:

continue

caller_list.append(record[0]) # 记录下所有的呼叫号码

# 记录下所有的被呼叫号码

callee_list.append(record[1])

caller_list = set(caller_list) # 去掉重复的呼叫号码

f.close() # 关闭文件

# 对于每个呼叫号码

for caller in caller_list: # 如果它没有被呼叫过,那么标定为骗子号码

if caller not in callee_list:

print(caller, "is Cheat Telephone Number")

运行后的输出如下:

$ python cheatTel1.py

13243767000 is Cheat Telephone Number

下面我们来介绍将数据输出到 csv 文件中的方法。在 csv 模块中有一个 writer 类,其提供 writerow() 和 writerows() 两个接口函数。使用这两个接口函数便可以将列表数据输出到 csv 文件中。

下面是一个简单的例子,其使用 writerow() 来产生一个 csv 文件:

import csv

csv_writer_obj = csv.writer(open("writeDemo1.csv", "w"))

csv_writer_obj.writerow(("a", "b", 12, 24.6))

输出文件 writeDemo1.csv 的内容在 Excel 中的显示如图 6 所示。

图 6 writeDemo1.csv文件的内容

在输出时并不要求每行的列数相同,例如下面的代码,其输出了三行,这三行的列数分别为 4、2、3。

import csv

csv_writer_obj = csv.writer(open("writeDemo2.csv", "w"))

csv_writer_obj.writerow(("a", "b", 12, 24.6))

csv_writer_obj.writerow(("c", "d"))

csv_writer_obj.writerow(("e", "", "1"))

输出 csv 文件,内容如图 7 所示。

图 7 writeDemo2.csv文件的内容

另外一个接口函数是 writerows(),顾名思义,该接口函数可以一次写入多行。下面的例子便是将一个列表写入到 csv 文件中。

import csv

data = [ # 列表,每个元素代表一行

["a", "b", "c"],

["d", "e", "f"],

]

csv_writer_obj = csv.writer(open("writeDemo3.csv", "w"))

csv_writer_obj.writerows(data)

输出 csv 文件,内容如图 8 所示。

图 8 writeDemo3.csv的内容

python的csv安装_Python csv模块:处理csv文件相关推荐

  1. 在python中requests模块怎么安装_Python requests模块在Windows下安装

    发现一个爬虫库太方便了,而且支持python3! 安装方法在http://docs.python-requests.org/en/latest/user/install/#install很详细 只不过 ...

  2. python scapy模块安装_python scapy模块安装与依赖模块

    scapy 模块安装 今天因为要用到scapy 模块就进行安装: windows: pip install scapy 成功安装. mac: pip install scapy 竟然提示权限问题,于是 ...

  3. python os库安装_Python模块/包/库安装(6种方法)

    Python模块/包/库安装(6种方法) 冰颖机器人 2016-11-29 21:33:26 一.方法1: 单文件模块 直接把文件拷贝到 $python_dir/Lib 二.方法2: 多文件模块,带s ...

  4. python 条形图填充疏密_python matplotlib模块: fill_between(填充曲线)

    填充曲线可以在前面plot绘制的曲线的基础上填充这些不同曲线之间的差异, 可以更直观的看出差异. 数据集 源码: # coding=utf-8 import pandas as pd from mat ...

  5. python主函数调用格式_Python的模块与函数

    一.概述Python的程序由包.模块和函数组成. 函数是一段可重用的有名称的代码.通过输入的参数值,返回需要的结果,并可存储在文件中供以后使用.几乎任何Python代码都可放在函数中.Python为函 ...

  6. python 编译器spyder 安装_Python开发环境Spyder安装教程

    Spyder(Scientific PYthon Development EnviRonment)是一个强大的交互式 Python 语言开发环境,提供高级的代码编辑.交互测试.调试等特性,支持包括 W ...

  7. python pil怎么安装_python pil 怎么安装 怎样安装python的图像处理库pillow

    python 怎么安装pillow 1. 安装pip [plain] view plain copy sudo easy_install pip pip 安装成功就可以直接安装pil或者pillow ...

  8. python扩展包安装_python怎么安装扩展包

    以安装扩展包SymPy为例: 方式一: 格式:pip install xxx //xxx:包名 示例:pip install SymPy 方式二: 如果有安装Git,也可以使用pip+git的方式安装 ...

  9. python读取文件夹下特定的文件_python os模块获取指定文件夹下所有文件名

    本文采用os.walk()和os.listdir()两种方法,获取指定文件夹下的文件名. python os模块获取指定文件夹下所有文件名 第一种方法使用os.walk(): os.walk() 方法 ...

  10. python 3.7 安装 spyder‑kernels 模块

    Spyder 启动 IPython 内核时发生错误 需要安装 spyder‑kernels 模块 pip install -i https://pypi.tuna.tsinghua.edu.cn/si ...

最新文章

  1. Zookeeper分布式一致性原理(十):Zookeeper在大型分布式系统的应用
  2. Java在使用时需要注意那些问题_java使用String.split方法时要注意的问题
  3. hdu5348 MZL's endless loop(欧拉回路)
  4. 工业用微型计算机(28)-dos和bios功能调用(2)-int 21h
  5. python类基础知识注意点
  6. 益生菌可能导致的“菌血症”与死亡(调研手稿六)
  7. 不会用Camtasia的“库”,你可能错过了一个亿
  8. 阿里云SDK手册之java SDK
  9. Arduino U8glib库中的中文字体
  10. libaio-devel下载
  11. vlan和静态路由配置实验
  12. 树莓派Pico 开机自动运行程序
  13. rtl驱动 ubuntu 禁用_ubuntu18.04系统中使用dkms安装wifi驱动rtl8723be的方法
  14. mysql 测试数据库employees导入
  15. Android-小游戏
  16. Wordpress用文件记录访客 IP和访问量
  17. 大学计算机基础模拟试题
  18. python怎么进入虚拟环境_Python 中如何使用 virtualenv 管理虚拟环境
  19. 程序员配电脑(只要三千元!)
  20. 数据分析系列--常见的评估方法

热门文章

  1. php编程怎样装数据库,php数据库管理工具phpmyadmin下载、安装、配置
  2. RC / RL并联电路计算
  3. CROSS APPLY和OUTER APPLY的区别
  4. 理解 this.initialize.apply ( this, arguments )
  5. java系统化基础-day02-运算符、选择结构、循环结构
  6. 2017-06-15 前端日报
  7. 里费默之死的哲学解释
  8. golang中实现RSA(PKCS#1)加密解密
  9. 前端,后端,前台,后台到底应该怎么理解。
  10. Ambiguous mapping. Cannot map ‘xxxController‘ method