参考链接: 使用Pandas在Python中读写CSV文件

前期文章链接:

YOLOv3论文

https://arxiv.org/pdf/1804.02767.pdf

正文:

有许多方法可以在Python中读写CSV文件。有几种不同的方法,例如,您可以使用Python的内置open()函数来读取CSV(逗号分隔值)文件,或者可以使用Python的专用csv模块来读取和写入CSV文件。根据您的用例,您还可以使用Python的Pandas库读取和写入CSV文件。

在本文中,您将看到如何使用Python的Pandas库读取和写入CSV文件。但是,在此之前,让我们简要地看看什么是CSV文件。

什么是CSV文件?

CSV文件只不过是一个简单的文本文件。但是,这是存储表格数据的最常见,最简单和最简单的方法。这种特定格式通过遵循分为行和列的特定结构来排列表。这些行和列包含您的数据。每行都以新行终止,以开始下一行。同样,逗号(也称为定界符)分隔每行中的列。

以下表为例:

| City | State | Capital | Population |

| ------------ | ------------ | ------- | ------------- |

| Philadelphia | Pennsylvania | No | 1.581 Million |

| Sacramento | California | Yes | 0.5 Million |

| New York | New York | No | 8.623 Million |

| Austin | Texas | Yes | 0.95 Million |

| Miami | Florida | No | 0.463 Million |

现在,如果我们以CSV格式表示,则上表将如下所示:

City, State, Capital, Population

Philadelphia, Pennsylvania, No, 1.581 Million

Sacramento, California, Yes, 0.5 Million

New York, New York, No, 8.623 Million

Austin, Texas, Yes, 0.95 Million

Miami, Florida, No, 0.463 Million

如您所见,逗号将每一行中的列中的所有值分隔开。但是,您也可以使用其他符号(例如,分号(;))作为分隔符。表格的每一行都会变成CSV文件的新行。CSV格式的核心目的是帮助您紧凑简洁地呈现表格数据。

既然您已经了解了什么是CSV文件,那么该研究一下如何使用Pandas的read_csv()方法读取Python中的CSV文件了。

使用熊猫读取和写入CSV文件

Pandas是一个非常强大且流行的数据分析和处理框架。熊猫最引人注目的功能之一就是它具有读写各种类型的文件(包括CSV和Excel)的能力。您可以使用read_csv()和功能,轻松有效地在熊猫中操作CSV文件to_csv()。

安装熊猫

在使用框架之前,我们必须先安装Panda。安装Pandas的最简单方法之一就是安装Anaconda。它是跨平台的Python发行版,用于执行Python计算和数据分析之类的任务。一旦安装了Anaconda,您将无需任何其他操作即可访问Pandas和其他库(例如SciPy和NumPy)。

此外,您还可以通过pip installer安装Pandas,如下所示:

$ pip install pandas

使用read_csv()读取CSV文件

完成安装后,您可以使用该read_csv()功能读取CSV文件。我们将尝试读取“ titanic.csv”文件,该文件可以从此链接下载。

首先,我们必须导入Pandas库:

import pandas as pd

现在,我们使用以下代码行实际读取和解析文件:

titanic_data = pd.read_csv('titanic.csv')

当我们执行此代码时,它将从当前目录读取CSV文件“ titanic.csv”。您可以从上面的脚本中看到,要读取CSV文件,您必须将文件路径传递给read_csv()Pandas库的方法。read_csv()然后,该方法返回一个包含CSV文件数据的Pandas DataFrame。

您可以通过head()Pandas DataFrame的方法显示CSV文件的前五行,如下所示:

titanic_data.head()

输出:

您还可以通过简单地将资源的URL传递给read_csv()方法来从在线资源中读取CSV文件。让我们阅读位于远程GitHub存储库上的“ titanic.csv”文件。

import pandas as pd

titanic_data = pd.read_csv(r'https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv')

默认情况下,该read_csv()方法将CSV文件第一行中的值视为列标题。但是,您可以在通过以下read_csv()方法读取文件时传递自定义标头名称:

import pandas as pd

col_names = ['Id',

'Survived',

'Passenger Class',

'Full Name',

'Gender',

'Age',

'SibSp',

'Parch',

'Ticket Number',

'Price', 'Cabin',

'Station']

titanic_data = pd.read_csv(r'D:\Datasets\titanic.csv', names=col_names, header=None)

要读取带有自定义标题的CSV文件,您需要将自定义列名称的列表传递给方法的names属性read_csv()。如果要覆盖默认的标头名称,则可以传递header=None关键字参数。

现在,让我们看一下在上一个示例中读取的“ titanic.csv”文件的标题名称。

titanic_data.head()

输出:

在这里,您可以在DataFrame的输出中看到自定义标头。

使用to_csv()编写CSV文件

通过熊猫创建或写入CSV文件的过程可能比读取CSV稍微复杂一些,但仍然相对简单。我们使用该to_csv()函数来执行此任务。但是,您必须先创建一个Pandas DataFrame,然后将其写入CSV文件。

列名也可以通过关键字参数指定,也可以通过参数指定columns不同的分隔符sep。同样,默认定界符为逗号“,”。

这是一个简单的示例,显示了如何通过以下方式将DataFrame导出到CSV文件to_csv():

import pandas as pd

city = pd.DataFrame([['Sacramento', 'California'], ['Miami', 'Florida']], columns=['City', 'State'])

city.to_csv('city.csv')

在上面的示例中,我们创建了一个名为的DataFrame city。随后,我们使用该to_csv()函数将该DataFrame写入了名为“ city.csv”的文件中。生成的CSV文件应具有以下内容:

City,State

Sacramento,California

Miami,Florida

CSV文件包含我们的自定义标头,后跟我们创建的DataFrame中包含的两行数据。

结论

本文介绍了如何使用Python的Pandas库读取和写入CSV文件。要读取CSV文件,请read_csv()使用Pandas库的方法。您还可以通过方法的names属性在读取CSV文件时传递自定义标题名称read_csv()。最后,要使用Pandas编写CSV文件,您首先必须创建一个Pandas DataFrame对象,然后to_csv在DataFrame上调用方法。

[转载] pythonpandas读取csv文件最后一行_简单小案例(一):使用Pandas在Python中读取和写入CSV文件...相关推荐

  1. pythonpandas读取csv文件最后一行_简单小案例(一):使用Pandas在Python中读取和写入CSV文件...

    前期文章链接: YOLOv3论文 https://arxiv.org/pdf/1804.02767.pdf 正文: 有许多方法可以在Python中读写CSV文件.有几种不同的方法,例如,您可以使用Py ...

  2. 用python的pandas打开csv文件_使用CSV模块和Pandas在Python中读取和写入CSV文件

    什么是CSV文件? CSV文件是一种纯文本文件,其使用特定的结构来排列表格数据.CSV是一种紧凑,简单且通用的数据交换通用格式.许多在线服务允许其用户将网站中的表格数据导出到CSV文件中.CSV文件将 ...

  3. csv java web 导入_DAY5-step9 使用CSV模块和Pandas在Python中读取和写入CSV文件

    什么是CSV文件? CSV文件是一种纯文本文件,其使用特定的结构来排列表格数据. CSV是一种紧凑,简单且通用的数据交换通用格式. 许多在线服务允许其用户将网站中的表格数据导出到CSV文件中. CSV ...

  4. python删除指定行_关于csv:删除python中的特定行和对应文件

    我想删除90%的"转向"值等于0的行.这三个图像都有一个对应的图像文件,中间,左边和右边.我也要删除它们.csv文件如下: 我编写了以下代码,以至少获取转向值为0的文件.我所需要的 ...

  5. 问题:使用pandas中的DataFrame写入csv文件多出一行unnamed,如何解决呢??

    问题:使用pandas中的DataFrame写入csv文件多出一行unnamed,如何解决呢?? 参考文章: (1)问题:使用pandas中的DataFrame写入csv文件多出一行unnamed,如 ...

  6. python numpy数组动态写入csv文件_python - 将NumPy数组转储到csv fi中

    python - 将NumPy数组转储到csv fi中 有没有办法将NumPy数组转储到CSV文件中? 我有一个2D NumPy数组,需要以人类可读的格式转储它. 9个解决方案 588 votes n ...

  7. python如何读取txt文件-如何在python中读取文件夹中的txt文件列表

    注意:我在答案的最后写了这些函数,所以请随意跳转到那个 – 但是为了更好地理解,我仍然希望逐个部分地运行代码. 将用于解释的示例方案 假设您在此文件夹中有12个名为test的文件,其中10个是.txt ...

  8. 如何在Python中读取属性文件?

    We can use jproperties module to read properties file in Python. A properties file contains key-valu ...

  9. 在python中读取文件时如何去除行末的换行符以及在Windows与Linux中的区别

    [时间]2018.11.14 [题目]在python中读取文件时如何去除行末的换行符以及在Windows与Linux中的区别 一.去除换行符 以使用readline进行读取为例: import red ...

最新文章

  1. 拦截httpservlet返回码_设计 API 接口,实现统一格式返回
  2. wince驱动异常调试方法(作者:wogoyixikexie@gliet)
  3. cad幕墙下料lisp_石材幕墙屋面不锈钢角钢接闪带施工方法
  4. 四种方式话Equal
  5. 加大Linux服务器的文件描述符
  6. python为什么没有指针_Python中有指针吗?
  7. pe_xscan做了几个改动
  8. 调整linux字体渲染,开始使用 Manjaro(添加源+字体渲染去模糊+软件安装+优化配置+常见错误)(30)...
  9. C# 切割超级大图(.bmp)[1G以上超大图片分块加载代码]
  10. Angular属性绑定的功能探索
  11. 数据分析师常见的十道面试题目
  12. 百度细雨算法2.0详解,规避细雨算法解决方法
  13. windows 文件夹属性全部都为只读。怎么解决?
  14. 什么是指用计算机,cat是指计算机的什么
  15. 视频会议及流媒体十大开源项目
  16. 键盘事件和keycode对照表
  17. python抓取免费ip存入redis
  18. 水笔:20年好用软件或者工具备忘
  19. 小米WIFI CentOS7 网卡模式 亲测
  20. 创建免费阿里云服务空间

热门文章

  1. PAT甲级题目对应知识点分类梳理
  2. 找不到ad用户和计算机,清理可能废弃的AD用户和计算机账户
  3. fj怎么样_评测:丰田FJ 酷路泽动力及性能怎么样是否值得入手
  4. grep mysql_详解grep获取MySQL错误日志信息的方法
  5. python鼠标位置_用python3 返回鼠标位置的实现方法(带界面)
  6. Intellig idea导入项目第一次运行报错- Error running ‘Application‘: Command line is too long—— 解决方法
  7. 递归法:财务金额漏掉1笔或者几笔(排列组合)
  8. HDU 2063:过山车(匈牙利算法模板题)
  9. python机器学习库sklearn——决策树
  10. 安卓调用系统语音识别功能全解(谷歌语音服务):获取识别结果,使用语音识别进行搜索。