Python编码格式导致的csv读取错误(pandas.read_csv)

本文记录python小白我今天遇到的这两个问题(csv.reader和pandas.csv_read):

  • pandas模块“CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2”错误
  • csv模块“line contains NULL byte”错误

今天处理数据时疏忽了,而且还偷懒把数据复制到xlsx保存后,直接修改文件后缀成.csv准备用来读取。之后运行算法要读数据的时候果然问题来了。

import pandas as pd
path = 'water30.csv'
df=pd.read_csv(path)
  • 1
  • 2
  • 3
  • 4

注:后两行可写作df=pd.read_csv('water30.csv')。但由于read_csv本身有好多参数(虽然这里不用), 故写成path习惯好些。 
这样会报错CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2

我在网上查了好多种解决办法,由于read_csv的参数很多,所以各有其词,我这里遇到的应该也只是其中一种,久寻无果。直到我看到这里说看了模块_csv.c的代码后,发现文件里不能有 “\0”, 所以csv文件不可以是unicode编码的,可以是ANSI。

针对我直接改后缀名的结果是,点击那个.csv打开时就已经提示我: 

也就是这里改后缀并没有把文件格式弄好。所以我选择“另存为”改选了文件格式为之后,读取就不会报错了。

注:有个疑问没有解决,就是那个我“直接改后缀得到的那个.csv”我用记事本打开查看了一下,编码就是ANSI啊。那我就不知道为什么报错了……不过问题倒是暂时解决了。

现在读取到的格式为是个结构体。

转载于:https://www.cnblogs.com/Rvin/p/9365529.html

Python编码格式导致的csv读取错误相关推荐

  1. Python 基于csv 读取文本文件提示:‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence

    报错 Python 基于csv 读取文本文件提示:'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequenc ...

  2. Python——CSV读取大文件报错_csv.Error: field larger than field limit

    Python--CSV读取大文件报错_csv.Error: field larger than field limit 使用Python读取较大的csv文件时,可能出现大字段,导致超过字段默认限制,从 ...

  3. python csv读取-Python对于CSV文件的读取与写入

    今天天气"刚刚好"(薛之谦么么哒),无聊的我翻到了一篇关于csv文件读取与写入的帖子,作为测试小白的我一直对python情有独钟,顿时心血来潮,决定小搞他一下,分享给那些需要的小白 ...

  4. python csv读取-Python读取csv文件(详解版,看了无师自通)

    前面程序展示的数据都是直接通过程序给出的,但实际应用可能需要展示不同来源(比如文件.网络).不同格式(比如 csv.JSON)的数据,这些数据可能有部分是损坏的,因此程序需要对这些数据进行处理. cs ...

  5. python csv读取-使用python获取csv文本的某行或某列数据的实例

    站长用Python写了一个可以提取csv任一列的代码,欢迎使用.Github链接 csv是Comma-Separated Values的缩写,是用文本文件形式储存的表格数据,比如如下的表格: 就可以存 ...

  6. python从csv读取数据到网页输入框_python中怎么把csv文件读取的数据显示在网页上...

    python的标准库csv库主要是面向本地文件,就是说你的CSV文件得存储在你的电脑上.当进行网络数据采集的时候,很多文件都是在线的.不过有一些办法可以解决这个问题: 1,手动把CSV文件下载到本机, ...

  7. python找不到csv文件_Python如何读取csv文件

    逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本). 纯文本意味着该文件是一个字符序列, ...

  8. 用python的pandas打开csv文件_使用CSV模块和Pandas在Python中读取和写入CSV文件

    什么是CSV文件? CSV文件是一种纯文本文件,其使用特定的结构来排列表格数据.CSV是一种紧凑,简单且通用的数据交换通用格式.许多在线服务允许其用户将网站中的表格数据导出到CSV文件中.CSV文件将 ...

  9. python卸载错误_卸载python后导致yum无法使用的解决办法 - Python - 服务器之家

    卸载python后导致yum无法使用的解决办法 发布时间:2014-08-03 来源:服务器之家 由于服务器需要升级python,参照了一篇坑爹的文章卸载了旧版python # 卸载旧的python ...

  10. python中如何打开csv文件_Python如何读取csv文件

    逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本). 纯文本意味着该文件是一个字符序列, ...

最新文章

  1. adadelta算法_神经网络中常用的优化算法
  2. Android中异步任务AsyncTask的使用
  3. 无状态Spring安全性第1部分:无状态CSRF保护
  4. 飞秋(FeiQ)已在计算机技术的世界里沉浸了十年
  5. 树莓派的命令和linux一样吗,常用的linux命令
  6. 系统集成项目管理工程师考试题型
  7. 光谱共焦测量原理是什么
  8. 金融理论与实务公式汇总
  9. MySQL 管理之道读书总结
  10. 跳跃游戏 改 dfs
  11. HTML 边框和背景设置
  12. TensorFlowX.Y核心基础与AI模型设计开篇
  13. python做一副54扑克牌发牌技巧_最强大脑!杭四中高一男生邹全50秒轻松记住一副扑克牌...
  14. 安卓快速入门系列1(通过插件使用java8的语法)
  15. 数组(初识、创建数组、数组的元素、数组的变量)
  16. 软考数据库详细知识点整理(全)
  17. Biopython使用4:PDB结构
  18. php实现微信公众号生成淘宝客推广海报(正则匹配淘宝联盟)
  19. Nero 7 Premium Reloaded 7.8.5.0
  20. 使用initial-letter实现首字下沉效果,感兴趣的同学欢迎猛击:

热门文章

  1. Mysql 高负载排查思路
  2. Python自学笔记-map和reduce函数(来自廖雪峰的官网Python3)
  3. maven打包时把依赖的jar包打进去
  4. 《应届生求职笔试全攻略》学习笔记(八)——主要测试类型详解
  5. mysql复制表原理_MySQL 主从复制原理与实践详解
  6. 华为鸿蒙系统即将面世,华为鸿蒙系统即将面世,鸿蒙在这些方面比安卓更优秀,你期待吗?...
  7. python安装软件win10_在win10上安装Python和Tensorflow
  8. 文本显示变量_易标签使用Excel数据实现批量打印变量数据
  9. lock.lock()使用,与synchronized对比
  10. 判断Object对象属性的类型