文章目录

  • 1. 不是utf-8格式,先读取一遍为utf-8,忽略掉错误:
  • 2. 出现null bytes错误,使用engine='c':
  • 3. 读取成功之后,保存为utf-8格式:

1. 不是utf-8格式,先读取一遍为utf-8,忽略掉错误:

filename = open('E://source_data/insured_utf-8.csv', encoding='utf-8',errors='ignore')
df_chunk = pd.read_csv('E://source_data/insured_utf-8.csv', chunksize=1000000, parse_dates=True, encoding = "utf-8", dtype='object',error_bad_lines= False,engine='c')

2. 出现null bytes错误,使用engine=‘c’:

df_chunk = pd.read_csv('E://source_data/insured_utf-8.csv', chunksize=1000000, parse_dates=True, encoding = "utf-8", dtype='object',error_bad_lines= False,engine='c')

3. 读取成功之后,保存为utf-8格式:

df_concat.to_csv('E://source_data/insured_utf-8.csv',header=True,index=False,encoding = "utf-8")

pandas读取大文件csv容易出现的错误相关推荐

  1. pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库

    pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库 在pandas中读取表类文件的时候有一个参数chunksize,只要指定了这个参数的数值,那么得到的结果就不 ...

  2. pandas高效读取大文件(csv)方法之-parquet

    一.数据类型轻量化 def reduce_df_memory(df):""" iterate through all the columns of a dataframe ...

  3. python读取大文件csv内存溢出_Python,内存错误,csv文件太大

    我有一个python模块的问题,它不能处理导入大数据文件(文件目标.csv重量接近1 Gb) 加载此行时出现错误:targets = [(name, float(X), float(Y), float ...

  4. Python——CSV读取大文件报错_csv.Error: field larger than field limit

    Python--CSV读取大文件报错_csv.Error: field larger than field limit 使用Python读取较大的csv文件时,可能出现大字段,导致超过字段默认限制,从 ...

  5. python读取大文件-Python如何读取、拆分大文件

    简述 最近和第三方数据接触较多,数据量也开始陡增,从一开始的1KW行,最大到了1亿行,这让我这个常年处理"小数据'的人有点捉襟见肘.本来数据放在hive中也是可以操作的,但是有时候需求是做一 ...

  6. 学python看什么书好1002无标题-如何使用pandas读取txt文件中指定的列(有无标题)

    最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了. 我的需求是取出指定的列的数据,踩了些坑给研究出来了. import pandas ...

  7. python按列读取txt文件_如何使用pandas读取txt文件中指定的列(有无标题)

    最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了. 我的需求是取出指定的列的数据,踩了些坑给研究出来了. import pandas ...

  8. python读取指定路径txt文件-如何使用pandas读取txt文件中指定的列(有无标题)

    最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了. 我的需求是取出指定的列的数据,踩了些坑给研究出来了. import pandas ...

  9. 【Python】Pandas读取tsv文件

    TSV文件和CSV的文件的区别是:前者使用\t作为分隔符,后者使用,作为分隔符. 使用pandas读取tsv文件的代码如下: train=pd.read_csv('test.tsv', sep='\t ...

最新文章

  1. java oracle exp_java中使用oracle的exp/imp导出、导入数据
  2. 生活在AI的世界是种什么体验?
  3. [云炬创业学笔记]第一章创业是什么测试8
  4. 阿里高专王夕宁:Istio网关之南北向流量管理
  5. KubeCon 2018 参会记录 —— FluentBit Deep Dive 1
  6. Monte Carlo Rendering De-noising
  7. 没有第三个变量的前提下交换两个变量_很多人连Python变量都没搞懂,说自己会python
  8. 你知道url中的特殊符号含义么
  9. wordpress常用插件
  10. 如何用ps修改图片的大小不变形
  11. 饮茶而思其源,中国茶叶之起源
  12. 新版Chrome设置--disable-web-security无效 解决方法
  13. loop与for loop分别实现乘法口诀表
  14. dotnetfx35.exe
  15. PreTranslateMessage()
  16. Explaining Knowledge Graph Embedding via Latent Rule Learning
  17. 活期账户10亿个+日均交易4亿笔,建设银行如何啃下系统转型的“硬骨头”?
  18. 什么样的护眼灯适合孩子用?真正适合孩子的护眼台灯
  19. 拓扑排序与关键路径(AOV网和AOE网)
  20. 免抠图PNG素材网站

热门文章

  1. python微信聊天机器人_python实战项目,使用itchat模块制作微信聊天机器人
  2. PHP 每小时抽奖,php分时间段的抽奖程序代码
  3. html文件嵌入到reportlab,Reportlab的Code128条形码作为HTML图像标签,在Python中使用数据URI方案...
  4. angularjsl路由_AngularJS路由和模板
  5. mysql通配符查询 性能_使用mysql5.7新特性解决前通配符查询性能问题
  6. mysql 账户管理_Mysql账户管理_MySQL
  7. mysql windows ad_您可以使用PHP获得Windows(AD)用户名吗?
  8. mysql删除重复sql_mysql中删除完全重复数据的准确SQL语句
  9. java 字符串数组连接
  10. 【CentOS8】安装 mysql 5.7