在参加各种机器学习比赛的时候,有时候要读取几百M甚至几个G 的表格数据,为了使读取速度加快,使用一种新的方法,把.csv格式格式的文件转存为.feather格式,再用read_feather读取,速度可以大大提升。

1.将表格数据保存为feather格式

保存的数据大小:

train_data.info()


将Dataframe格式的数据以feather格式储存

train_data.to_feather("train.feather")
2.读取
time1 = time()
train_data = pd.read_csv("train.csv")
time2 = time()
print("use csv to read:", time2 - time1,"s")time1 = time()
train_data = pd.read_feather("train.feather")
time2 = time()
print("use feather to read :", time2-time1, "s")


读取csv格式用了9.5S
而feather格式的只用了1.2s

pandas将csv文件保存文feather格式,大大加快读取速度相关推荐

  1. pandas读取csv写入mysql_使用python的pandas库读取csv文件保存至mysql数据库

    第一:pandas.read_csv读取本地csv文件为数据框形式 data=pd.read_csv('G:\data_operation\python_book\chapter5\\sales.cs ...

  2. 【Pandas】一文入门Pandas处理csv文件数据集(神经网络/机器学习算法数据预处理)

    Motivation 和某个大佬采集的数据是csv格式的,之前没处理过csv格式的数据.拿来写神经网络训练的时候踩了不少坑,这里记录一下,也方便后来人学习. Pandas处理csv文件 处理csv文件 ...

  3. 用python的pandas打开csv文件_使用CSV模块和Pandas在Python中读取和写入CSV文件

    什么是CSV文件? CSV文件是一种纯文本文件,其使用特定的结构来排列表格数据.CSV是一种紧凑,简单且通用的数据交换通用格式.许多在线服务允许其用户将网站中的表格数据导出到CSV文件中.CSV文件将 ...

  4. Pandas 操作 csv 文件

    Pandas 操作 csv 文件 官方英文文档 官方文档PDF下载 中文文档 一.安装 Pandas 安装 Pandas: pip3 install pandas 导入 Pandas: import ...

  5. python pandas 处理相同标题的csv文件_Python使用pandas处理CSV文件的实例讲解

    Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大. CSV(Comma-Separated Values)格式的文件是指 ...

  6. python pandas 读写 csv 文件

    python pandas 读写 csv 文件 具体看官方文档 https://www.pypandas.cn/docs/user_guide/io.html#csv-文本文件 import pand ...

  7. 用python的pandas打开csv文件_python读写数据读写csv文件(pandas用法)

    python中数据处理是比较方便的,经常用的就是读写文件,提取数据等,本博客主要介绍其中的一些用法.Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用 ...

  8. Python 用pandas写入csv文件举例

    用pandas写入csv文件举例 import pandas as pd import numpy as nppd.set_option('display.unicode.ambiguous_as_w ...

  9. 如何解决vs中无法使用utf8文件的问题 请将该文件保存为 Unicode 格式以防止数据丢失

    在深入理解c++11一书中有说两个字符集,一个源码字符集,一个编码字符集(在msvc编译器文档里面叫做执行字符集). 一个是文件的保存格式. 一个是编译器在编译过程中如何编码字符串. 文件用utf-8 ...

最新文章

  1. Struts-Logic 标签库
  2. 如何让敏捷中的每日站会发挥最大效果?
  3. 案例 宠物医生给小动物看病 c# 1614100379
  4. Model 3车主对FSD套件不满意 德国法院下令特斯拉回购汽车
  5. 多数据源报表解析之简单多源报表
  6. Java 泛型List clone
  7. 运营商回应 5G 商用放号推迟;iPhone 或推出渐变色;GoLand 2019.2.1 发布 | 极客头条...
  8. [debug] 开源项目的本地使用:使用pip安装的函数库不能被anaconda和pycharm使用+visdom使用 +路径问题
  9. mysql并行读写_mysql数据库大规模数据读写并行时导致的锁表问题
  10. 介绍两款代码自动生成器,帮助提升工作效率
  11. [Laravel] 如何使用PHP实现前端分页
  12. 计算机教案.doc免费,TOP16[定稿]计算机基础教案33412.doc文档免费在线阅读
  13. 《Python数据科学手册》—学习笔记
  14. tds for mysql_tds数据库是什么-和tds数据库相关的问题-阿里云开发者社区
  15. java计算机毕业设计物流站环境监测系统源码+系统+数据库+lw文档+mybatis+运行部署
  16. 修复计算机win10,快速修复Win10系统故障的两大通用方法
  17. 双十二|Solidigm官方店铺 惊喜大放送 福利享不停
  18. MySQL定位慢查询步骤
  19. 谷歌浏览器 android 69,如何将谷歌浏览器69及以上版本切换回旧版UI界面
  20. Translation插件异常解决

热门文章

  1. 计算机只存在于计算机硬盘上,计算机病毒只存在于计算机硬盘上。
  2. Transformer---RNN网络
  3. Java的泛型---(英雄联盟集合嵌套案例)
  4. cs224w(图机器学习)2021冬季课程学习笔记16 Community Detection in Networks
  5. 自监督论文阅读笔记 Urban feature analysis from aerial remote sensing imagery using self-supervised and semi-s
  6. Python 打开/关闭其他应用程序方法
  7. Azul开源Zing Jvm
  8. catalina 无法验证macos_macOS Catalina 无法安装是什么原因?
  9. 如何防止木马性图片上传
  10. MacBook 快捷键个人总结和设置