python数据处理系列之读写csv数据
python数据处理系列之读写csv数据
- 导入csv文件
pandas中导入csv数据用的方法是read_csv()
import pandas as pd
df = pd.read_csv(r'c:\users\desktop\test.csv')
- 指明分隔符。
read_csv()默认文件中的数据都是以逗号分隔,当需要人为指定分隔符时,采用sep = ’ 符号’形式。
常见的分隔符号包括逗号,空格,制表符(\t)等
同样导出数据时候,如果需要指定分隔符,例如用‘/t’,则指定sep = '\t’参数。 - 指明读取行数。
例如你想了解一下文件中有哪些数据,没有必要数据全部导入,可导入前几行即可。设置nrows参数。
df = pd.read_csv(r'c:\users\desktop\test.csv',sep = '\t',nrows = 3)
- 指定编码格式。
python中使用最多的两种编码格式,UTF-8和GBK,默认编码格式是UTF-8。导入数据时,通过encoding参数设置编码格式。
df = pd.read_csv(r'c:\users\desktop\test.csv',sep = '\t',encoding = 'gbk')
- engine指定。
读取csv文件时,当文件路径或者文件名称中包含中文,导入往往会报错,OSError:Initializing from file failed。可通过设置engine参数来解决。原因是当读取csv文件时候,read_csv()默认使用c语言作为解析语言,需要把默认值c改为python。如果文件格式是CSV UTF-8(逗号分隔)(.csv),那么编码格式也需要跟着变为utf-8-sig,如果文件格式是CSV(逗号分隔)(.csv)格式,对应的编码格式为gbk.
df = pd.read_csv(r'c:\users\desktop\新建文件夹\test.csv',sep = '\t',engine = 'python',encoding = 'utf-8-sig')
- 设置行列索引,指定导入某几列或某列,设定方法与导入.xlsx文件一致。
点击这里查看上一篇博文,读取excel文件
python数据处理系列之读写csv数据相关推荐
- pythoncsv数据怎么读_python如何读写csv数据
本文实例为大家分享了python读写csv数据的具体代码,供大家参考,具体内容如下 案例: 通过股票网站,我们获取了中国股市数据集,它以csv数据格式存储 Data,Open,High,Low,Clo ...
- python应用中调用spark_在python中使用pyspark读写Hive数据操作
1.读Hive表数据 pyspark读取hive数据非常简单,因为它有专门的接口来读取,完全不需要像hbase那样,需要做很多配置,pyspark提供的操作hive的接口,使得程序可以直接使用SQL语 ...
- python数据存储系列教程——python(pandas)读写csv文件
全栈工程师开发手册 (作者:栾鹏) python教程全解 CSV文件的规范 1.使用回车换行(两个字符)作为行分隔符,最后一行数据可以没有这两个字符.2.标题行是否需要,要双方显示约定3.每行记录的字 ...
- 数据分析 从零开始到实战,Pandas读写CSV数据
知识点概要 1.创建一个虚拟python运行环境,专门用于本系列学习: 2.数据分析常用模块pandas安装 3.利用pandas模块读写CSV格式文件 开始动手动脑 1.创建虚拟环境 我平时比较喜欢 ...
- python 数据处理----读取txt 一列数据写入excel 文件
将txt数据从某一行开始写入excel文件中(例子为从Appthroughput写至excel_result1.xlsx中) import sys import random import time ...
- python实战二:使用CSV数据绘制带数据标志的折线图(matplotlib)
背景: 自动获取缺陷管理系统中的bug趋势统计数据,并保存到CSV中,读取CSV数据并绘制带数据标志的折线图,并保存为png图片 下面代码仅实现"读取CSV数据并绘制带数据标志的折线图,并保 ...
- Python数据分析之Pandas读写外部数据文件
点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 阅读目录 1 引言 2 文本文件(txt.csv) 2.1 读取数据 2.2 写入数据 ...
- np读取csv文件_pythonpandas读写csv数据
官方介绍:pandas的官方手册:https://pandas.pydata.org/pandas-docs/stable/pandas官方读写数据文档:https://pandas.pydata.o ...
- python必备基础代码-【Python基础系列】常见的数据预处理方法(附代码)
本文简单介绍python中一些常见的数据预处理,包括数据加载.缺失值处理.异常值处理.描述性变量转换为数值型.训练集测试集划分.数据规范化. 1. 加载数据 1.1 数据读取 数据格式有很多,介绍常见 ...
最新文章
- ecmascript_TC39及其对ECMAScript的贡献
- monty python喜剧-Monty Python(蒙提·派森)的成员简介
- 区块链技术应用的关键问题和挑战
- 访问页面要看什么数据包_股市看盘,我们要看什么?
- Bigmart数据集销售预测
- 阿里云 Centos 7 PHP7环境配置 LNMP
- 为什么 HTTPS 比 HTTP 更安全?
- ORCAD 16.6使用说明及技巧
- 【观察】SAP HANA+英特尔傲腾:珠联璧合,所向披靡
- power Designer VBS 脚步 通过 excel 生成实体,不用一个一个的输入。
- 【图神经网络】图神经网络(GNN)学习笔记:图分类
- MYSQL 性能优化 index 函数,隐藏,前缀,hash 索引 使用方法(2)
- dorado弹框方式
- 专业流程拓扑软件IAuto3.1.1用户操作手册——赶紧收藏,功能比processon、visio、draw.io更强大!小巧易用!
- 栈+模拟(大鱼吃小鱼)
- 【[第一次写博客]Uda课程中的P控制器实现说明】
- Silverlight5正式候选版发布附下载地址(Silverlight 5.0 RC)
- HTTP请求报文和HTTP响应报文
- Discuz论坛贴内个人信息美化
- 【CH559L单片机】PWM功能和示例介绍