np读取csv文件_pandas.read_csv函数参数详解
Pandas.read_csv
Hello大家好,欢迎来到【统计GO】,本公众号内容主要针对数据分析的爱好者,不定期分享一些好用的数据分析工具和机器学习资料,以及一些求职必备技能,帮助大家花更少的时间学更多的知识。
本期为大家推荐的是Python语言中用的最多的一条命令:pandas.raad_csv.小编接下来将一些使用频率比较高的参数逐一解释给大家,对于一些不推荐使用的参数小编将会省略掉。
下一期将会为大家解读如何用Python读取时间型数据。
如果本期内容对您有所帮助,记得及时关注。
pandas.read_csv
1.filepath_or_buffer:设置需要访问的文件的有效路径.
2.sep:str, default ','.
指定读取文件的分隔符.支持自定义分隔符.
3.delimiter:str, default None
定界符.备选分隔符(如果指定该参数,则sep参数失效)
4.
header:str, default None
指定作为整个数据集列名的行.如果数据集中没有列名,则需要设置header=None.对有表头的数据识别第一行作为header.
5.names :array-like, default None
用于结果的列名列表,如果数据文件中没有列标题行,就需要执行header=None。
6.index_col:int or sequence or False, default None
指定数据集中的某1列作为索引(index_col = 1/2).
7.usecols:array-like, default None
指定只读取文件中的某一列数据.例如:只读取前四列,usecols = [0,1,2,3])
8.squeeze:boolean, default False
如果文件值包含一列,则返回一个Series.
pandas.read_csv
9.dtype : Type name or dict of column -> type, default None
每列数据的数据类型。例如 {‘a’: np.float64, ‘b’: np.int32}
10.skiprows : list-like or integer, default None
需要忽略的行数(从文件开始处算起),或需要跳过的行号列表(从0开始)。
11.nrows : int, default None
需要读取的行数(从文件头开始算起)。
12.
na_values: scalar, str, list-like, or dict, default None
一组用于替换NA/NaN的值。如果传参,需要制定特定列的空值。默认'N/A','NA','NULL', 'NaN', 'nan'.
13.keep_default_na : bool, default True
如果指定na_values参数,并且keep_default_na =False,那么默认的NaN将被覆盖,否则添加。
14.na_filter : boolean, default True
是否检查丢失值(空字符串或者是空值)。对于大文件来说数据集中没有空值,设定为False可以提升读取速度。
13.skip_blank_lines : boolean, default True
如果为False,则记为NaN;否跳过。
14.parse_dates : boolean or list of ints or names or list of lists or dict, default False
读取文件时,以时间格式读取某几列。小编下一期会针对时间专门出一期。
boolean. True -> 解析索引
[1, 2, 3] -> 解析1,2,3列的值作为独立的日期列;
[[1, 2]] -> 合并1,2列作为一个日期列使用
{'time': [1, 2]} -> 将1,2列合并,并给合并后的列起名为"time"
15.encoding : str, default None
指定字符集类型,通常指定为'utf-8',支持切换其它格式.
# 一次性读取文件夹中所有CSV数据
import os
import pandas as pd
frame = []
path = (".../COVID-19-master/csse_covid_19_data/csse_covid_19_daily_reports")
for file in os.listdir(path):filepath = path + "/" + file# print(filepath)frame.append(pd.read_csv(filepath,usecols = ["Country/Region","Province/State","Last Update","Confirmed"]))
df = pd.concat(frame,ignore_index = True)
print(df.head(10)
np读取csv文件_pandas.read_csv函数参数详解相关推荐
- ioctl 函数 参数 详解
2019独角兽企业重金招聘Python工程师标准>>> ioctl 函数 参数 详解 2009-04-24 11:55 ioctl函数 本函数影响由fd参数引用的一个打开的文件. # ...
- python统计csv行数_对Python 多线程统计所有csv文件的行数方法详解
如下所示: #统计某文件夹下的所有csv文件的行数(多线程) import threading import csv import os class MyThreadLine(threading.Th ...
- PHP date函数参数详解
PHP date函数参数详解 作者: 字体:[增加 减小] 类型:转载 time()在PHP中是得到一个数字,这个数字表示从1970-01-01到现在共走了多少秒,很奇怪吧 不过这样方便计算, 要找 ...
- java调用js匿名函数参数,js匿名函数作为函数参数详解
由衷的感叹,js真是烦. 学到现在,渐渐理解了什么是:语言都是通用的,没有好不好,只有擅长不擅长. 继承,多态,甚至指针,c能实现,c++,java有,javascript(和java是雷锋和雷峰塔的 ...
- matlab melbankm,Matlab v_melbankm函数参数详解(英文附例)
Matlab v_melbankm函数参数详解(英文附例) 笔者使用的是R2019的matlab,下载了voicebox安装至matlab路径下即可使用.下载voicebox请参看此博客 需要注意的是 ...
- 定义一个没有参数的函数、输出python3次_Python函数参数详解,三天让你掌握python,不再是小白
原标题:Python函数参数详解,三天让你掌握python,不再是小白 引言 随着程序功能的增多,代码量随之增大,此时仍不加区分地把所有功能的实现代码放到一起,将会使得程序的组织结构不清晰,可读性变差 ...
- Matlab mfcc函数参数详解(英文附例)
Matlab mfcc函数参数详解 其实可以直接打开源代码看哈. %MFCC Extract the mfcc, log-energy, delta, and delta-delta of audio ...
- python传入参数加星号_Python 带星号(* 或 **)的函数参数详解
1. 带默认值的参数 在了解带星号(*)的参数之前,先看下带有默认值的参数,函数定义如下: >> def defaultValueArgs(common, defaultStr = &qu ...
- Matlab v_melcepst函数参数详解(英文附例)
Matlab v_melcepst函数参数详解(英文附例) 笔者使用的是R2019的matlab,下载了voicebox安装至matlab路径下即可使用.下载voicebox请参看此博客 需要注意的是 ...
最新文章
- 【golang程序包推荐分享】分享亿点点golang json操作及myJsonMarshal程序包开发的踩坑经历 :)
- 使用 ale.js 制作一个小而美的表格编辑器(3)
- 架构师速成7.2-为什么要学习协议、规范
- 【c语言】用指针变量输出一维数组中的数据
- 解决matplotlib的中文问题
- junit单元测试详解
- 计算机学院支部委员会会议记录,第七周班长支书例会会议记录
- [Windows] PPT插件集,部分支持WPS(提高你的制作效率和页面美观)
- 分享一个奇葩SM2258XT板子(100-H00112581-590)没有CE跳线,只有CE飞线,顺便量产开卡
- mtk 手机低电无法关机,电池容量一直显示1%
- qiankun加载react子应用报错[import-html-entry]: error occurs while executing normal script
- 永远的七日之都服务器维护,永远的7日之都5月23日更新内容 七日之都5.23更新公告...
- 华为机试真题 Java实现【最短木板长度】【100%通过率】【2022.11 Q4 新题】
- 从苏宁电器到卡巴斯基(第二部)第02篇:我在卡巴的日子 II
- python爬取斗鱼主播图片
- QLineEdit限制数字输入范围
- Python将两个列表合并成一个列表
- 为什么科技巨头们纷纷更换 Logo?
- 发那科系统基本参数概述
- 奇妙软件k线技巧及macd教程不一定都对,合理布局才是王道。
热门文章
- how SAP CRM settype structure names are determined
- OData debug - Java client - why my batch request fails
- Leetcode上的解法看不懂?试着用动画的方式去辅助理解
- 在SAP C4C创建销售订单时如何绑定创建者的微信open id
- IPRO_DOCXCC_FILLIN_UUIDTONAME
- Product Long text - children usage
- Error message COM_PRODUCT 503 Data cannot be maintained for set type COM_TA_R3_ID
- 使用report clear appointment的all day flag
- 隐藏SAP CRM WebClient UI personalization 里某个field
- SAP ABAP实用技巧介绍系列之Debug XSLT transformation