1、首先,介绍csv格式的文件:

CSV文件是一个纯文本文件,最早用在简单的数据库里,其格式简单,具备很强的开放性,非常容易被导入各种PC表格及数据库,比如Excel表格等。

CSV文件中每行相当于一条记录(相当于数据表中的一行),用 “,”(半角逗号)分割每行的不同字段。举例如下:

例:

1, 23, 32,12

2, 44, 12, 56

对应Excel表格,CSV文件中的一行对应Excel的一行,CSV同一行中的半角逗号相当于Excel表格同一行分割不同单元格的竖线。

2、介绍pandas.read_csv()函数。

官方调用形式介绍:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

pandas.read_csv(filepath_or_buffer,sep=',',delimiter=None,header='infer',names=None,index_col=None,usecols=None,squeeze=False,prefix=None,mangle_dupe_cols=True,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skipinitialspace=False,skiprows=None,nrows=None,na_values=None,keep_default_na=True,na_filter=True,verbose=False,skip_blank_lines=True,parse_dates=False,infer_datetime_format=False,keep_date_col=False,date_parser=None,dayfirst=False,iterator=False,chunksize=None,compression='infer',thousands=None,decimal=b'.',lineterminator=None,quotechar='"',quoting=0,escapechar=None,comment=None,encoding=None,dialect=None,tupleize_cols=False,error_bad_lines=True,warn_bad_lines=True,skipfooter=0,skip_footer=0,doublequote=True,delim_whitespace=False,as_recarray=False,compact_ints=False,use_unsigned=False,low_memory=True,buffer_lines=None,memory_map=False,float_precision=None)

参数:

filepath_or_buffer:str,pathlib。str,

pathlib.Path, py._path.local.LocalPath or any object with a read() method (such as a file handle or StringIO)

文件路径或数据缓存地址。

sep:str,

default ‘,’

指定分隔符。如果不指定参数,默认使用逗号分隔。如果分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器,并忽略数据中的逗号。正则表达式例子:'\r\t'。

delimiter:str,

default None

定界符,备选分隔符(如果指定该参数,则sep参数失效)。

header:int

or list of ints, default ‘infer’

指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,否则设置为None。如果明确设定header=0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有多个标题),介于中间的行将被忽略掉(例如本例中的2;本例中的数据1,2,4行将被作为多级标题出现,第3行数据将被丢弃,dataframe的数据从第5行开始。)。注意:如果skip_blank_lines=True

那么header参数忽略注释行和空行,所以header=0表示第一行数据而不是文件的第一行。

names : array-like, default None

用于结果的列名列表,如果数据文件中没有列标题行,就需要执行header=None。默认列表中不能出现重复,除非设定参数mangle_dupe_cols=True。

index_col : int or sequence or False, default None

用作行索引的列编号或者列名,如果给定一个序列则有多个行索引。

如果文件不规则,行尾有分隔符,则可以设定index_col=False 来是的pandas不适用第一列作为行索引。

usecols : array-like, default None

返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。

举例如下:

import pandas as pd

header = ['user_id', 'item_id', 'rating', 'timestamp']

df = pd.read_csv("D:/u.data",sep = '\t',names = header)

参考链接:http://blog..net/u013066730/article/details/58634061

python read_csv函数_Python pandas.read_csv()函数相关推荐

  1. python pandas常用函数_Python pandas常用函数详解

    df.duplicated() 返回各行是否是上一行的重复行 df.drop_duplicates() 删除重复行,如果需要按照列过滤,参数选填['col1', 'col2',-]df.fillna( ...

  2. python 正则 replace函数_python pandas中的str对象的replace函数

    网页链接​mp.weixin.qq.com replace函数本身并不复杂,但由于该函数和正则表达式结合会使其作用更加灵活,该函数的主要作用是根据特定的表达式匹配字符串找到后并按照给定的字符或者函数进 ...

  3. python lamda函数_python 用lambda函数替换for循环的方法

    场景如下: 现在有一个dataframe,其中一列为score,值从0-100, df: score 98 88 37 68 86 33 现在需要增加一列level,给这些分数分类,90分以上为A,6 ...

  4. python编程函数_python编程中函数和参数你必须知道的

    今天我们先聊少一点,就聊聊函数是什么和函数的参数,以及对这两个东西的思考 起源于抽象 在程序员写代码的时候,通常都会提到一个词叫抽象, 很多人都知道在面向对象中,将一个对象抽象为一个类,其实这就是我们 ...

  5. python计算平方用map函数_python的map函数的使用方法详解以及使用案例(处理每个元素的自增、自减、平方等)...

    1.用我们之前学过的求一下平方(只有一个列表) #求平方 num=[1,5,6,2,7,8] a=[]for n innum: a.append(n**2)print(a) C:python35pyt ...

  6. python的高级函数_Python的高级函数

    Python的高级函数 1. map函数 map(func, *itertables) 对itertables中的每个元素使用func,当最短的itertable结束时便停止.map可以传入多个ite ...

  7. python如何自定义函数_python如何自定义函数_后端开发

    c语言特点是什么_后端开发 c语言特点是:1.语言简洁.紧凑,使用方便.灵活:2.运算符丰富:3.数据结构丰富,具有现代化语言的各种数据结构:4.具有结构化的控制语句:5.语法限制不太严度格,程序设计 ...

  8. python中deepcopy函数_Python学习笔记函数之copy()和deepcopy()

    随笔记录方便自己和同路人查阅. #------------------------------------------------我是可耻的分割线--------------------------- ...

  9. python偏函数和高阶函数_Python高阶函数-偏函数

    Python的functools模块提供了很多有用的功能,其中一个就是偏函数(Partial function).要注意,这里的偏函数和数学意义上的偏函数不一样. 在介绍函数参数的时候,我们说过,通过 ...

  10. python调用自己写的函数_python调用自定义函数的实例操作

    在python中,想要调用自定义函数必须先声明,然后才能调用.使用函数时,只要按照函数定义的形式,向函数传递必需的参数,就可以调用函数完成相应的功能或者获得函数返回的处理结果. (1)声明函数 pyt ...

最新文章

  1. 一次gitlab无法使用ssh登录的问题解决
  2. 告别学术论文恐慌!休斯顿大学教授的这个建议,让学术写作更简单
  3. sqlserver执行更新语句失败报错42S22
  4. OPA start up and wait for
  5. 你,的寒假作业写多少了?
  6. UI基础--烟花动画
  7. H3C交换机配置VLAN
  8. 3W咖啡商业计划书模板
  9. python chmod_使Python脚本可执行chmod755?
  10. 砌体的弹性模量计算_砌体弹性模量等参数的取值.doc
  11. 使用pip无法完全卸载autoitlibrary,提示 we cannot accurately determine which files belong to it which would‘解决办法
  12. HDLBits练习——Exams/ece241 2013 q7
  13. Lady General Hua Mu-lan花木兰剧本
  14. 使用python进行异常值(outlier)检测实战:KMeans + PCA + IsolationForest + SVM + EllipticEnvelope
  15. MATLAB定态氢原子波函数可视化
  16. 体验了一次DNS的动态更新功能
  17. el-tree树形结构动态更新数据
  18. 树莓集团旗下产业园正式核名为“数媒大厦”!
  19. 如何比较两个PDF文件的不同?在手机上如何处理?
  20. 西门子伺服分拣机西门子S7-1200 PLC程序,有自己录4平详细讲解项目程序

热门文章

  1. 企业常见10个CRM问题答疑!
  2. Pwn level题目
  3. HTML菜单中有关selected=true和setAttribute(“selected“,“selected“)的异同以及selected设置无法生效的问题解析
  4. [转载] 高校两院院士名单
  5. Vite入门从手写一个乞丐版的Vite开始(下)
  6. 乞丐乞讨:天桥有一个乞丐,每天去遵义路天桥要钱,每天要到的钱都是上一天的两倍。如: 第一天要了 1 块钱 第二天要了 2 块钱 第三天要了 4 块钱 第四天要了 8 块钱 以此类推, 问: 乞丐
  7. 跳步游戏2--返回最小跳步数
  8. 圆梦腾讯之后,我收集整理了这份“2022Java 常见面试真题汇总
  9. C语言入门题库——求数列2/1+3/2+5/3......的和
  10. lookup无序查找_excel无序查询 使用LOOKUP函数实现无序查询