pandas读取文件参数

pd.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]],#文件路径或网址连接sep=',',                          #分隔符,默认为","header='infer',                      #是否包含列头,指定第几行位表头names=None,                         #设置列名称skiprows=None,                       #跳过前几行数据【重点】,跳过不需要的行索引nrows=None,                           #只取前几行数据【重点】na_values=None,                     #将空值填充为NANkeep_default_na=True,                #True将空值填充为NaN,False不填充空值,为空字符串na_filter=True,                      #True将空值填充为NaN,False不填充空值【可以提高读取速率】dtype=None,                     #修改数据类型,dtype={'positionId': str,'companyId':str}usecols=None,                  #根据指定列号读取,读第 1、3、5 列,第一列索引为0,usecols=[0,2,4],#根据列索引名名称获取列数据,例如usecols=['Province/State','Country/Region']index_col=None,                     #指定索引列,默认为None的时候,pandas会自动将第一列作为索引,并额外添加一列.大多数使用index_col=0,直接将第一列作为索引,不额外添加列【重点】na_values=None,                      #将NULL识别为空值,将值识别为空值parse_dates=False,                  #指定某列读取为日期格式delimiter=None, #定界符,备选分隔符(如果指定该参数,则sep参数失效)chunksize=None,         #文件块的大小,每一次读几行,返回一个迭代对象,文件大时使用,读取的每一块用for循环获得【重点】error_bad_lines=True,         #当某行数据有问题,不报错,直接跳过,处理脏数据时使用
)
  • set_option:修改显示设置
pd.set_option()#参数
#pd.set_option是pandas中的参数
pd.set_option('display.max_columns', None)   # 显示所有列
pd.set_option('display.max_columns', 5)  #最多显示5列pd.set_option('display.max_rows', None)# 显示所有行
pd.set_option('display.max_rows', 10)#最多显示10行#显示小数位数
pd.set_option('display.float_format',lambda x: '%.2f'%x) #两位
#显示宽度
pd.set_option('display.width', 100)
pd.set_option('precision', 1)   # 设置显示数值的精度
pd.set_option('display.max_colwidth',10)# 设置每列的最大宽度
pd.set_option('mode.chained_assignment',None)  #忽略警告
pd.set_option('chop_threshold',20)  #设置数值显示条件,小于20,显示0
pd.set_option('display.html.use_mathjax',True) #让dataframe中内容支持Latex显示(需要使用$$包住)
pd.set_option('plotting.backend','plotly') #修改pandas默认绘图引擎为plotly(需要提前安装好plotly)
pd.reset_option('all')  #还原所有option设置pd.reset_option('max_rows')        #还原默认显示的行
pd.reset_option('max_columns')#还原默认显示的列
pd.reset_option('display')  #还原全部显示设置
  • style:基于style个性化设置
data.style.hide_index() #隐藏索引列
data.style.set_precision(2) #将带有小数点的列精度调整为小数点后2位
data.style.set_na_rep('数据缺失') #标记缺失值,将缺失值标记为‘数据缺失’
data.style.highlight_null(null_color='skyblue') #将缺失值背景颜色高亮
data.style.highlight_max() #将 数值格式列的最大值进行高亮
data.style.highlight_min() #将 数值格式列的最小值进行高亮
data.style.highlight_max(color='#F77802').highlight_min(color='#26BE49') #同时高量最大值最小值import seaborn as sns
cm=sns.light_palette('green',as_cmap=True)
data.style.background_gradient(cmap=cm)  #渐变显示数值列,将数值格式的列使用渐变色(绿色)进行显示,以突出趋势data.style.set_properties(subset=['salary'],**{'color':'red'})#修改字体颜色
data.style.set_properties(**{'fontsize':'13px','background-color':'#F8F8FF','text-align':'center'})  #修改背景颜色、对齐方式、字体大小
data.style.bar(subset=['salary'],color='skyblue') #指定列条形图
data.style.format({'createTime':lambda t:t.strftime('%Y年%m月%d日')})#日期格式化
pd.tO_csv(na_rep,                         #填充缺失值index=False,                 #取消索引
)

pandas读取文件参数相关推荐

  1. 成功解决pandas读取文件中不读取第一索引列

    成功解决pandas读取文件中不读取第一索引列 目录 解决问题 解决思路 解决方法 解决问题 解决pandas读取文件中不读取第一索引列 解决思路 pandas输出时会默认增加一列索引列 解决方法 添 ...

  2. Python Pandas读取文件

    Python Pandas读取文件 当使用 Pandas 做数据分析的时,需要读取事先准备好的数据集,这是做数据分析的第一步.Panda 提供了多种读取数据的方法: read_csv() 用于读取文本 ...

  3. Pandas读取文件的OSError: Initializing from file failed错误解决

    pandas读取文件 path = 'D:/GFZQ/GFZQ/project/7_30_test/data/conferences/ST獐岛2016年度业绩说明会.csv'df_data = pd. ...

  4. python pandas读取文件内容_python pandas读取大型文件

    数据处理:pandas处理大型csv文件,使用pandas分块处理大文件 1. 读取限定列 一个 csv文件中,有很多列,而我们只关心其中的某些列是,如果把每行数据都读取出来,在提取信息,显然会增加I ...

  5. pandas读取文件数据、存储详解笔记

    本文是对 <利用Python进行数据分析>中关于数据读取的回顾性总计笔记,包含代码注释等. 目录 pd.read_csv和pd.read_table jsons数据读取 二级制数据读取 读 ...

  6. Python pandas 读取文件——读取具有明显分隔符的数据

    关于这篇博文提到的所有函数都可以在 IO Tools (Text, CSV, HDF5, -) 找到. 首先我们来列举一下 pandas 处理文件的函数1: pd.read_csv(filepath) ...

  7. pandas读取文件

    from  os import walk import pandas as pd dataframe_list = [] #walk会返回3个参数,分别是路径,目录list,文件list,你可以按需修 ...

  8. pandas读取文件——CSV,Excel

    CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本). CSV 是一种通用的.相对简单的文 ...

  9. python pandas读取excel-python pandas 读取文件 写入文件excel

    读取数据 import pandas as pd import collections def readLocationCodeForExcel(): read_file = r"test. ...

最新文章

  1. 微信小程序 文字换行
  2. 记录一些user-agent
  3. dma接收双缓存 stm32_容易被大多数人忽视的STM32串口DMA问题
  4. 包打包和解析过程 unity_解决Unity2018打包,提示 SDK Tools version 0.0.0 < 26.1.1
  5. 未知mysql主机怎么办_Mysql如何巧妙的绕过未知字段名详解
  6. 信息系统项目管理师-第二三章:信息系统项目管理基础与立项管理2
  7. linux的“自动化”
  8. php 处理表单里面的 单双引号
  9. PowerBI 11月更新 数据PPT是否会引领新一轮革命
  10. [Bzoj4182]Shopping(点分治)(树上背包)(单调队列优化多重背包)
  11. java代码中 作用_Java利用开发中代码生成工具的作用
  12. github快速通道
  13. 这回,B站跨年晚会吊打各卫视
  14. 无法在PC上找到,android app 创建的文件 问题.
  15. system()函数
  16. 软件著作权申报中60页标准代码文档的写作经验谈(1)
  17. 连接上局域网打开计算机卡,win7怎么玩局域网游戏,win7怎么玩局域网游戏卡
  18. 使用HBuilderX软件快速搭建Vue项目
  19. 关于三维制作技术软件的调研分析
  20. 如何使用FreeTime将Android或Fire Tablet变成适合儿童使用的设备

热门文章

  1. 软件测试期末复习重点
  2. python将图片生成视频,和空白视频
  3. 23种设计模式模式笔记+易懂案例
  4. java如何创建一个文本框_如何创建绑定到对象的文本框
  5. Win10系统电脑连接打印机的设置方法
  6. less 自适应高度_使用HTML5和Less框架3的自适应Web设计
  7. 神级工具 PrimoCache v4.1(无限试用),电脑磁盘读写速度最高可提升70倍
  8. 用74ls90组成二十四进制计数器_一个厉害的芯片芯片74LS190同步计数器可以做加法也可以做减法...
  9. 人工智能作业 - A*算法程序求解八数码
  10. 转行做美工设计有没有前途?0基础怎么学好美工设计?