1读写不同数据源的数据

1.1读写文本文件

1.1.1文件读取

文本文件(txt文件)是一种由若干行字符构成的计算机文件,它是一种典型的顺序文件。使用read_table来读取文本文件:

pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)

csv是一种逗号分隔的文件格式,因为其分隔符不一定是逗号,又被称为字符分隔文件,文件以纯文本形式存储表格数据(数字和文本)。使用read_csv函数来读取csv文件:

pandas.read_csv(filepath_or_buffer, sep=’,’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)

read_table和read_csv常用参数及其说明。

  1. read_table和read_csv函数中的sep参数是指定文本的分隔符的,如果分隔符指定错误,在读取数据的时候,每一行数据将连成一片。
  2. header参数是用来指定列名的,如果是None则会添加一个默认的列名。
  3. encoding代表文件的编码格式,常用的编码有utf-8、utf-16、gbk、gb2312、gb18030等。如果编码指定错误数据将无法读取,IPython解释器会报解析错误。
import pandas as pd
data = pd.read_table(r'F:\Desktop\2020.09.21-30广东海洋大学实训\9.23Pandas统计分析基础\meal_order_info.csv', encoding='gbk', sep=',')
info = pd.read_csv(r'F:\Desktop\2020.09.21-30广东海洋大学实训\9.23Pandas统计分析基础\meal_order_info.csv', encoding='gbk')

注:pands.read_table中参数encoding默认的编码是“utf-8”,但meal_order_info.csv文件的编码格式是“gbk”,所以需要进行encoding参数的设置。一般情况下,编码格式不是“utf-8"的话,先试试是不是”gbk“的,不是再接着试utf-16、gb2312、gb18030这几个编码格式。

1.1.2文件存储

文本文件的存储和读取类似,结构化数据可以通过pandas中的to_csv函数实现以csv文件格式存储文件。

DataFrame.to_csv(path_or_buf=None, sep=’,’, na_rep=”, columns=None, header=True, index=True,index_label=None,mode=’w’,encoding=None)

info.to_csv(r'F:\Desktop\2020.09.21-30广东海洋大学实训\9.23Pandas统计分析基础\info.csv', encoding='gbk')

有时候保存出来的数据是乱码的情况,这时就需要设置下encoding这个参数。

1.2读写Excel文件

1.2.1Excel文件读取

pandas提供了read_excel函数来读取“xls”“xlsx”两种Excel文件。

pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)

detail = pd.read_excel(r'F:\Desktop\2020.09.21-30广东海洋大学实训\9.23Pandas统计分析基础\meal_order_detail.xlsx')

1.2.2Excel文件存储

将文件存储为Excel文件,可以使用to_excel方法。其语法格式如下。

DataFrame.to_excel(excel_writer=None, sheet_name=None’, na_rep=”, header=True, index=True, index_label=None, mode=’w’, encoding=None)

to_csv方法的常用参数基本一致,区别之处在于指定存储文件的文件路径参数名称为excel_writer,并且没有sep参数,增加了一个sheet_name参数用来指定存储的Excel sheet的名称,默认为sheet1。

detail.to_excel(r'F:\Desktop\2020.09.21-30广东海洋大学实训\9.23Pandas统计分析基础\detail.xlsx', sheet_name='A')
info.to_excel(r'F:\Desktop\2020.09.21-30广东海洋大学实训\9.23Pandas统计分析基础\detail.xlsx', sheet_name='B') #会覆盖原始数据#将数据保存在一个Excel的多个字表中
with pd.ExcelWriter(r'F:\Desktop\2020.09.21-30广东海洋大学实训\9.23Pandas统计分析基础\detail.xlsx') as w:detail.to_excel(w, sheet_name='A')info.to_excel(w, sheet_name='B')

Python—实训day7下—Pandas统计分析基础相关推荐

  1. Python—实训day7上—Nmupy数值计算基础

    Numpy是用于数据科学计算的基础模块,不但能够完成科学计算的任务,而且能够被用作高效的多维数据容器,可用作存储和处理大型矩阵,它的运算速度会比Python自带的列表运算速度要快.Numpy的数据容器 ...

  2. Python实训day09am【Pandas、Series、DataFrame数据帧】

    Python实训-15天-博客汇总表 目录 1.Pandas 1.1.安装Pandas库 1.2.两种数据对象 2.一列数据Series 2.1.获取Series与数据个数 2.2.切片-loc-il ...

  3. Python—实训day9—使用pandas进行数据预处理

    1合并数据 1.1堆叠合并数据 1.1.1横向堆叠(行对齐,左右拼接) 横向堆叠,即将两个表在X轴向拼接在一起,可以使用concat函数完成,concat函数的基本语法如下. pandas.conca ...

  4. Python实训-15天-博客汇总表

    目录 1.课程安排 1.1.课程介绍 1.2.课程目标 2.课件 2.1.课件and录屏 2.2.练习and案例and作业 3.实训博客笔记 第1周-week1 day01 day02 day03 d ...

  5. 【Python数据分析与可视化】Pandas统计分析-实训

    [Python数据分析与可视化]Pandas统计分析-实训 文章目录 [Python数据分析与可视化]Pandas统计分析-实训 导包 读取数据 分析数据 1.查看数据的描述和统计信息: 2.修改列名 ...

  6. 大学python实训总结-千锋Python实训总结 学好基础才能走的更远

    时间飞逝,不知不觉在千锋学习Python已经一个月了,在这不长不短的一个月时间感觉我以往的生活方式和学习方式完全被改变了,希望我能继续保持这样的求学心态和学习态度.下面这个Python实训总结就是我对 ...

  7. 数据科学与python——Pandas统计分析基础(数据堆叠+数据清洗)

    Pandas统计分析基础数据堆叠+数据清洗 一.合并数据:获取完整的数据集. 1.读取数据 2.将两个csv文件按照mete.csv文件的日期对齐 3.纵向合并数据data1与data2 4.使用dr ...

  8. 数据科学与python语言——Pandas统计分析基础(时间转换+聚合)

    Pandas统计分析基础(时间转换+聚合) 实验要求一 实验二要求 全部代码 实验要求一 #M表的时间戳类型转为datetime data_Mete['TIMESTAMP']=pd.to_dateti ...

  9. Python实训day11pm【大作业简略解析】

    Python实训-15天-博客汇总表 目录 1.课堂笔记 2.群消息 3.代码 3.1.demo1 3.2.demo2 1.课堂笔记 大作业题目思路引导: 题目1:定时爬取每个地级市的实时天气状况.存 ...

最新文章

  1. 如何禁用<textarea>的调整大小抓取器? [重复]
  2. 我非要捅穿这 Neutron(一)网络实现模型篇
  3. LTE voice centric和data centric
  4. 进阶学习(3.4) Builder Pattern 建造者模式
  5. ironpython console是否可以卸载_IronPython的第十块鳞片
  6. Cortex-M3-建立堆栈
  7. leetcode 242. 有效的字母异位词(Java版)
  8. TensorFLow one-hot
  9. 数据库加主键sql_SQL数据库设计:选择主键
  10. 查看Android 系统发送的广播
  11. Html 小插件4 百度搜索代码
  12. a星算法python_Python-加速A星寻路算法
  13. java反射加载类_Java反射 - 动态类加载和重载
  14. git使用笔记(二)分支与合并
  15. android 蓝牙转串口_android蓝牙串口通讯
  16. 电脑/手机怎么查看连接的wifi的密码
  17. win7 此计算机无法连接到家庭组,Win7旗舰版无法进入家庭组如何处理
  18. 【常系数线性递推】51nod1538 一道难题
  19. cad菜单栏快捷键_干货|如何快速将图片转换成CAD文件格式
  20. Facebook Haystack 管理百亿照片

热门文章

  1. 发那科2021参数_三菱发那科常用参数对照
  2. 化验室计算机系统验证风险评估,计算机化系统验证风险评估报告.doc
  3. vue实例没有挂载到html上,VueJS-将数据发送到Vue实例以用于挂载()
  4. 缓慢的http拒绝服务攻击 tomcat_常见的网络攻击类型
  5. 这一大波电子“艺术”图,美翻了!
  6. 国学精典书籍阅读记录
  7. linux开源软件经验,Ubuntu Linux经验汇总
  8. php interbase,PHP: Firebird/InterBase - Manual
  9. vue 定义全局弹框_用vue/react写一个全局提示弹框
  10. freemarker面试_面试请不要再问我Spring ,阿里架构师吐血整理,这是对“Spring家族”最完美的诠释...