pandas 读写表格数据

  • 读取 Titanic 乘客数据

pandas提供了read_csv()函数,将存储为csv文件的数据读取到pandas DataFrame中。Pandas支持多种开箱即用的文件格式或数据源(csv, excel, sql, json, parquet,…),每种格式都带有前缀read_*

import pandas as pd titanic = pd.read_csv("data/titanic.csv")
titanic  # 这里只是为了查看加载的数据是否正确
     PassengerId  Survived  Pclass  \
0              1         0       3
1              2         1       1
2              3         1       3
3              4         1       1
4              5         0       3
..           ...       ...     ...
886          887         0       2
887          888         1       1
888          889         0       3
889          890         1       1
890          891         0       3   Name     Sex   Age  SibSp  \
0                              Braund, Mr. Owen Harris    male  22.0      1
1    Cumings, Mrs. John Bradley (Florence Briggs Th...  female  38.0      1
2                               Heikkinen, Miss. Laina  female  26.0      0
3         Futrelle, Mrs. Jacques Heath (Lily May Peel)  female  35.0      1
4                             Allen, Mr. William Henry    male  35.0      0
..                                                 ...     ...   ...    ...
886                              Montvila, Rev. Juozas    male  27.0      0
887                       Graham, Miss. Margaret Edith  female  19.0      0
888           Johnston, Miss. Catherine Helen "Carrie"  female   NaN      1
889                              Behr, Mr. Karl Howell    male  26.0      0
890                                Dooley, Mr. Patrick    male  32.0      0
...
888      2        W./C. 6607  23.4500   NaN        S
889      0            111369  30.0000  C148        C
890      0            370376   7.7500   NaN        Q  [891 rows x 12 columns]
  • 查看前N 个数据
titanic.head(8)

DataFrame.head(8) 查看前 8 行数据,如果要查看最后 8 行数据,则可以用 .tail(8)

  • 查看每一列数据的类型
titanic.dtypes
PassengerId      int64
Survived         int64
Pclass           int64
Name            object
Sex             object
Age            float64
SibSp            int64
Parch            int64
Ticket          object
Fare           float64
Cabin           object
Embarked        object
dtype: object

当需要知道 dtypes 时,不使用括号, dtypesDataFrame 或者 Series 的属性。

  • 将 DataFrame 导出到 excel 中;
titanic.to_excel("titanic.xlsx", sheet_name="passengers", index=False)

read_*函数用于将数据读取到pandas,而to_*方法用于存储数据。to_excel()方法将数据存储为excel文件。在这里的示例中,sheet_name命名为passenger,而不是默认的Sheet1。通过设置index=False,行索引标签不会保存在电子表格中。

  • info()
titanic.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):#   Column       Non-Null Count  Dtype
---  ------       --------------  -----  0   PassengerId  891 non-null    int64  1   Survived     891 non-null    int64  2   Pclass       891 non-null    int64  3   Name         891 non-null    object 4   Sex          891 non-null    object 5   Age          714 non-null    float646   SibSp        891 non-null    int64  7   Parch        891 non-null    int64  8   Ticket       891 non-null    object 9   Fare         891 non-null    float6410  Cabin        204 non-null    object 11  Embarked     889 non-null    object
dtypes: float64(2), int64(5), object(5)
memory usage: 83.7+ KB

【pandas】教程:2-读写表格数据相关推荐

  1. python爬虫表格table_Python基于pandas爬取网页表格数据

    以网页表格为例:https://www.kuaidaili.com/free/ 该网站数据存在table标签,直接用requests,需要结合bs4解析正则/xpath/lxml等,没有几行代码是搞不 ...

  2. 计算机设计表格成绩排名的教程,excel成绩表格数据排名次的教程

    Excel中经常需要使用到排名次的技巧,成绩表格数据具体该如何排名呢?接下来是学习啦小编为大家带来的excel成绩表格数据排名次的教程,供大家参考. excel成绩表格数据排名次教程(一) 步骤1:不 ...

  3. 计算机word表格计算教程F9,Word表格数据计算与域操作

    摘 要:Word是常用的文档编辑软件,用户在平时的工作中,利用它可以进行文字.图片.表格的排版处理等工作,但往往忽略WORD也具有强大的计算功能:Word的表格计算功能在表格项的定义方式.公式的定义方 ...

  4. pandas修改表格数据(整合两张表格)

    import pandas as pd#读取表格数据 df_sheet = pd.read_excel("表1.xlsx", sheet_name="Sheet1&quo ...

  5. 用 Pandas 读写网页中的 HTML 表格数据

    介绍 超文本标记语言(HTML)是用于构建网页的标准标记语言.我们可以使用HTML的<table>标签来呈现表格数据.Pandas 数据分析库提供了read_html()和to_html( ...

  6. pandas读写Excel表格数据

    [高心星出品] 文章目录 前言 一.pandas是什么? 二.使用步骤 1.安装pandas库 2.安装openpyxl库 3.导入pandas库 4.pandas读取表格数据 5.将数据存入表格 总 ...

  7. 【Pandas入门教程】如何读取和写入表格数据

    如何读取和写入表格数据 来源:Pandas官网:https://pandas.pydata.org/docs/getting_started/intro_tutorials/index.html 文章 ...

  8. Python 数据分析三剑客之 Pandas(十):数据读写

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  9. Python数据分析之Pandas读写外部数据文件

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 阅读目录 1 引言 2 文本文件(txt.csv) 2.1 读取数据 2.2 写入数据 ...

最新文章

  1. 如果三国中有5G网,刘关张该这样拜把子!
  2. R函数之:apply(), lapply(), sapply(), tapply()
  3. C语言中 sscanf 的用法
  4. 06_Dart异常处理
  5. 找到 mysql 数据库中的不良索引
  6. 纯ActionScript3.0打造的工作流程编辑器(WorkFlowEdit V1.0Bata1.0)
  7. osgi框架和spring区别_最新100道大厂高频spring面试题附答案
  8. 全新视角洞察租车行业发展趋势
  9. 一键安装lnmp脚本(包括软件版本)
  10. php git server,server.php
  11. OpenGL基础19:法向量与漫反射
  12. [Python] GAMP结果文件批量统计与绘图
  13. 2022年更新正大杯市场调查与分析大赛现场答辩问题总结注意事项和PPT板块资料经验分享
  14. 2012年托福听力真题词汇总结
  15. 在线计算机励志文案,21句让人心动的励志文案,振奋人心,激励满满!
  16. 完全数是由古人创造的一种整数,其因数的和(不包含本身)加起来就是数字本身。例如 6= 1+2+3 28=1+2+4+7+14 因数的和比数字本身大的数称为充沛数,因数和比数字本身大的数称为充沛数,因数
  17. Android4.4蓝牙耳机HFP流程分析-1
  18. GitHub Repo
  19. RK3399-RGA使用
  20. 企业为什么要先上ERP?

热门文章

  1. 黑苹果一些奇怪的事情
  2. 第一章 初识EmguCV
  3. 利用XGBoost特征选择和堆叠集成分类器提高蛋白质-蛋白质相互作用预测精度
  4. 五月集训总结——来自阿光
  5. Verilog训练笔记(2)——数据降速增宽
  6. 第二阶段--团队冲刺--第三天
  7. 【非原创】PHPMywind调用
  8. win10设置任务栏图标长短
  9. FM,FMM,deepFFM模型总结,深度排序模型
  10. 06.实模式进入保护模式