【pandas】教程:2-读写表格数据
pandas 读写表格数据
- 读取 Titanic 乘客数据
pandas
提供了read_csv()
函数,将存储为csv
文件的数据读取到pandas DataFrame
中。Pandas
支持多种开箱即用的文件格式或数据源(csv, excel, sql, json, parquet,…),每种格式都带有前缀read_*
。
import pandas as pd titanic = pd.read_csv("data/titanic.csv")
titanic # 这里只是为了查看加载的数据是否正确
PassengerId Survived Pclass \
0 1 0 3
1 2 1 1
2 3 1 3
3 4 1 1
4 5 0 3
.. ... ... ...
886 887 0 2
887 888 1 1
888 889 0 3
889 890 1 1
890 891 0 3 Name Sex Age SibSp \
0 Braund, Mr. Owen Harris male 22.0 1
1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1
2 Heikkinen, Miss. Laina female 26.0 0
3 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1
4 Allen, Mr. William Henry male 35.0 0
.. ... ... ... ...
886 Montvila, Rev. Juozas male 27.0 0
887 Graham, Miss. Margaret Edith female 19.0 0
888 Johnston, Miss. Catherine Helen "Carrie" female NaN 1
889 Behr, Mr. Karl Howell male 26.0 0
890 Dooley, Mr. Patrick male 32.0 0
...
888 2 W./C. 6607 23.4500 NaN S
889 0 111369 30.0000 C148 C
890 0 370376 7.7500 NaN Q [891 rows x 12 columns]
- 查看前
N
个数据
titanic.head(8)
DataFrame
的.head(8)
查看前 8 行数据,如果要查看最后 8 行数据,则可以用.tail(8)
。
- 查看每一列数据的类型
titanic.dtypes
PassengerId int64
Survived int64
Pclass int64
Name object
Sex object
Age float64
SibSp int64
Parch int64
Ticket object
Fare float64
Cabin object
Embarked object
dtype: object
当需要知道
dtypes
时,不使用括号,dtypes
是DataFrame
或者Series
的属性。
- 将 DataFrame 导出到 excel 中;
titanic.to_excel("titanic.xlsx", sheet_name="passengers", index=False)
read_*
函数用于将数据读取到pandas
,而to_*
方法用于存储数据。to_excel()
方法将数据存储为excel
文件。在这里的示例中,sheet_name
命名为passenger
,而不是默认的Sheet1
。通过设置index=False
,行索引标签不会保存在电子表格中。
- info()
titanic.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):# Column Non-Null Count Dtype
--- ------ -------------- ----- 0 PassengerId 891 non-null int64 1 Survived 891 non-null int64 2 Pclass 891 non-null int64 3 Name 891 non-null object 4 Sex 891 non-null object 5 Age 714 non-null float646 SibSp 891 non-null int64 7 Parch 891 non-null int64 8 Ticket 891 non-null object 9 Fare 891 non-null float6410 Cabin 204 non-null object 11 Embarked 889 non-null object
dtypes: float64(2), int64(5), object(5)
memory usage: 83.7+ KB
【pandas】教程:2-读写表格数据相关推荐
- python爬虫表格table_Python基于pandas爬取网页表格数据
以网页表格为例:https://www.kuaidaili.com/free/ 该网站数据存在table标签,直接用requests,需要结合bs4解析正则/xpath/lxml等,没有几行代码是搞不 ...
- 计算机设计表格成绩排名的教程,excel成绩表格数据排名次的教程
Excel中经常需要使用到排名次的技巧,成绩表格数据具体该如何排名呢?接下来是学习啦小编为大家带来的excel成绩表格数据排名次的教程,供大家参考. excel成绩表格数据排名次教程(一) 步骤1:不 ...
- 计算机word表格计算教程F9,Word表格数据计算与域操作
摘 要:Word是常用的文档编辑软件,用户在平时的工作中,利用它可以进行文字.图片.表格的排版处理等工作,但往往忽略WORD也具有强大的计算功能:Word的表格计算功能在表格项的定义方式.公式的定义方 ...
- pandas修改表格数据(整合两张表格)
import pandas as pd#读取表格数据 df_sheet = pd.read_excel("表1.xlsx", sheet_name="Sheet1&quo ...
- 用 Pandas 读写网页中的 HTML 表格数据
介绍 超文本标记语言(HTML)是用于构建网页的标准标记语言.我们可以使用HTML的<table>标签来呈现表格数据.Pandas 数据分析库提供了read_html()和to_html( ...
- pandas读写Excel表格数据
[高心星出品] 文章目录 前言 一.pandas是什么? 二.使用步骤 1.安装pandas库 2.安装openpyxl库 3.导入pandas库 4.pandas读取表格数据 5.将数据存入表格 总 ...
- 【Pandas入门教程】如何读取和写入表格数据
如何读取和写入表格数据 来源:Pandas官网:https://pandas.pydata.org/docs/getting_started/intro_tutorials/index.html 文章 ...
- Python 数据分析三剑客之 Pandas(十):数据读写
CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...
- Python数据分析之Pandas读写外部数据文件
点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 阅读目录 1 引言 2 文本文件(txt.csv) 2.1 读取数据 2.2 写入数据 ...
最新文章
- 如果三国中有5G网,刘关张该这样拜把子!
- R函数之:apply(), lapply(), sapply(), tapply()
- C语言中 sscanf 的用法
- 06_Dart异常处理
- 找到 mysql 数据库中的不良索引
- 纯ActionScript3.0打造的工作流程编辑器(WorkFlowEdit V1.0Bata1.0)
- osgi框架和spring区别_最新100道大厂高频spring面试题附答案
- 全新视角洞察租车行业发展趋势
- 一键安装lnmp脚本(包括软件版本)
- php git server,server.php
- OpenGL基础19:法向量与漫反射
- [Python] GAMP结果文件批量统计与绘图
- 2022年更新正大杯市场调查与分析大赛现场答辩问题总结注意事项和PPT板块资料经验分享
- 2012年托福听力真题词汇总结
- 在线计算机励志文案,21句让人心动的励志文案,振奋人心,激励满满!
- 完全数是由古人创造的一种整数,其因数的和(不包含本身)加起来就是数字本身。例如 6= 1+2+3 28=1+2+4+7+14 因数的和比数字本身大的数称为充沛数,因数和比数字本身大的数称为充沛数,因数
- Android4.4蓝牙耳机HFP流程分析-1
- GitHub Repo
- RK3399-RGA使用
- 企业为什么要先上ERP?