(转)十分钟入门pandas
本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。
一、 创建对象
可以通过 Data Structure Intro Setion 来查看有关该节内容的详细信息。
1、可以通过传递一个list对象来创建一个Series,pandas会默认创建整型索引:
2、通过传递一个numpy array,时间索引以及列标签来创建一个DataFrame:
3、通过传递一个能够被转换成类似序列结构的字典对象来创建一个DataFrame:
5、如果你使用的是IPython,使用Tab自动补全功能会自动识别所有的属性以及自定义的列,下图中是所有能够被自动识别的属性的一个子集:
二、 查看数据
三、 选择
1、 选择一个单独的列,这将会返回一个Series,等同于df.A:
2、 通过数值进行切片,与numpy/python中的情况类似
3、 通过指定一个位置的列表,与numpy/python中的情况类似
四、 缺失值处理
在pandas中,使用np.nan来代替缺失值,这些值将默认不会包含在计算中,详情请参阅:Missing Data Section。
1、 reindex()方法可以对指定轴上的索引进行改变/增加/删除操作,这将返回原始数据的一个拷贝:、
五、 相关操作
详情请参与 Basic Section On Binary Ops
3、 对于拥有不同维度,需要对齐的对象进行操作。Pandas会自动的沿着指定的维度进行广播:
具体请参照:Histogramming and Discretization
Series对象在其str属性中配备了一组字符串处理方法,可以很容易的应用到数组中的每个元素,如下段代码所示。更多详情请参考:Vectorized String Methods.
六、 合并
Pandas提供了大量的方法能够轻松的对Series,DataFrame和Panel对象进行各种符合各种逻辑关系的合并操作。具体请参阅:Merging section
l Join 类似于SQL类型的合并,具体请参阅:Database style joining
l Append 将一行连接到一个DataFrame上,具体请参阅Appending:
七、 分组
对于”group by”操作,我们通常是指以下一个或多个操作步骤:
八、 Reshaping
详情请参阅 Hierarchical Indexing 和 Reshaping。
九、 时间序列
Pandas在对频率转换进行重新采样时拥有简单、强大且高效的功能(如将按秒采样的数据转换为按5分钟为单位进行采样的数据)。这种操作在金融领域非常常见。具体参考:Time Series section。
4、 时期和时间戳之间的转换使得可以使用一些方便的算术函数。
十、 Categorical
从0.15版本开始,pandas可以在DataFrame中支持Categorical类型的数据,详细 介绍参看:categorical introduction和API documentation。
1、 将原始的grade转换为Categorical数据类型:
2、 将Categorical类型数据重命名为更有意义的名称:
4、 排序是按照Categorical的顺序进行的而不是按照字典顺序进行:
十一、 画图
对于DataFrame来说,plot是一种将所有列及其标签进行绘制的简便方法:
十二、 导入和保存数据
l CSV,参考:Writing to a csv file
转载于:https://www.cnblogs.com/tan-v/p/7707476.html
(转)十分钟入门pandas相关推荐
- linux pandas教程_十分钟入门 Pandas
# 十分钟入门 Pandas 本节是帮助 Pandas 新手快速上手的简介.烹饪指南里介绍了更多实用案例. 本节以下列方式导入 Pandas 与 NumPy: In [1]: import numpy ...
- Python数据分析pandas入门(一)------十分钟入门pandas
Python数据分析基础 一.导入常用库 二.创建对象 三.查看数据 四.选取 五.通过标签选取 六.通过位置选取 七.布尔索引 八.赋值 九.缺失值处理 十.运算与统计 十一.Apply函数的作用 ...
- 十分钟入门Pandas
文章目录 1 创建对象 1.1 Series 1.2 DataFrame 2 查看数据 3 选择 3.1 获取行.列 3.2 设置行.列 4 缺失值 4 操作 4.1 统计 4.2 Apply 4.3 ...
- 【Pandas-1】十分钟入门Pandas (上)
目录 1 创建对象 2 查看数据 3 选择 3.1 获取`[]` 3.2 通过标签选择`loc()` `at()` 3.3 通过位置选择`iloc()` `iat()` 3.4 布尔索引 3.5 赋值 ...
- 10分钟入门Pandas(添加一些个人见解)
pandas十分钟入门(codedog翻译) 原文下载地址:https://download.csdn.net/download/qq_35189715/11392455 github地址:https ...
- “易语言.飞扬”十分钟入门教程(修订版1,update for EF1.1.0)
"易语言.飞扬"十分钟入门教程 (修订版1,update for EF1.1.0) 作者:liigo,2007.8.12 本文地址:http://blog.csdn.net/lii ...
- 自学python编程免费教程-Python十分钟入门 自学python基础教程送你参考
python十分钟入门.简介Python是一种动态解释型的编程语言.Python可以在Windows.UNIX.MAC等多种操作系统上使用,也可以在Java..NET开发平台上使用. 特点 1 Pyt ...
- “易语言.飞扬”十分钟入门教程
"易语言.飞扬"十分钟入门教程 作者:liigo 2007.1.1 原文链接:http://blog.csdn.net/liigo/archive/2007/01/01/14720 ...
- Azure IoT Hub 十分钟入门系列 (2)- 使用模拟设备发送设备到云(d2c)的消息
本文主要分享一个案例: 10分钟- 使用Python 示例代码和SDK向IoT Hub 发送遥测消息 本文主要有如下内容: 了解C2D/D2C消息: 了解IoT Hub中Device的概念 了解并下载 ...
最新文章
- Mac 安装多个版本jdk
- 怎么逐步突破,成为Python高手?
- 今天分享个用Python爬虫爬取Bilibili弹幕的小例子解析
- 远程扫描iPhone相册?苹果的好心网友不领情
- 探索 Java 同步机制[Monitor Object 并发模式在 Java 同步机制中的实现]
- Stanford NLP 解读 ACL 2018 论文——用于调试 NLP 模型的语义等价对立规则
- boost::units::information相关的测试程序
- MySQL 5.7 LOGICAL_CLOCK 并行复制原理及实现分析
- html禁用自动完成,html – 如何禁用所有主流浏览器的自动完成功能
- vim 批量替换字符串_Vim 有什么奇技淫巧?
- OpenGL.Vertex Array Object (VAO).
- 如何使用BootStrapDialog实现数据的添加与删除?
- 怎么查看当前系统jdk版本
- 计算机网络工程毕业论文题目,计算机网络技术专业毕业论文题目(2)
- python如何下载包_怎么在python中下载包
- 人脸识别眨眼张嘴软件_手机端APP活体真活人检测扫描人脸识别SDK之张嘴摇头眨眼点头确认真人非...
- TypeScript 导出 Excel 表格(带斑马纹样式)
- html输入QQ自动获取QQ头像,代码实现WordPress评论框输入QQ号码自动获取QQ头像和昵称...
- Win10小娜搜索空白什么都不显示怎么办,开始菜单,搜索空白
- java-net-php-python-SSM的美工接单系统计算机毕业设计程序