Python数据分析之Pandas库
Python数据分析之Pandas库
- 一、Pandas简介
- 二、Pandas库的安装
- 三、Pandas的数据结构
- 四、Series 和 DataFrame 数据结构的使用
- 五、其他可以参考的网站
一、Pandas简介
Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发团队继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。
pandas 是基于NumPy 的,pandas工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
二、Pandas库的安装
pandas 是第三方库,需要单独安装才能使用, 推荐pip安装
pip install pandas
一般情况下,我们会像下面这样引入 pandas 模块:
import pandas as pd
将 pandas 简写成 pd 几乎成了一种不成文的规定。因此,只要你看到 pd 就应该联想到这是 pandas。
三、Pandas的数据结构
Series:
一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boolean值、数字等都能保存在Series中。Time- Series:
以时间为索引的Series。DataFrame:
二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。Panel :
三维的数组,可以理解为DataFrame的容器。Panel4D:
是像Panel一样的4维数据容器。PanelND:
拥有factory集合,可以创建像Panel4D一样N维命名容器的模块。
四、Series 和 DataFrame 数据结构的使用
要使用 pandas,你首先得熟悉它的两个主要数据结构:Series(一维数据)与DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。
关于Series(一维数据)与DataFrame(二维数据)的使用范例,可以参考一下这篇文章,总结的比较详细:
Series与DataFrame的用法
五、其他可以参考的网站
Pandas官网: https://pandas.pydata.org/
Pandas中文网: https://www.pypandas.cn/
Pandas github: https://github.com/pandas-dev/pandas
Python数据分析之Pandas库相关推荐
- Python数据分析~Pandas库30分钟快速入门
目录 1 Pandas序列和数据表 2 Pandas数据聚合与分组运算 3 Pandas数据可视化 Pandas库在数据分析中是非常重要和常用的库,它利用数据框让数据的处理和操作变的简单和快捷.在数 ...
- Python数据分析之pandas库的使用详解
本篇文章所依据是蚂蚁学Python作者讲解所写,且已征求作者的同意,内容基本都是视频中所讲的内容.视频满满的全是干货,也可一边看视频一边配合着本篇文章. 作者的公众号:蚂蚁学Python 作者也提供了 ...
- python常用命令汇总-python数据分析之pandas常用命令整理
原标题:python数据分析之pandas常用命令整理 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型 ,提供了高效地 ...
- python 数据分析day4 Pandas 之 DataFrame
DataFrame 一. 创建DataFrame 1. 二维数组创建 2. 字典创建 3. JSON创建 4. 读取Excel或CSV文件创建 5. 读数据库(MySQL)创建 二. 常用属性 三. ...
- 四、Python数据挖掘(Pandas库)
四.Python数据挖掘(Pandas库) 目录: 四.Python数据挖掘(Pandas库) 一.Pandas 简介 二.Pandas 三大结构之--DataFrame 1.DataFrame 的创 ...
- Python强大的Pandas库—数据艺术家
Python强大的Pandas库-数据艺术家 日期:2021/4/21 作者:就叫易易好了 pandas是Python中的一个库,是一个强大的分析结构化数据集. pandas中的常见的数据结构有两种: ...
- python中不能使用索引运算的是_Python数据分析之Pandas库(笔记)
Pandas数据结构 pandas有两个基本的数据结构:Series和DataFrame. 1.1 创建Series数据 需要引入pandas模块:import pandas as pd 需要引入Se ...
- python中的pandas库_数据分析中 pandas 库的基本用法详解
上篇分享了数据分析用到的一个库:Numpy 库,今天分享一个比 Numpy 更高效的库:pandas,它可以对数据进行导入.清洗.处理.统计和输出.pandas 是基于 Numpy 库的,可以说,pa ...
- pandas 排序 给excel_懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组...
此系列文章收录在公众号中:数据大宇宙 > 数据处理 >E-pd 转发本文并私信我"python",即可获得Python资料以及更多系列文章(持续更新的) 经常听别人说 ...
最新文章
- JVM学习--(一)基本原理
- 多人开源博客系统再搜集
- POI Excel 如何插入新的行?
- puppet结构图一例
- i2c--ioctl--主机控制器驱动(i2c_adapter)--外设驱动(i2c_driver)
- CentOs基础操作指令(运行级别)
- Spring Boot基础学习笔记25:RabbitMQ - 发布/订阅工作模式
- 使用SQL SSIS和BIML自动化Salesforce数据复制
- 万维网文档在服务器端动态,信息网络应用基础作业2.docx
- 在Vue项目中使用Echarts的一种方式
- C语言:有N个数从小到大的顺序存放在一个数组中,输入一个数,要求用折半查找法找出该数是数组中第几个数。如果不在数组中,打印“not found”。
- vim 命令整理(自己常用)
- 软考论文案例-论微服务架构及其应用
- 如何快速去除PDF的密码和限制:遇到PDF被加密,不能复制、编辑,怎么办?教大家一个又快又好用的方法、实用。
- 洛谷P5706 【深基2.例8】再分肥宅水__C++描述
- EffectiveC++-条款54:让自己熟悉包括TR1在内的标准程序库
- C语言关闭终端回显【转】
- C#对接银行接口总结
- 金蝶EAS开发认证考试
- EASYOPS系列|谨慎!勿让持续交付变成bug自动化发布