Python数据分析之Pandas库

  • 一、Pandas简介
  • 二、Pandas库的安装
  • 三、Pandas的数据结构
  • 四、Series 和 DataFrame 数据结构的使用
  • 五、其他可以参考的网站

一、Pandas简介

Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发团队继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。

pandas 是基于NumPy 的,pandas工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

二、Pandas库的安装

pandas 是第三方库,需要单独安装才能使用, 推荐pip安装

pip install pandas

一般情况下,我们会像下面这样引入 pandas 模块:

import pandas as pd

将 pandas 简写成 pd 几乎成了一种不成文的规定。因此,只要你看到 pd 就应该联想到这是 pandas。

三、Pandas的数据结构

  • Series:
    一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boolean值、数字等都能保存在Series中。

  • Time- Series:
    以时间为索引的Series。

  • DataFrame:
    二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。

  • Panel :
    三维的数组,可以理解为DataFrame的容器。

  • Panel4D:
    是像Panel一样的4维数据容器。

  • PanelND:
    拥有factory集合,可以创建像Panel4D一样N维命名容器的模块。

四、Series 和 DataFrame 数据结构的使用

要使用 pandas,你首先得熟悉它的两个主要数据结构:Series(一维数据)与DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

关于Series(一维数据)与DataFrame(二维数据)的使用范例,可以参考一下这篇文章,总结的比较详细:

Series与DataFrame的用法

五、其他可以参考的网站

Pandas官网: https://pandas.pydata.org/

Pandas中文网: https://www.pypandas.cn/

Pandas github: https://github.com/pandas-dev/pandas

Python数据分析之Pandas库相关推荐

  1. Python数据分析~Pandas库30分钟快速入门

    目录 1  Pandas序列和数据表 2 Pandas数据聚合与分组运算 3 Pandas数据可视化 Pandas库在数据分析中是非常重要和常用的库,它利用数据框让数据的处理和操作变的简单和快捷.在数 ...

  2. Python数据分析之pandas库的使用详解

    本篇文章所依据是蚂蚁学Python作者讲解所写,且已征求作者的同意,内容基本都是视频中所讲的内容.视频满满的全是干货,也可一边看视频一边配合着本篇文章. 作者的公众号:蚂蚁学Python 作者也提供了 ...

  3. python常用命令汇总-python数据分析之pandas常用命令整理

    原标题:python数据分析之pandas常用命令整理 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型 ,提供了高效地 ...

  4. python 数据分析day4 Pandas 之 DataFrame

    DataFrame 一. 创建DataFrame 1. 二维数组创建 2. 字典创建 3. JSON创建 4. 读取Excel或CSV文件创建 5. 读数据库(MySQL)创建 二. 常用属性 三. ...

  5. 四、Python数据挖掘(Pandas库)

    四.Python数据挖掘(Pandas库) 目录: 四.Python数据挖掘(Pandas库) 一.Pandas 简介 二.Pandas 三大结构之--DataFrame 1.DataFrame 的创 ...

  6. Python强大的Pandas库—数据艺术家

    Python强大的Pandas库-数据艺术家 日期:2021/4/21 作者:就叫易易好了 pandas是Python中的一个库,是一个强大的分析结构化数据集. pandas中的常见的数据结构有两种: ...

  7. python中不能使用索引运算的是_Python数据分析之Pandas库(笔记)

    Pandas数据结构 pandas有两个基本的数据结构:Series和DataFrame. 1.1 创建Series数据 需要引入pandas模块:import pandas as pd 需要引入Se ...

  8. python中的pandas库_数据分析中 pandas 库的基本用法详解

    上篇分享了数据分析用到的一个库:Numpy 库,今天分享一个比 Numpy 更高效的库:pandas,它可以对数据进行导入.清洗.处理.统计和输出.pandas 是基于 Numpy 库的,可以说,pa ...

  9. pandas 排序 给excel_懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组...

    此系列文章收录在公众号中:数据大宇宙 > 数据处理 >E-pd 转发本文并私信我"python",即可获得Python资料以及更多系列文章(持续更新的) 经常听别人说 ...

最新文章

  1. JVM学习--(一)基本原理
  2. 多人开源博客系统再搜集
  3. POI Excel 如何插入新的行?
  4. puppet结构图一例
  5. i2c--ioctl--主机控制器驱动(i2c_adapter)--外设驱动(i2c_driver)
  6. CentOs基础操作指令(运行级别)
  7. Spring Boot基础学习笔记25:RabbitMQ - 发布/订阅工作模式
  8. 使用SQL SSIS和BIML自动化Salesforce数据复制
  9. 万维网文档在服务器端动态,信息网络应用基础作业2.docx
  10. 在Vue项目中使用Echarts的一种方式
  11. C语言:有N个数从小到大的顺序存放在一个数组中,输入一个数,要求用折半查找法找出该数是数组中第几个数。如果不在数组中,打印“not found”。
  12. vim 命令整理(自己常用)
  13. 软考论文案例-论微服务架构及其应用
  14. 如何快速去除PDF的密码和限制:遇到PDF被加密,不能复制、编辑,怎么办?教大家一个又快又好用的方法、实用。
  15. 洛谷P5706 【深基2.例8】再分肥宅水__C++描述
  16. EffectiveC++-条款54:让自己熟悉包括TR1在内的标准程序库
  17. C语言关闭终端回显【转】
  18. C#对接银行接口总结
  19. 金蝶EAS开发认证考试
  20. EASYOPS系列|谨慎!勿让持续交付变成bug自动化发布

热门文章

  1. Microsoft Defender 高级威胁防护
  2. python 命名空间和作用域
  3. Jmeter5.x线程组和Sampler基础组件-第一个测试计划
  4. 42岁,王兴的兄弟退休了
  5. c语言预处理命令12个,C语言编译预处理和预处理命令
  6. aj1黑白反转价格_除了倒勾配色AJ1,更有反转配色WHITE MOCHA同步发售
  7. NVl和NVL2的语法使用详解
  8. SSD固态硬盘优化教程
  9. 【云原生 | 19】在单台宿主机上管理Docker容器
  10. 信号与系统——初识到理解(第二章——信号与系统)