Python 教程之 Pandas(14)—— 使用 Pandas 进行数据分析
Pandas是最流行的用于数据分析的 Python 库。它提供高度优化的性能,后端源代码完全用C或Python编写。
我们可以通过以下方式分析 pandas 中的数据:1.Series
2.数据帧
Series:
Series 是 pandas 中定义的一维(1-D)数组,可用于存储任何数据类型。
代码 #1:创建 Series
# 创建 Series 的程序# 导入 Panda 库
import pandas as pd# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)
在这里,数据可以是:
- 一个标量值,可以是 integerValue、字符串
- 可以是键值对的Python 字典
- 一个Ndarray
注意:默认情况下,索引从 0、1、2、...(n-1) 开始,其中 n 是数据长度。
代码 #2:当 Data 包含标量值时
# 使用标量值创建 Series 的程序# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]# 使用默认索引值创建系列
s = pd.Series(Data) # 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)
输出:
具有默认索引的标量数据
带索引的标量数据
代码#3:当数据包含字典时
# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}# 创建字典类型 Series
sd = pd.Series(dictionary)
输出:
字典类型数据
代码 #4:当 Data 包含 Ndarray
# 创建 ndarray series 的程序# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]# 创建一系列二维数组
snd = pd.Series(Data)
输出:
数据作为 Ndarray
数据框:
DataFrames是 pandas 中定义的二维(2-D)数据结构,由行和列组成。
代码 #1:创建 DataFrame
# 创建 DataFrame 的程序# 导入库
import pandas as pd# 使用数据创建 DataFrame
a = pd.DataFrame(Data)
在这里,数据可以是:
- 一本或多本词典
- 一个或多个Series
- 2D-numpy Ndarray
代码 #2:当数据是字典时
# 使用两个字典创建数据框的程序# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}# 创建数据框
df = pd.DataFrame(Data)
输出:
带有两个字典的 DataFrame
代码 #3:当数据是Series时
# 创建三个系列的Dataframe的程序
import pandas as pd# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e']) # 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}# 创建 DataFrame
dfseries = pd.DataFrame(Data)
输出:
三个 Series 的 DataFrame
代码 #4:当 Data 为 2D-numpy ndarray
注意:在创建 2D 数组的 DataFrame 时必须保持一个约束 - 2D 数组的维度必须相同。
# 从二维数组创建 DataFrame 的程序# 导入库
import pandas as pd# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]# 定义 Data
Data ={'first': d1, 'second': d2}# 创建 DataFrame
df2d = pd.DataFrame(Data)
输出:
带有 2d ndarray 的 DataFrame
Python 教程之 Pandas(14)—— 使用 Pandas 进行数据分析相关推荐
- 莫烦Python教程之Pandas教程
''' Day 2 ''''''1.错误处理''' # try: # file = open('eeee.txt','r+') #以只读的形式打开一个文件'eeee',不能'r',要用'r+'---' ...
- Python 教程之 Pandas(10)—— 访问 series 的元素
Pandas series 是一个一维标记数组,能够保存任何类型的数据(整数.字符串.浮点数.python 对象等).轴标签统称为索引.Pandas 系列只不过是 Excel 工作表中的一列.标签不必 ...
- 看不懂简明python教程_简明python教程之Python文件头注释的含义,你肯定不懂
https://www.xin3721.com/eschool/pythonxin3721/ 本文档描述了Python语言文件头里典型注释的含义. 1. 指定解释器 不管在linux还是在window ...
- 廖雪峰python教程之python基础
Python是一种计算机编程语言.计算机编程语言和我们日常使用的自然语言有所不同,最大的区别就是,自然语言在不同的语境下有不同的理解,而计算机要根据编程语言执行任务,就必须保证编程语言写出的程序决不能 ...
- Python 教程之 Numpy(4)—— 数据类型对象
每个 ndarray 都有一个关联的数据类型 (dtype) 对象.这个数据类型对象(dtype)告诉我们数组的布局.这意味着它为我们提供了以下信息: 数据类型(整数.浮点数.Python 对象等) ...
- Python教程之udp和tcp协议介绍
UDP介绍 UDP - 用户数据报协议,是一个无连接的简单的面向数据报的运输层协议.UDP不提供可靠性,它只是把应用程序传给IP层的数据报发送出去,但是并不能保证它们能到达目的地.由于UDP在传输数据 ...
- python pymysql cursors_老雷python基础教程之pymysql学习及DB类的实现
老雷python教程之pymysql学习及DB类的实现 CREATE TABLE `sky_guest` ( `id` int(11) NOT NULL AUTO_INCREMENT, `title` ...
- python代码优化指南_扣丁学堂Python视频教程之Pandas初学者代码优化指南
扣丁学堂Python视频教程之Pandas初学者代码优化指南 2018-02-05 10:44:24 1320浏览 今天扣丁学堂给大家介绍一下关于Python视频教程之Pandas详解,首先Panda ...
- 14个pandas神操作,手把手教你写代码
点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 今 日 鸡 汤 多情只有春庭月,犹为离人照落花 「数仓宝贝库」,带你学数据! 导读: ...
最新文章
- centos下mysql常用的三种备份方法_centos下mysql自动备份(全量)
- 【LeetCode OJ】Remove Duplicates from Sorted List
- Linux 中文件管理常用的工具
- EOS 共识机制 (5)超级节点投票
- unity3d显示c4d材质_C4D小白最常踩的9个坑,看看你中招了没?
- POJ 1185 炮兵阵地 状压dp
- DOM结点的渲染(attach)
- php请求脚本,同时请求PHP脚本
- 程序员获取编程灵感的10 种方式
- 如何添加数据到session中
- [Android] websocket客户端开发
- 深度 | 数据仓库分层存储技术揭秘
- Windows环境配置Apache+Mysql+PHP
- linux svn with ad,svn+apache+AD域
- 蓝桥杯 PREV-3 历届试题 带分数 Java版
- 物联网工程课程设计论文
- solidworks中皮带同步轮配合如何做?几张图教会你
- STM32串口通信DMA方式
- java实现的身份证照片脸部识别(头像截图) 以及OCR字体识别
- 用C++计算圆周长和面积