python数据分析之pandas里的Series
1 Series
线性的数据结构,series是一个一维数组
Pandas会默认用0到-1来作为series的index,但也可以自己指定index(可以把index理解为dict里面的key)
1.1 创造一个series数据
import pandas as pd
import numpy as nps = pd.Series([9, 'zheng', 'beijing', 128])print(s)
- 打印
0 9
1 zheng
2 beijing
3 128
dtype: object
- 访问其中某个数据
print(s[1:2])
# 打印
1 zheng
dtype: object
1.2 指定index
import pandas as pd
import numpy as nps = pd.Series([9, 'zheng', 'beijing', 128, 'usa', 990], index=[1,2,3,'e','f','g'])print(s)
- 打印
1 9
2 zheng
3 beijing
e 128
f usa
g 990
dtype: object
- 根据索引值找出值
print(s['f']) # usa
1.3 用dictionary构造一个series
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "car": None}sa = pd.Series(s, name="age")print(sa)
- 打印
car NaN
jack 19.0
mary 18.0
ton 20.0
Name: age, dtype: float64
- 检测类型
print(type(sa)) # <class 'pandas.core.series.Series'>
1.4 用numpy ndarray构造一个Series
- 生成一个随机数
import pandas as pd
import numpy as npnum_abc = pd.Series(np.random.randn(5), index=list('abcde'))
num = pd.Series(np.random.randn(5))print(num)
print(num_abc)# 打印
0 -0.102860
1 -1.138242
2 1.408063
3 -0.893559
4 1.378845
dtype: float64
a -0.658398
b 1.568236
c 0.535451
d 0.103117
e -1.556231
dtype: float64
1.5 选择数据
import pandas as pd
import numpy as nps = pd.Series([9, 'zheng', 'beijing', 128, 'usa', 990], index[1,2,3,'e', 'f', 'g'])print(s[1:3]) # 选择第1到3个,包左不包右 zhehg beijing
print(s[[1,3]]) # 选择第1个和第3个,zheng 128
print(s[:-1]) #选择第1个到倒数第1个, 9 zheng beijing 128 usa
1.6 操作数据
import pandas as pd
import numpy as nps = pd.Series([9, 'zheng', 'beijing', 128, 'usa', 990], index=[1,2,3,'e','f','g'])sum = s[1:3] + s[1:3]
sum1 = s[1:4] + s[1:4]
sum2 = s[1:3] + s[1:4]
sum3 = s[:3] + s[1:]print(sum)
print(sum1)
print(sum2)
print(sum3)
- 打印
2 zhengzheng
3 beijingbeijing
dtype: object
2 zhengzheng
3 beijingbeijing
e 256
dtype: object
2 zhengzheng
3 beijingbeijing
e NaN
dtype: object
1 NaN
2 zhengzheng
3 beijingbeijing
e NaN
f NaN
g NaN
dtype: object
1.7 查找
- 是否存在
USA in s # true
- 范围查找
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "jim": 22, "lj": 24, "car": None}sa = pd.Series(s, name="age")print(sa[sa>19])
- 中位数
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "jim": 22, "lj": 24, "car": None}sa = pd.Series(s, name="age")print(sa.median()) # 20
- 判断是否大于中位数
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "jim": 22, "lj": 24, "car": None}sa = pd.Series(s, name="age")print(sa>sa.median())
找出大于中位数的数
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "jim": 22, "lj": 24, "car": None}sa = pd.Series(s, name="age")print(sa[sa > sa.median()])
- 中位数
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "jim": 22, "lj": 24, "car": None}sa = pd.Series(s, name="age")more_than_midian = sa>sa.median()print(more_than_midian)print('---------------------')print(sa[more_than_midian])
1.8 Series赋值
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "jim": 22, "lj": 24, "car": None}sa = pd.Series(s, name="age")print(s)print('-----------------')sa['ton'] = 99print(sa)
1.9 满足条件的统一赋值
import pandas as pd
import numpy as nps = {"ton": 20, "mary": 18, "jack": 19, "jim": 22, "lj": 24, "car": None}sa = pd.Series(s, name="age")print(s) # 打印原字典print('---------------') # 分割线sa[sa>19] = 88 # 将所有大于19的统一改为88print(sa) #打印更改之后的数据print('-------------------') # 分割线print(sa / 2) # 将所有数据除以2
python数据分析之pandas里的Series相关推荐
- Python数据分析之Pandas库
Python数据分析之Pandas库 一.Pandas简介 二.Pandas库的安装 三.Pandas的数据结构 四.Series 和 DataFrame 数据结构的使用 五.其他可以参考的网站 一. ...
- python常用命令汇总-python数据分析之pandas常用命令整理
原标题:python数据分析之pandas常用命令整理 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型 ,提供了高效地 ...
- python 数据分析day4 Pandas 之 DataFrame
DataFrame 一. 创建DataFrame 1. 二维数组创建 2. 字典创建 3. JSON创建 4. 读取Excel或CSV文件创建 5. 读数据库(MySQL)创建 二. 常用属性 三. ...
- (转载)Python数据分析之pandas学习
转载地址:http://www.cnblogs.com/nxld/p/6058591.html Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容: 1.数据 ...
- python 数据分析核心--pandas
前言 Python作为一门数据可视化很好的语言,可以使用像matplotlib等库画出图形,处理数据主要使用pandas 这里主要讨论Pandas 初识pandas 大多数人只要提及pandas,基本 ...
- Python数据分析之pandas学习
Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容: 1.数据结构简介:DataFrame和Series 2.数据索引index 3.利用pandas查询数据 ...
- pandas 更改单元格的值_懂Excel轻松入门Python数据分析包pandas(二十四):连续区域...
此系列文章收录在公众号中:数据大宇宙 > 数据处理 >E-pd 转发本文并私信我"python",即可获得Python资料以及更多系列文章(持续更新的) 经常听别人说 ...
- python数据分析之pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]
1 引言 Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用.本文主要介绍Pandas的几种数据选取的方法. Pandas中,数据主要保存为Dataframe和Se ...
- python数据分析(三)——pandas缺失值处理
系列文章目录: python数据分析(一)--series和读取外部数据 python数据分析(二)--DataFrame 缺失值处理 一.数据缺失 一.数据缺失 数据缺失通常有两种情况: 一种就是空 ...
最新文章
- android 怎么换行,android textview 怎么换行?
- typescript 怎么表示当前时间减一个月_TypeScript类型元编程:实现8位数的算术运算...
- 编写一个程序,将d:\java目录下的所有.java文件复制到d:\jad目录下,并将原来文件的扩展名从.java改为.jad
- ssl1341-最小路径覆盖【最大匹配,最小路径覆盖,图论】
- php中for循环流程图,PHP for循环
- 《程序员面试金典》解题目录(更新完毕)
- python telnet登录发送命令_Telnet发送命令,然后读取响应
- Android Studio导入project和module的方法
- iOS 系统爆 Bug!
- 如何将zlib,gzip和zip相关联?它们有什么共同之处,它们有何不同?
- 微信公众号正式号网络授权域名操作
- html入门怎么换字体颜色,html怎么改字体颜色
- 量化投资学习-7:图解股市的基本面、技术面、市场环境面的关系
- 计算机毕业设计-基于VUE+SpringBoot+MyBatis+MySQL的学生作业管理系统
- html5课程总结500字,考试后的反思500字(精选10篇)
- 学会做笔记-子弹笔记学习概要四
- Python中字典的应用及相关操作!
- linux+agent卸载_Symantec Backup Exec 2012 Agent for Linux 卸载 - 潇湘隐者
- ArcGIS中将一个shp图层批量分割成单个的shp;shp批量转geojson
- oracle dba 连不上,Oracle 10g的DBA无法登录解决方案