文章目录

  • pandas的应用
  • 创建Series对象
    • 索引
    • 花式索引
    • 布尔索引
    • Series对象的常用属性
    • describe()方法:
    • value_count()方法
    • unique() 方法
    • 数据处理的方法。isnull()和notnull()
    • dropna()和fillna()分别用来删除空值和填充空值
    • mask()和where()
    • duplicated()和drop_duplicates()
    • apply()和map()
    • 排序和取头部值的方法

pandas的应用

pandas的核心数据类型是Series(数据系列)、DataFrame(数据表/数据框),反别用于处理一维和二维的数据。
还有一个Index类型的子类型,它为Series和Dataframe提供了索引功能

创建Series对象

Series对象用来表示一维数据结构,跟数组非常类似,但是多了一些功能。Series的内部结构包含了两个数组,其中一个用来保存数据,另一个用来保存数据的索引。

还可以使用字典的方式来创建

索引

Series对象也可以进行索引和切片的操作,不同的是Series对象因为内部维护了一个保护索引的数组。除了可以使用整数索引通过位置检索数据外,还可以通过自己设置的检索标签获取相对应的数据。
第一种,通过位置索引,并修改数据

第二种,使用自定义标签

花式索引

花式索引和普通索引的区别最外一层为方括号[ ]

布尔索引

用来判断列表中数值的范围

Series对象的常用属性

# 求和
print(ser2.sum())
# 求均值
print(ser2.mean())
# 求最大
print(ser2.max())
# 求最小
print(ser2.min())
# 计数
print(ser2.count())
# 求标准差
print(ser2.std())
# 求方差
print(ser2.var())
# 求中位数
print(ser2.median())

describe()方法:

describe()方法:可以获得上述所有的描述性统计信息,如方差,标准差,中位数等等

对于某一特定的值,也可以通过索引的方式获得

value_count()方法

如果想要统计每个值重复的次数,可以使用value_counts()方法,这个方法会返回一个Series对象,它的索引就是原来的Series对象中的值,而每个值出现的次数就是返回的Series对象中的数据,在默认情况下会按照出现次数做降序排列。

ser3 = pd.Series(data=['apple', 'banana', 'apple', 'pitaya', 'apple', 'pitaya', 'durian'])
ser3.value_counts()

unique() 方法

如果Series对象有重复的值,我们可以使用unique()方法获得去重之后的Series对象;可以使用nunique()方法统计不重复值的数量

数据处理的方法。isnull()和notnull()

Series对象的isnull()和notnull()方法可以用于空值的判断

dropna()和fillna()分别用来删除空值和填充空值

dropna()和fillna()方法都有一个名为inplace的参数,它的默认值是False,表示删除空值或填充空值不会修改原来的Series对象,而是返回一个新的Series对象来表示删除或填充空值后的数据系列,如果将inplace参数的值修改为True,那么删除或填充空值会就地操作,直接修改原来的Series对象,那么方法的返回值是None。后面我们会接触到的很多方法,包括DataFrame对象的很多方法都会有这个参数,它们的意义跟这里是一样的。

mask()和where()

mask():可以将满足条件的全部替换
where():将不满足条件的替换


duplicated()和drop_duplicates()

duplicated()方法可以帮助找出重复的数据,根据布尔值显示是否重复
drop_duplicates()可以帮助删除重复的数据

apply()和map()

map()可以不通过索引,直接通过内容来进行修改数据


apply()可以将原始值通过一定的计算,得到想要的数组

排序和取头部值的方法

Series对象的sort_index()和sort_values()方法可以用于对索引和数据的排序,排序方法有一个名为ascending的布尔类型参数,该参数用于控制排序的结果是升序还是降序;而名为kind的参数则用来控制排序使用的算法,默认使用了quicksort,也可以选择mergesort或heapsort;如果存在空值,那么可以用na_position参数空值放在最前还是最后,默认是last

sort_values() 按值从小到大排序
sort_values(ascending=False) 按值从大到小

- 取头部
如果要从Series对象中找出元素中最大或最小的“Top-N”,实际上是不需要对所有的值进行排序的,可以使用nlargest()和nsmallest()方法来完成


pandas中Series的使用相关推荐

  1. pythonpandas函数详解_对pandas中Series的map函数详解

    Series的map方法可以接受一个函数或含有映射关系的字典型对象. 使用map是一种实现元素级转换以及其他数据清理工作的便捷方式. (DataFrame中对应的是applymap()函数,当然Dat ...

  2. 【DS with Python】 Pandas中Series DataFrame的结构、创建、查询、修改语法与实例

    文章目录 前言 一.Series结构与应用 1.1 Series的构造 1.2 创建Series 1.2.1 可用于创建Series的类型 1.2.2 三种设置index的方法 1.2.3 Serie ...

  3. Pandas中Series和DataFrame的索引

    在对Series对象和DataFrame对象进行索引的时候要明确这么一个概念:是使用下标进行索引,还是使用关键字进行索引.比如list进行索引的时候使用的是下标,而dict索引的时候使用的是关键字. ...

  4. Pandas 中 Series 和 DataFrame 知识点

    Series Series对象的创建 # pandas 学习 import pandas as pd from pandas import Series,DataFrame import numpy ...

  5. pandas中series一维数组的创建、索引的更改+索引切片和布尔索引+dataframe二维数组的创建、基本属性、索引方法(传统方法和lociloc)、nan操作、排序+案例

    目录 一.为什么要学习pandas? 二.pandas的常用数据类型 1.series--一维的且带标签的数组 (1)创建一维数组 (2)通过列表形式创建的series带标签数组可以改变索引,传入索引 ...

  6. python科学计算笔记(三)pandas中Series和DataFrame练习

    from pandas import Series, DataFrame# Series接收list或dict作为一维数据 #两个属性:values, index #① s1 = Series([4, ...

  7. [转载] pandas中Series数组创建方法

    参考链接: 访问Pandas Series的元素 import numpy as np import pandas as pd ar = np.random.rand(5) # s = pd.Seri ...

  8. pandas中Series的apply函数

    闲来无事 浏览源码 发现了一个特别有意思的函数 Series中的apply()函数 和大多数apply函数一样,这个函数传入的参数也是一个函数,目的是对传入的series的值进行批量的处理,不用我们手 ...

  9. Pandas中Series结构的切片详解以及常用技巧

    Series的切片:(1)Series使用标签切片运算与普通的Python切片运算不同:Series使用标签切片时,其末端是包含的 (2)Series使用Python切片运算即使用位置数值切片,其末端 ...

最新文章

  1. ROS系统 参数的获取和设置
  2. MyEclipse解决Launching xx on MyEclipse Tomcat has encountered a problem
  3. mysql修改密码的注意点
  4. mysql 吧库下的表名都加_mysql数据库表名大小写问题
  5. 软件工程(2018)第三次团队作业
  6. Java-实现图书管理系统
  7. 论文学习13Reconstructing the house from the ad: Structured prediction on real estate classifieds(实体关系抽取)
  8. 英特尔固态盘加速云与大数据应用创新
  9. 慧荣SM2246XT主控的固态硬盘修复开卡不识别怎么短接方法
  10. 51物联卡:物联卡支持5G吗?怎么购买5G物联卡
  11. 基于MATLAB的单相电压型逆变电路,基于MatlabSimulink_的电压型单相全桥逆变电路.doc...
  12. 高性能Web架构设计方案
  13. 用Photoshop将照片卡通化
  14. debian linux 7 安装,Debian 7安装设置教程
  15. linux -unrar解压缩
  16. 老男孩-Python之路,Day2 - Python基础2
  17. 9 款炫酷的 MySQL 可视化管理工具!好用到爆!!
  18. 罚函数 c语言,神题求解............
  19. OpenDaylight-Boron学习笔记: 3 L2Switch模块
  20. leetcode链表之反转链表

热门文章

  1. 计算机辅助翻译入门试题,2020年南京师范大学翻译硕士MTI考研真题及考研参考书.pdf...
  2. CorelDRAW2019版本下载,CorelDRAW最新版新增功能(全)
  3. 2021年江阴各高中高考成绩查询,2021年江阴高考状元名单公布,江阴文理科状元是谁多少分...
  4. ajaxSubmitDemo
  5. 信息处理技术员知识点总结(错题记录)——考试通过,完结撒花
  6. android nfc驱动,移植NFC驱动到android系统
  7. 【2022最新爬虫】JS逆向之采集某某海关进出口信用平台数据
  8. 排班算法 java_【算法】基于优先级的排班算法实现
  9. (易水寒)大一c语言实训小笔记 第一篇(关于自身所缺乏的一些小知识)
  10. 一毕业就被抢光的​高薪专业,竟然是这些!