pandas map applymap apply方法详解
项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
欢迎大家star,留言,一起学习进步
0 前言
pandas的基本数据结构是Series与DataFrame。在数据处理过程中,对每个元素,或者每行/每列进行操作是尝尽的需求。而在pandas中,就内置了map,applymap,apply方法,可以满足上面的需求。接下来结合实际的例子,看看一些基本/常规/高大上的操作。
1.map方法
map方法在数据处理中属于基本操作,重要性无须多言。map方法一般是对元素进行逐个操作,下面来看看几个例子。
首先明确一点:map方法只能作用再Series上,不能作用在DataFrame上。换句话说,DataFrame没有map方法。
Series中map方法的部分源码如下
def map(self, arg, na_action=None):"""Map values of Series according to input correspondence.Used for substituting each value in a Series with another value,that may be derived from a function, a ``dict`` ora :class:`Series`.Parameters----------arg : function, collections.abc.Mapping subclass or SeriesMapping correspondence.na_action : {None, 'ignore'}, default NoneIf 'ignore', propagate NaN values, without passing them to themapping correspondence.Returns-------SeriesSame index as caller.See Also--------Series.apply : For applying more complex functions on a Series.DataFrame.apply : Apply a function row-/column-wise.DataFrame.applymap : Apply a function elementwise on a whole DataFrame.Notes-----When ``arg`` is a dictionary, values in Series that are not in thedictionary (as keys) are converted to ``NaN``. However, if thedictionary is a ``dict`` subclass that defines ``__missing__`` (i.e.provides a method for default values), then this default is usedrather than ``NaN``.
map方法的主要参数是arg,arg是一个方法或者字典,作用在每个元素上。
看个例子:
import numpy as np
import pandas as pddef test():genders = ["male", "male", "female", "unknown", "female"]levels = ["L1", "L2", "L1", "L1", "L2"]df = pd.DataFrame({"gender": genders, "level": levels})gender_dic = {"male": "男", "female": "女", "unknown": "未知"}print(df)print("\n\n")df["gender"] = df["gender"].map(gender_dic)print(df)
输出如下:
gender level
0 male L1
1 male L2
2 female L1
3 unknown L1
4 female L2gender level
0 男 L1
1 男 L2
2 女 L1
3 未知 L1
4 女 L2
上面的代码,是将gender这一列里的male映射成男,female映射成女,unknown映射成未知。
def test():x = [i for i in range(1, 11)]y = [2*i + 0.5 for i in x]df = pd.DataFrame({'x': x, 'y': y})x2 = df['x']print(x2.map(lambda i: "%.2f" % i))print(x2.map(lambda i: "{:.2f}".format(i)))
0 1.00
1 2.00
2 3.00
3 4.00
4 5.00
5 6.00
6 7.00
7 8.00
8 9.00
9 10.00
Name: x, dtype: object
0 1.00
1 2.00
2 3.00
3 4.00
4 5.00
5 6.00
6 7.00
7 8.00
8 9.00
9 10.00
Name: x, dtype: object
上面的方法,则是将x变成带两位小数的浮点数。
不论是利用字典还是函数进行映射,map方法都是把对应的数据逐个当作参数传入到字典或函数中,得到映射后的值。
2.applymap方法
上面提到,dataframe没有map方法。要对dataframe中的元素实现类似map的功能,可以使用applymap方法。
def t8():x = [i for i in range(1, 11)]y = [2*i + 0.5 for i in x]df = pd.DataFrame({'x': x, 'y': y})print(df)print()print(df.applymap(lambda i: "%.2f" % i))
x y
0 1 2.5
1 2 4.5
2 3 6.5
3 4 8.5
4 5 10.5
5 6 12.5
6 7 14.5
7 8 16.5
8 9 18.5
9 10 20.5x y
0 1.00 2.50
1 2.00 4.50
2 3.00 6.50
3 4.00 8.50
4 5.00 10.50
5 6.00 12.50
6 7.00 14.50
7 8.00 16.50
8 9.00 18.50
9 10.00 20.50
前面的例子,是对x这一列做map操作,将x中的数值变成带两位小数的浮点数。如果我们想将dataframe中的x,y同时变成带两位小数的浮点数,可以使用applymap方法。
3.apply方法
apply方法与map的功能类似,主要区别在于apply能传入功能更为复杂的函数。
def apply(self, func, convert_dtype=True, args=(), **kwds):"""Invoke function on values of Series.Can be ufunc (a NumPy function that applies to the entire Series)or a Python function that only works on single values.Parameters----------func : functionPython function or NumPy ufunc to apply.convert_dtype : bool, default TrueTry to find better dtype for elementwise function results. IfFalse, leave as dtype=object.args : tuplePositional arguments passed to func after the series value.**kwdsAdditional keyword arguments passed to func.Returns-------Series or DataFrameIf func returns a Series object the result will be a DataFrame.See Also--------Series.map: For element-wise operations.Series.agg: Only perform aggregating type operations.Series.transform: Only perform transforming type operations.
我们看一下apply方法的源码,首先方法签名为
def apply(self, func, convert_dtype=True, args=(), **kwds):
与map的源码相比,apply除了可以输入func,还可以以元组的方式输入参数,这样能够输入功能更加复杂的函数。
下面来看几个例子
def square(x):return x**2def test():s = pd.Series([20, 21, 12], index = ['London', 'New York', 'Helsinki'])s1 = s.apply(lambda x: x**2)s2 = s.apply(square)s3 = s.apply(np.log)print(s1)print()print(s2)print()print(s3)
输出为
London 400
New York 441
Helsinki 144
dtype: int64London 400
New York 441
Helsinki 144
dtype: int64London 2.995732
New York 3.044522
Helsinki 2.484907
dtype: float64
上面的用法比较简单,跟map方法是一样的。
再看一个复杂一些的例子
def BMI(series):weight = series['weight']height = series['height'] / 100BMI_Rate = weight / height**2return BMI_Ratedef test():heights = [180, 175, 169, 158, 185]weights = [75, 72, 68, 60, 76]age = [30, 18, 26, 42, 34]df = pd.DataFrame({"height": heights, "weight": weights, "age": age})print(df)print()df['BMI'] = df.apply(BMI, axis=1)print(df)
输出结果为
height weight age
0 180 75 30
1 175 72 18
2 169 68 26
3 158 60 42
4 185 76 34height weight age BMI
0 180 75 30 23.148148
1 175 72 18 23.510204
2 169 68 26 23.808690
3 158 60 42 24.034610
4 185 76 34 22.205990
数据中包括身高体重,然后计算BMI指数=体重/身高的平方。
上面的apply方法在调用的时候,指定了axis=1,就是对每行进行操作。如果不容易的理解的同学可以这么想:axis=1要消除的是列的维度,保留行的维度,所以是对每行的数据进行操作。apply方法在运行时,实际上就是调用BMI方法对每行数据进行操作。
def subtract_custom_value(x, custom_value):return x - custom_valuedef test():s = pd.Series([20, 21, 12], index = ['London', 'New York', 'Helsinki'])print(s)print()s1 = s.apply(subtract_custom_value, args=(5,))print(s1)
输出结果为
London 20
New York 21
Helsinki 12
dtype: int64London 15
New York 16
Helsinki 7
dtype: int64
上面代码运行的时候,就是将每个值减去5,因为要传入参数5,所以map方法此时就无能为力。
4.总结
1.map方法是针对Series的基本操作,dataframe无map方法。
2.dataframe如果要针对每个元素做map操作,可以使用applymap。
3.apply方法更为灵活,可以同时作用于series与dataframe。同时可以以元组的形式传入参数。
pandas map applymap apply方法详解相关推荐
- Js中apply方法详解说明
Js apply 方法 详解 我在一开始看到JavaScript的函数apply和call时,非常的模糊,看也看不懂,最近在网上看到一些文章对apply方法和call的一些示例,总算是看的有点眉目了, ...
- EXT.apply方法详解
EXT.apply EXT.apply方法详解 EXT.apply方法详解 apply的用法: Ext中apply及applyIf方法的应用 apply及applyIf方法都是用于实现把一个对象中的属 ...
- Js apply 方法 详解
Js apply方法详解 我在一开始看到javascript的函数apply和call时,非常的模糊,看也看不懂,最近在网上看到一些文章对apply方法和call的一些示例,总算是看的有点眉目了,在这 ...
- Js apply方法详解
Js apply方法详解 主要解决一下几个问题: apply和call的区别在哪里 什么情况下用apply,什么情况下用call apply的其他巧妙用法(一般在什么情况下可以使用apply) 首先从 ...
- pandas.DataFrame.apply方法详解
1.方法的参数解释 官方解释:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.htm ...
- 深入学习JavaScript: apply 方法 详解
我在一开始看到javascript的函数apply和call时,非常的模糊,看也看不懂,最近在网上看到一些文章对apply方法和call的一些示例,总算是看的有点眉目了,在这里我做如下笔记,希望和大家 ...
- js的parseInt() map(),reduce()方法详解
parseInt(string,radius)接收两个参数, string(必选)如果接受的是'abc',纯字符串,返回NaN,要是'123'会转化为123,要是'abc123'会转化为123,rad ...
- Map的 entrySet() 方法详解及用法
目录 一.Entry.entrySet.keySet 1. Entry 2. entrySet 3. keySet 二.Map遍历方式 一.Entry.entrySet.keySet 1. Entry ...
- Js apply()使用详解
Js apply方法详解 我在一开始看到javascript的函数apply和call时,非常的模糊,看也看不懂,最近在网上看到一些文章对apply方法和call的一些示例,总算是看的有点眉目了,在这 ...
- java 三种将list转换为map的方法详解
这篇文章主要介绍了java 三种将list转换为map的方法详解的相关资料,需要的朋友可以参考下 java 三种将list转换为map的方法详解 在本文中,介绍三种将list转换为map的方法: 1) ...
最新文章
- 据说程序员等电梯的时候都想过调度算法
- java数组循环试题_Java学习关于循环和数组练习题整理
- 十招轻松搞定社会媒体
- 【H3C交换机】cpu各个进程的详细说明
- 何恺明最新工作:简单实用的自监督学习方案MAE,ImageNet-1K 87.8%
- SQL Server远程部署
- 《C++必知必会》读书笔记2
- 判断一个数的二进制形式是否只有一个1,是的话就输出
- 整数的个数(信息学奥赛一本通-T1067)
- Kubernetes Metrics-Server
- 漫谈LiteOS之开发板-GPIO(基于GD32450i-EVAL)
- equalwith java_java中==与equal()方法的区别
- 【Flink】Flink SQL 一个流 输出 2 次
- IMU、INS、DGPS和POS
- 漏洞分析阶段 PTES
- 网站建设教程:企业怎么自己建网站?
- cad编辑节点快捷键是什么_cad进入块编辑快捷键是什么,Auto CAD进入块编辑快捷键是什么?...
- 我的单车游记:向西,向西,到栖霞去(一)
- Deprecated Gradle features were used in this build, making it incompatible with Gradle
- json解析2 - 复杂json解析
热门文章
- Kotlin 1.3带来稳定的协程、合约及其他
- 第五章:Redis pipeline流水线
- Unix编程之size_t、ssize_t
- cacti的安装与配置(一)安装
- JDBC操作数据库的问题总结
- Teradata SQL tips
- VB.NET版+三层实现登陆
- PHP_$_SERVER中QUERY_STRING,REQUEST_URI的用法
- TFS2010物理迁移workspace恢复
- Linux 内存管理之 SLUB分配器(3):Object分配逻辑