【基础】pandas中apply与map的异同
◆ ◆ ◆ ◆ ◆
前言
pandas作为数据处理与分析的利器,它的江湖地位非同小可。在我们数据处理与分析过程中,有时候需要对某一列的每一个值都进行处理,这时候推荐大家使用apply或者map。
但是,二者又有啥区别呢?一起来通过几个小例子学习一下吧。
APPLY
一、直接使用内置函数或者numpy函数
# 数据展示
>>> df
Out[1]:姓名 年龄
0 alan 19
1 black 15
2 cici 23
3 david 22
4 eric 18# 计算字符长度
>>> df['姓名'].apply(len)
Out[2]:
0 4
1 5
2 4
3 5
4 4
Name: 姓名, dtype: int64# 计算平方
>>> df['年龄'].apply(np.square)
Out[3]:
0 361
1 225
2 529
3 484
4 324
Name: 年龄, dtype: int64
二、使用lambda匿名函数
# 根据年龄打标签:是否成年
>>> df['年龄'].apply(lambda x: '已成年' if x>=18 else '未成年')
Out[4]:
0 已成年
1 未成年
2 已成年
3 已成年
4 已成年
Name: 年龄, dtype: object# 修改姓名为首字母大写
>>> df['姓名'].apply(lambda x: x.title())
Out[5]:
0 Alan
1 Black
2 Cici
3 David
4 Eric
Name: 姓名, dtype: object
三、使用def自定义函数
# 自定义函数
def fn(x):if x >=18:return '成年人'else:return '未成年'# 自定义函数作为apply参数
>>> df['年龄'].apply(fn)
Out[6]:
0 成年人
1 未成年
2 成年人
3 成年人
4 成年人
Name: 年龄, dtype: object
需要注意的是,apply不仅可以用于Series,还可用于DataFrame,具体可以根据自己的业务需要,及数据处理规范来使用即可。
MAP
一、直接使用内置函数或者numpy函数
# 计算字符长度
>>> df['姓名'].map(len)
Out[7]:
0 4
1 5
2 4
3 5
4 4
Name: 姓名, dtype: int64# 计算平方
>>> df['年龄'].map(np.square)
Out[8]:
0 361
1 225
2 529
3 484
4 324
Name: 年龄, dtype: int64
二、使用lambda匿名函数
# 根据年龄打标签:是否成年
>>> df['年龄'].map(lambda x: '已成年' if x>=18 else '未成年')
Out[9]:
0 已成年
1 未成年
2 已成年
3 已成年
4 已成年
Name: 年龄, dtype: object# 修改姓名为首字母大写
>>> df['姓名'].map(lambda x: x.title())
Out[10]:
0 Alan
1 Black
2 Cici
3 David
4 Eric
Name: 姓名, dtype: object
三、使用def自定义函数
# 自定义函数作为map参数
>>> df['年龄'].map(fn)
Out[11]:
0 成年人
1 未成年
2 成年人
3 成年人
4 成年人
Name: 年龄, dtype: object
四、使用dict作为map参数
# apply没有这种功能!
>>> df['姓名'].map({'alan':'女','black':'男','cici':'女','david':'男','eric':'男'})
Out[12]:
0 女
1 男
2 女
3 男
4 男
Name: 姓名, dtype: object
通过上面的小例子讲解,我们可以得出以下结论:
(1)map、apply在用于Series时,对每一个值进行处理,两者并没有什么区别。(是否受数据量影响可以自行验证)
(2)apply不仅可以用于Series,还可以用于DataFrame;而map只能用于Series。
(3)一般情况下,apply应用更广泛,尤其是自定义函数带多个参数时,建议使用apply。
往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册AI基础下载(pdf更新到25集)本站qq群1003271085,加入微信群请回复“加群”获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/yFQV7am喜欢文章,点个在看
【基础】pandas中apply与map的异同相关推荐
- 【Python基础】pandas中apply与map的异同
◆ ◆ ◆ ◆ ◆ 前言 pandas作为数据处理与分析的利器,它的江湖地位非同小可.在我们数据处理与分析过程中,有时候需要对某一列的每一个值都进行处理,这时候推荐大家使用apply或者map. 但 ...
- pandas中apply与map的异同
◆ ◆ ◆ ◆ ◆ 前言 pandas作为数据处理与分析的利器,它的江湖地位非同小可.在我们数据处理与分析过程中,有时候需要对某一列的每一个值都进行处理,这时候推荐大家使用apply或者map. 但 ...
- pythonpandas函数详解_对pandas中Series的map函数详解
Series的map方法可以接受一个函数或含有映射关系的字典型对象. 使用map是一种实现元素级转换以及其他数据清理工作的便捷方式. (DataFrame中对应的是applymap()函数,当然Dat ...
- python column stack_Python基础 | pandas中dataframe的整合与形变(merge reshape)
[toc] 本文示例数据下载,密码:vwy3 import pandas as pd # 数据是之前在cnblog上抓取的部分文章信息 df = pd.read_csv('./data/SQL测试用数 ...
- pandas中的函数—— .map()
pandas中函数千千万,这次讲讲 .map() 英文文档链接? pandas.Series.map: Series.map(self, arg, na_action=None) .map() 是 S ...
- Python中apply和map的区别
文章目录 一.apply用法 二.map用法 apply和map的区别 概括: apply:用在dataframe上,用于对row或者column进行计算 applymap :用于dataframe上 ...
- Python函数中apply、map、applymap的区别
一.总结 apply -- 应用在 dataFrame 上,用于对 row 或者 column 进行计算 applymap -- 应用在 dataFrame 上,元素级别的操作 map -- pyth ...
- python pandas筛选数据_Python基础 | pandas中数据的筛选(index subset)
本文数据可在此处下载,密码:vwy3 # 加载数据 import pandas as pd # 数据是之前在cnblog上抓取的部分文章信息 df = pd.read_csv('./data/SQL测 ...
- Pandas中Apply函数加速百倍的技巧
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者 | 杰少 来源 | kaggle竞赛宝典 编辑 | 极市平台 ...
最新文章
- 如何编写Python模块/包?
- html焦点试图代码,HTML DOM focus()用法及代码示例
- BuckleScript 1.0发布,面向OCaml的开源JavaScript编译器
- POJ1178枚举三个地方(所有点都去同一个点)
- 读书笔记_java设计模式深入研究 第八章 状态模式 State
- 基于字典 ,输入季节显示月份(Python)
- 新起点!新征程!微软技术俱乐部(苏州)成立大会暨微软技术交流会
- 旧式计算机英语,旧式的英文怎么说
- Spark Streaming中流式计算的困境与解决之道
- 3d老显示计算机内存不足,3d 出现:应用程序内存不足,将立即关闭。。。 怎么处理...
- mac 字幕生成工具
- 要素过多!精选100个酷炫API助你灵感爆棚
- win10蓝牙已配对连接不上_win10系统下蓝牙耳机连接不上如何解决
- 打乱魔方软件_魔方 打乱步骤生成 算法
- 过程计算机系统 pcs,过程控制系统(PCS)
- 叮咚DsV1.0pj版(去授权)
- 数据版吐槽大会:盘点2018国产综艺节目
- BZOJ4864[BeiJing 2017 Wc]神秘物质——非旋转treap
- 在 Java 中检查空字符串或空白字符串
- IDEA提示“程序包xxx不存在“
热门文章
- 实验1 Windows汇编语言开发环境
- JSONP的诞生、原理及应用实例
- Filter 字符编码Filter 一
- [C++对象模型][9]虚继承与虚函数表
- 多個excel文件合并到一個excel文件
- JavaSE(七)——Scanner类、String类
- esri.views.2d.layers.features.controllers.OnDemandController 记一次ArcGIS Server的问题
- LeetCode每日训练1——爬楼梯问题(2020.7.1)
- linux多线程求和_谈一谈C++中的多线程(上)
- VS 中配置使用Visual SVN系列 五:SVN Client的配置和使用