Pandas系列(三)新增数据列
文章目录
- 数据处理
- 直接赋值
- apply
- assign
- 分条件赋值
Pandas
新增数据列方法主要有直接赋值、apply
、assign
、分条件赋值这四种方法:
数据处理
在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。拿到数据之后先做一些简单的处理:
# 替换掉温度的后缀℃
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')
直接赋值
比如计算两列的差值(计算温差):
# 注意,df["bWendu"]其实是一个Series,后面的减法返回的是Series
df.loc[:, "wencha"] = df["bWendu"] - df["yWendu"]
apply
df.apply
方法是对某个轴应用了一个函数,传给这个对象是一个Series
,这个Series
的index
要么是DataFrame
的index
(axis=0),要么是DataFrame
的columns
(axis=1)。
实例:添加一列温度类型:如果最高温度大于33
度就是高温;低于-10
度是低温;否则是常温。
使用.value_counts()
查看温度类型的计数:
assign
实例:将温度从摄氏度变成华氏度:
# 可以同时添加多个新的列
df.assign(yWendu_huashi = lambda x : x["yWendu"] * 9 / 5 + 32,# 摄氏度转华氏度bWendu_huashi = lambda x : x["bWendu"] * 9 / 5 + 32
)
分条件赋值
按条件先选择数据,然后对这部分数据赋值新列。
实例:高低温差大于10
度,则认为温差大。
上例中df['wencha_type'] = ''
用到了Python
中的广播机制。
Pandas系列(三)新增数据列相关推荐
- pandas基于dataframe字符串数据列不包含特定字符串来筛选dataframe中的数据行(rows where values do not contain substring)
pandas基于dataframe字符串数据列不包含(not contains)特定字符串来筛选dataframe中的数据行(rows where values do not contain subs ...
- pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold
pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(split dataframe based on column value threshol ...
- pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring)
pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring) 目录
- pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe)
pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe) ...
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns)、使用sample函数进行数据列随机抽样
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样 目录
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement)
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录
- pandas把dataframe的数据列转化为索引列实战:单列转化为索引、多列转化为复合索引
pandas把dataframe的数据列转化为索引列实战:单列转化为索引.多列转化为复合索引 目录
- pandas新字段(数据列)生成、使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战
pandas新字段(数据列)生成.使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战 pandas apply用法: pandas apply方法的作用原理 ...
- 学习ASP.NET Core Razor 编程系列三——创建数据表及创建项目基本页面
原文:学习ASP.NET Core Razor 编程系列三--创建数据表及创建项目基本页面 学习ASP.NET Core Razor 编程系列目录 学习ASP.NET Core Razor 编程系列一 ...
- Pandas系列(三):数据清洗
Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据清洗 1. 空值.缺失值处理 1.1 空值.缺失值判断 1.2 空值处理 2. 异常数据替换 2.1 条件替换 2.2 ...
最新文章
- 用例设计方法及其覆盖率
- python adb模块_python中adb有什么功能
- ab plc编程软件_三菱PLC原装和高仿怎么区分?仿真和编程软件一样吗?
- 安装 Docker Machine
- barrel-distortion
- VC对话框界面如何调整静态文本字体和大小?(转载)
- iptable 详解
- 跨境电商,独立站和第三方平台孰更具优势?
- python动态爱心代码_python 动态绘制爱心的示例
- 初学者关于贝叶斯纳什均衡各类符号的一点理解
- python公式_python公式大全
- MySQL有几部分_数据库系统有哪几部分组成?
- 曙光LINUX是什么系统,国产操作系统的曙光----深度操作系统Deepin
- APFS 苹果文件格式的小介绍 Apple File System
- YGG 西班牙 subDAO——Ola GG 正式成立
- nlp技能,jieba分词
- 计算机专业海报加文字,PS制作简洁漂亮的文字主题海报 -电脑资料
- 数据处理之文本分词、MMSEG分词工具、斯坦福NLTK分词工具
- python tkinter库引用tkk_Python之tkinter:调用python库的tkinter带你进入GUI世界(二)——Jason niu...
- 初试FitNesse