Pandas系列(三)新增数据列

文章目录

数据处理
直接赋值
apply
assign
分条件赋值

Pandas新增数据列方法主要有直接赋值、apply、assign、分条件赋值这四种方法：

数据处理

在进行数据分析时，经常需要按照一定条件创建新的数据列，然后进行进一步分析。拿到数据之后先做一些简单的处理：

# 替换掉温度的后缀℃
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')

直接赋值

比如计算两列的差值(计算温差)：

# 注意，df["bWendu"]其实是一个Series，后面的减法返回的是Series
df.loc[:, "wencha"] = df["bWendu"] - df["yWendu"]

apply

df.apply方法是对某个轴应用了一个函数，传给这个对象是一个Series，这个Series的index要么是DataFrame的index(axis=0)，要么是DataFrame的columns(axis=1)。

实例：添加一列温度类型：如果最高温度大于33度就是高温；低于-10度是低温；否则是常温。

使用.value_counts()查看温度类型的计数：

assign

实例：将温度从摄氏度变成华氏度：

# 可以同时添加多个新的列
df.assign(yWendu_huashi = lambda x : x["yWendu"] * 9 / 5 + 32,# 摄氏度转华氏度bWendu_huashi = lambda x : x["bWendu"] * 9 / 5 + 32
)

分条件赋值

按条件先选择数据，然后对这部分数据赋值新列。

实例：高低温差大于10度，则认为温差大。

上例中df['wencha_type'] = ''用到了Python中的广播机制。

Pandas系列(三)新增数据列相关推荐

pandas基于dataframe字符串数据列不包含特定字符串来筛选dataframe中的数据行（rows where values do not contain substring）
pandas基于dataframe字符串数据列不包含(not contains)特定字符串来筛选dataframe中的数据行(rows where values do not contain subs ...
pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold
pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(split dataframe based on column value threshol ...
pandas基于dataframe字符串数据列包含（contains）特定字符串来筛选dataframe中的数据行（rows where values contain substring）
pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring) 目录
pandas将dataframe日期数据列的日期转化为日期当月第一天（每月1号）的日期并生成新的数据列(Setting date to beginning of month in dataframe)
pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe) ...
pandas对dataframe的数据列进行随机抽样（Random Sample of Columns）、使用sample函数进行数据列随机抽样
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样目录
pandas对dataframe的数据列进行随机抽样（Random Sample of Columns）：使用sample函数进行数据列随机抽样（有放回的随机抽样，replacement）
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录
pandas把dataframe的数据列转化为索引列实战：单列转化为索引、多列转化为复合索引
pandas把dataframe的数据列转化为索引列实战:单列转化为索引.多列转化为复合索引目录
pandas新字段（数据列）生成、使用np.where或者apply lambda函数结合if else生成新的字段，详解及实战
pandas新字段(数据列)生成.使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战 pandas apply用法: pandas apply方法的作用原理 ...
学习ASP.NET Core Razor 编程系列三——创建数据表及创建项目基本页面
原文:学习ASP.NET Core Razor 编程系列三--创建数据表及创建项目基本页面学习ASP.NET Core Razor 编程系列目录学习ASP.NET Core Razor 编程系列一 ...
Pandas系列(三)：数据清洗
Pandas系列目录文章目录一. 简介二. 思维导图三. Pandas数据清洗 1. 空值.缺失值处理 1.1 空值.缺失值判断 1.2 空值处理 2. 异常数据替换 2.1 条件替换 2.2 ...