dataframe在特定列 插入_DataFrame在任意处添加一列或者多列的方法
很多时候我们需要在任意处添加一列,而非末尾添加一列,下面就介绍一下几种方法
1.df.insert但是这个允许插入一列
DataFrame.insert(loc,column,value,allow_duplicates = False)
参数
loc: int,插入索引。必须验证0 <= loc <= len(columns)
column:str, number, or hashable object,插入列的标签
value:int, Series, or array-like
allow_duplicates:bool, 可选
前面三个是必选,后面的可选
值得注意的是,如果你不知道value的值,可以使用np.nan代替,后续再赋值
data = pd.DataFrame(columns=['a','b'], data=[[1,2],[3,4]])
data.insert(2,'c',value=np.nan)'''a b c
0 1 2 NaN
1 3 4 NaN'''
2.pd.concat,df.reindex和list.insert(index, obj)配合,可以在任意处插入一列或者多列
首先,如果要在df的后面添加一列,只需要data['c']=xx,但是如果你想一次性添加两列级以上,df[['D','E']] == None ,结果报错
所以接下来我想介绍这种认为比较简便的方法:
利用pd.concat 在DataFrame后面添加两列,这种方法的缺点是不能指定位置
pd.concat([df, pd.DataFrame(columns=list('DE'))]),然后利用 reindex来重排和增加列名df.reindex(columns=list('ABCDE')),
当然这里举的例子比较简单,在实际运用中,列名可能都比较长,都敲出来肯定不方便,所以我们需要更强大的方法,运用到 list.insert的方法list.insert(index, obj)
col_name =df.columns.tolist()
col_name.insert(1,'D')
df.reindex(columns=col_name)#或者不用数字索引,直接在某列前面或后面插入,利用 list.index的方法
col_name =df.columns.tolist()
col_name.insert(col_name.index('B'),'D')#在 B 列前面插入
df.reindex(columns=col_name)
col_name=df.columns.tolist()
col_name.insert(col_name.index('B')+1,'D') #在 B 列后面插入
df.reindex(columns=col_name)
这样子就基本能满足所有要求了
dataframe在特定列 插入_DataFrame在任意处添加一列或者多列的方法相关推荐
- pandas使用split函数将dataframe中的特定列表字段(list column)裂变为多个数据列并拼接到原dataframe中
pandas使用split函数将dataframe中的特定列表字段(list column)裂变为多个数据列并拼接到原dataframe中(splitting column of lists into ...
- pandas基于条件判断更新dataframe中特定数据列数值内容的值(Conditionally updating values in specific pandas Dataframe )
pandas基于条件判断更新dataframe中特定数据列数值内容的值(Conditionally updating values in specific pandas Dataframe ) 目录
- DataFrame在指定位置插入行和列
Example df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]}) 在指定位置插入列 官方文档:pandas.DataFrame.insert Da ...
- dataframe选取特定行和列
dataframe选取特定行和列 选取行 df= pd.read_csv('data.csv') data = df.loc[3:6] # 选取多行# 按某列值在某个区间内选取行 data = df[ ...
- 数据库插入时,标识列插入显式值
当 IDENTITY_INSERT 设置为 OFF 时,不能为表 'CU_GiftExchange' 中的标识列插入显式值. SET IDENTITY_INSERT [dbo].[CU_GiftExc ...
- R语言为dataframe添加新的数据列(横向拼接、Appending columns,Unioning columns):使用R原生方法、data.table、dplyr等方案
R语言为dataframe添加新的数据列(横向拼接.Appending columns,Unioning columns):使用R原生方法.data.table.dplyr等方案 目录 R语言为dat
- pandas使用dropna函数删除dataframe中列非缺失值的个数小于某一阈值的数据列
pandas使用dropna函数删除dataframe中列非缺失值的个数小于某一阈值的数据列(drop columns with non missing values less than a thre ...
- R语言在dataframe的特定索引位置添加数据行而非在dataframe末尾append数据行实战
R语言在dataframe的特定索引位置添加数据行而非在dataframe末尾append数据行实战 目录 R语言在dataframe的特定索引位置添加数
- Pandas把dataframe的索引、复合索引变换为数据列:包含单索引到单列(重命名)、复合索引到多数据列、复合索引的其中一个水平变换为数据列、
Pandas把dataframe的索引.复合索引变换为数据列:包含单索引到单列(重命名).复合索引到多数据列.复合索引的其中一个水平变换为数据列 目录
最新文章
- 服务器性能优化的正确姿势
- 比特币现金支持者为BCH引入了各种新概念
- 基于springboot实现的仓储管理系统
- 【Linux】30.ssh不用手动输入密码登录终端sshpass 和 shell脚本后跟参数自动匹配case的用法
- CKEditor上传视频(java)
- python 统计组合用什么库_Python机器学习需要用到的库
- 做形态学方法的团队_图像分割实战-分水岭分割方法和GrabCut 算法
- 子查询到底走不走索引?
- linux mint 19新功能,Linux Mint 19.3将在2019年12月正式发布,附新功能简介
- 手把手教你玩转网络编程模型之完成例程(Completion Routine)篇(上)-转
- 计算机网络误区——VLAN中Access和Trunk原理详解
- mysql各版本下载及免费mysql可视化工具下载(上班记录)
- 在本地计算机无法启动iis admin 服务.错误:1053,Windows无法在本地计算机上启动SQL Server(SQLEXPRESS)服务。错误1053...
- SPA的原理及其实现
- c语言计算最大值与最小值的差,C语言 · 最大值与最小值计算
- ZYNQ+NVMe 小型化全国产存储方案
- 标准模式和怪异模式指的是什么?
- 宝德网吧服务器型号,14款网吧、网游 服务器横向评测
- 微信支付宝借刷脸支付抢占线下支付市场
- 115家电子科技企业待遇一览