pandas DataFrame 根据多列的值做判断,生成新的列值
环境:Python3.6.4 + pandas 0.22
主要是DataFrame.apply函数的应用,如果设置axis参数为1则每次函数每次会取出DataFrame的一行来做处理,如果axis为1则每次取一列。
如代码所示,判断如果城市名中含有ing字段且年份为2016,则新列test值赋为1,否则为0.
import numpy as np
import pandas as pddata = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing'],'year': [2016,2016,2015,2017,2016, 2016],'population': [2100, 2300, 1000, 700, 500, 500]}
frame = pd.DataFrame(data, columns = ['year', 'city', 'population', 'debt'])def function(a, b):if 'ing' in a and b == 2016:return 1else:return 0
print(frame, '\n')
frame['test'] = frame.apply(lambda x: function(x.city, x.year), axis = 1)
print(frame)
运行结果如下:
另外Series类型也有apply函数,用法示例如下:
import numpy as np
import pandas as pddata = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing'],'year': [2016,2016,2015,2017,2016, 2016],'population': [2100, 2300, 1000, 700, 500, 500]}
frame = pd.DataFrame(data, columns = ['year', 'city', 'population', 'debt'])print(frame, '\n')
frame['panduan'] = frame.city.apply(lambda x: 1 if 'ing' in x else 0)
print(frame)
运行结果如下:
pandas DataFrame 根据多列的值做判断,生成新的列值相关推荐
- python 根据判断产生新列_pandas DataFrame 根据多列的值做判断,生成新的列值实例...
环境:Python3.6.4 + pandas 0.22 主要是DataFrame.apply函数的应用,如果设置axis参数为1则每次函数每次会取出DataFrame的一行来做处理,如果axis为1 ...
- python 多条件判断 生成新列_pandas DataFrame 根据多列的值做判断,生成新的列值
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],&q ...
- pandas使用groupby函数和cumsum函数计算每个分组内的数值累加值、并生成新的dataframe数据列( cumulative sum of each group in dataframe
pandas使用groupby函数和cumsum函数计算每个分组内的数值累加值.并生成新的dataframe数据列( cumulative sum of each group in dataframe ...
- Pandas操作dataframe对所有列/行求和 ,对指定列/行求和,对某一列/行求和,并添加新的列/行
计算各行数据总和并作为新列添加到末尾 计算各列数据总和并作为新行添加到末尾 import pandas as pd t=[[1,2,3],[4,5,6],[7,8,9]] df=pd.DataFram ...
- R语言dplyr包使用case_when函数和mutate函数生成新的数据列实战:基于单列生成新的数据列、基于多列生成新的数据列
R语言dplyr包使用case_when函数和mutate函数生成新的数据列实战:基于单列生成新的数据列.基于多列生成新的数据列 目录
- mysql新加一列_mysql如何增加表中新的列?
mysql中可以使用"ALTER TABLE"语句来增加表中新的列,语法格式"ALTER TABLE 表名 ADD 新字段名 数据类型 [约束条件];":默认是 ...
- python字典查询多个值_python – 在Pandas Dataframe中查找多个字典键并返回多个匹配值...
如果我的格式化关闭,第一次发布如此道歉. 这是我的问题: 我创建了一个包含多行文本的Pandas数据框: d = {'keywords' :['cheap shoes', 'luxury shoes' ...
- pandas中根据两列 或 多列进行条件对比,生成新列【三种方法】
使用目的: 两列数量对比,收货比期望多,就是标记数量满足,否则就数量不满足 如果数量满足.日期满足,那么总体就标记满足,有一个不满足就总体标记不满足 第一种: .loc赋值 # 这里是先创建一个空列, ...
- 前锋python百度云_关于python:使用索引在pandas DataFrame中设置特定单元格的值
我创建了一个熊猫数据框架 df = DataFrame(index=['A','B','C'], columns=['x','y']) 得到了这个 x y A NaN NaN B NaN ...
- pandas转mysql特定列_在pandas.DataFrame.to_sql时指定数据库表的列类型
问题 在数据分析并存储到数据库时,Python的Pandas包提供了to_sql 方法使存储的过程更为便捷,但如果在使用to_sql方法前不在数据库建好相对应的表,to_sql则会默认为你创建一个新表 ...
最新文章
- echarts树图节点垂直间距_矿棉板吊顶标准工艺节点
- UA MATH567 高维统计I 概率不等式9 亚高斯性的推广:Orlicz空间与Orlicz范数
- Lucene搜索引擎例子demo
- make: Nothing to be done for `first'
- 微软HTTP API指南
- C++学习笔记之对文件的操作2
- androidStudio快捷键概览
- MJRefresh实现刷新(使用它的Block方法)
- 【安装包】PhpStorm-2018.1
- 计算机组成原理——第四章
- Matlab聚类分析(Kmeans)
- Unity+JetBrainsRider2020+EmmyLua调试Lua(XLua)
- KEGG Orthology 数据库简介
- 爱有很多种,但一不小心就会失去……
- java游戏+弹幕_java弹幕小游戏1.0版本
- HHUOJ 1002 弟弟的作业(水题)
- 温州大学X袋鼠云:高等人才教育建设,如何做到“心中有数”
- 使用nodejs机器学习进行app流量判别
- AndroidStudio项目配置第三方libray库
- 计算机相关书籍推荐(持续更新)