4.Pandas新增数据列

文章目录

  • 4.Pandas新增数据列
  • 前言
  • 一、直接赋值
  • 二、df.apply方法
  • 三、df.assign方法
  • 四、按条件选择分组分别进行赋值
  • 总结

前言

不知道怎么搞的,我放在CSDN上免费下载的资源,平台竟然给附加了积分的要求。我用百度网盘分享一下:
链接:https://pan.baidu.com/s/1njABjnXK9iIapwpdv9CaCA
提取码:6666

笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的新增数据列方法,如apply方法。
在进行数据分析的时候,经常需要按照一定条件创建新的数据列,然后进一步进行分析


一、直接赋值

import pandas as pd
fpath="./datas/600033.csv"
df=pd.read_csv(fpath)
df.head()

#其实,df["new_col"]就是一个Series,后面的减法返回的是Series
df.loc[:,"new_col"]=df["open"]-df["low"]
df.head()

二、df.apply方法

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.apply.html
Apply a function along an axis of the DataFrame.

Objects passed to the function are Series objects whose index is either the DataFrame’s index (axis=0)
or the DataFrame’s columns (axis=1). By default (result_type=None), the final return type is inferred from
the return type of the applied function. Otherwise, it depends on the result_type argument.

用人话说就是在apply()参数中函数的参数来说,如果axis=0表示索引就是index,axis=1表示索引就是column

def get_type(x):if x["high"]>2.60:return "高价"if x["low"]<2.4:return "低价"return "正常"#注意需要设置axis=1,这是series的index是columns
df.loc[:,"price_type"]=df.apply(get_type,axis=1)
#本方法可以统计各个值的情况
df["price_type"].value_counts()

三、df.assign方法

官网: https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.assign.html

Assign new columns to a DataFrame.

Returns a new object with all original columns in addition to new ones. Existing columns that are re-assigned will be overwritten.

该方法是返回新的对象,对于原来的df不会做修改
可以同时添加多个新的列

df.assign(new_col1=lambda x:x["high"]*5+2,new_col2=lambda x:x["low"]*2+4
)

四、按条件选择分组分别进行赋值

df['new_col3']='嘻嘻~'
df.loc[df["high"]-df['low']<=0.05,'new_col3']="差距小"
df.loc[df["high"]-df['low']>=0.20,'new_col3']="差距大"
df['new_col3'].value_counts()

总结

这就是pandas增加新的列的基本用法了,希望可以帮助到你。

Pandas深入浅出相关推荐

  1. 【学习笔记】《深入浅出Pandas》第17章:Pandas实战案例

    文章目录 17.1 实战思想 17.1.1 链式方法 17.1.2 代码思路 17.1.3 分析方法 17.1.4 分析流程 17.1.5 分析工具 17.2 数据处理案例 17.2.1剧组表格道具: ...

  2. 【学习笔记】《深入浅出Pandas》第14章:Pandas时序数据

    文章目录 14.1 固定时间 14.1.1 时间的表示 14.1.2 创建时间点 14.1.3 属性 14.1.4 时间的方法 14.1.5 时间缺失值 14.2 时长数据 14.2.1 创建时间差 ...

  3. 《深入浅出Pandas:利用Python进行数据处理与分析》——第3部分 数据形式变化_01分组聚合

    文章目录 分组聚合操作 分组器 分组对象查看 apply/pipe/transform 数据分箱(data binning),或离散组合或数据分桶 分组可视化,pandas提供的简单的与分组相关的可视 ...

  4. 深入浅出Pandas:利用Python进行数据处理与分析 (李庆辉) 读书笔记

    1. 读取数据 df = pd.read_excel("地址",io, sheet_name=0, header=0, names=None, index_col=None, us ...

  5. Python --深入浅出Apriori关联分析算法(二) Apriori关联规则实战

    上一篇我们讲了关联分析的几个概念,支持度,置信度,提升度.以及如何利用Apriori算法高效地根据物品的支持度找出所有物品的频繁项集. Python --深入浅出Apriori关联分析算法(一) 这次 ...

  6. 深入浅出统计学 第四五章 离散概率的计算与分布

    离散概率计算与分布的应用 在原书的这两章离散概率计算与分布的应用,重点在于概念的理解和公式的记忆. 而对于整本书而言,四五六章其实都作为第七章:三种离散概率分布,第八,九章,正态分布(连续概率分布之一 ...

  7. 深入浅出统计学 第二三章 量度

    量度 两类量度: (1) 集中趋势的量度->平均值,中位数,众数 (2) 分散性与变异性的亮度->全距(极值),四分位数(扩展:箱型图),方差与标准差,标准分 获取数据 import pa ...

  8. 深入浅出统计学 第一章 数据的可视化

    序言 在深入浅出统计学的第一张中一共出现了4类图像: 1. 比较基本比例->饼图 2. 比较数值的高低条形图(基本条形图,堆积条形图,分段条形图) 3. 连续数据的对比(等距直方图->频数 ...

  9. 【Python】pandas 缺失数据处理大全(附代码)

    之前一直在分享pandas的一些骚操作:pandas骚操作,根据大家反映还不错,但是很多技巧都混在了一起,没有细致的分类,这样不利于查找,也不成体系. 利用闲暇之余将有关数据清洗.数据分析的一些技能再 ...

  10. 盘点66个Pandas函数,轻松搞定“数据清洗”!

    今天我们重新盘点66个Pandas函数合集,包括数据预览.数值数据操作.文本数据操作.行/列操作等等,涉及"数据清洗"的方方面面. Pandas 是基于NumPy的一种工具,该工具 ...

最新文章

  1. 基于kryo序列化方案的memcached-session-manager多memcached...
  2. 【洛谷 P2464】[SDOI2008]郁闷的小J(线段树)
  3. Web.py Cookbook 简体中文版 - Hello World!
  4. [Python从零到壹] 九.网络爬虫之Selenium基础技术万字详解(定位元素、常用方法、键盘鼠标操作)
  5. 【kibana】状态异常 Status: Red Status changed from red to yellow - No existing Kibana index found
  6. python session模块_Python backend.set_session方法代码示例
  7. 如何在 Exchange Server 2010 SP1 下将用户邮箱导出到PST中
  8. 疫中行,程序员可在家免费学这些!
  9. Chrome 实现前端页面自动刷新
  10. Panasonic: FP-X0 L30R 使用 FPWIN GR7 通讯及编程
  11. C语言RGB转Lab色域
  12. 【面试系列三】面试是面试者与面试官的双向沟通,如何抓住面试官的小尾巴以及面试过程中需要避开的一些减分项!
  13. 计算机图形学常用算法
  14. CCF论文列表(2022拟定)大更新!NAACL升B!ICLR继续陪跑...MICCAI空降B!PRCV空降C!
  15. python 三维度显示,Python实现高斯函数的三维显示方法
  16. 【MVC、Spring MVC介绍、区别、执行流程】
  17. 2019河北单招计算机考试模拟试题,2019年河北单招文科数学模拟试题(一)【含答案】.docx...
  18. 通过这一篇文章,可以把Java中的类加载器了解的七七八八了
  19. python基础——数据类型
  20. 夫妻档“老鼠仓” 大数据下现形

热门文章

  1. Windows XP Embedded SP2 + 简体中文语言包
  2. 怎么用c语言让电脑定时开关机,电脑定时开关机如何设置?小编教你设置电脑定时开机和关机...
  3. 深入JavaScript之JS引擎如何执行JS代码
  4. Android学习路线(适合学生)
  5. 学生成绩管理系统(C语言)
  6. 使用pygal展示世界各国人口分布情况
  7. linux安装windows常用中文字体库
  8. “熊猫烧香”病毒的原理
  9. “仁、义、礼、智、信、恕、忠、孝、悌、、节、恕、勇、让”
  10. css权威指南_CSS指南