文章目录

  • 数据处理
  • 直接赋值
  • apply
  • assign
  • 分条件赋值

  Pandas新增数据列方法主要有直接赋值、applyassign、分条件赋值这四种方法:

数据处理

  在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。拿到数据之后先做一些简单的处理:

# 替换掉温度的后缀℃
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')

直接赋值

  比如计算两列的差值(计算温差):

# 注意,df["bWendu"]其实是一个Series,后面的减法返回的是Series
df.loc[:, "wencha"] = df["bWendu"] - df["yWendu"]

apply

  df.apply方法是对某个轴应用了一个函数,传给这个对象是一个Series,这个Seriesindex要么是DataFrameindex(axis=0),要么是DataFramecolumns(axis=1)。

  实例:添加一列温度类型:如果最高温度大于33度就是高温;低于-10度是低温;否则是常温。

  使用.value_counts()查看温度类型的计数:

assign

  实例:将温度从摄氏度变成华氏度:

# 可以同时添加多个新的列
df.assign(yWendu_huashi = lambda x : x["yWendu"] * 9 / 5 + 32,# 摄氏度转华氏度bWendu_huashi = lambda x : x["bWendu"] * 9 / 5 + 32
)

分条件赋值

  按条件先选择数据,然后对这部分数据赋值新列。

  实例:高低温差大于10度,则认为温差大。

  上例中df['wencha_type'] = ''用到了Python中的广播机制。

Pandas系列(三)新增数据列相关推荐

  1. pandas基于dataframe字符串数据列不包含特定字符串来筛选dataframe中的数据行(rows where values do not contain substring)

    pandas基于dataframe字符串数据列不包含(not contains)特定字符串来筛选dataframe中的数据行(rows where values do not contain subs ...

  2. pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold

    pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(split dataframe based on column value threshol ...

  3. pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring)

    pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring) 目录

  4. pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe)

    pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe) ...

  5. pandas对dataframe的数据列进行随机抽样(Random Sample of Columns)、使用sample函数进行数据列随机抽样

    pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样 目录

  6. pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement)

    pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录

  7. pandas把dataframe的数据列转化为索引列实战:单列转化为索引、多列转化为复合索引

    pandas把dataframe的数据列转化为索引列实战:单列转化为索引.多列转化为复合索引 目录

  8. pandas新字段(数据列)生成、使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战

    pandas新字段(数据列)生成.使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战 pandas apply用法: pandas apply方法的作用原理 ...

  9. 学习ASP.NET Core Razor 编程系列三——创建数据表及创建项目基本页面

    原文:学习ASP.NET Core Razor 编程系列三--创建数据表及创建项目基本页面 学习ASP.NET Core Razor 编程系列目录 学习ASP.NET Core Razor 编程系列一 ...

  10. Pandas系列(三):数据清洗

    Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据清洗 1. 空值.缺失值处理 1.1 空值.缺失值判断 1.2 空值处理 2. 异常数据替换 2.1 条件替换 2.2 ...

最新文章

  1. 用例设计方法及其覆盖率
  2. python adb模块_python中adb有什么功能
  3. ab plc编程软件_三菱PLC原装和高仿怎么区分?仿真和编程软件一样吗?
  4. 安装 Docker Machine
  5. barrel-distortion
  6. VC对话框界面如何调整静态文本字体和大小?(转载)
  7. iptable 详解
  8. 跨境电商,独立站和第三方平台孰更具优势?
  9. python动态爱心代码_python 动态绘制爱心的示例
  10. 初学者关于贝叶斯纳什均衡各类符号的一点理解
  11. python公式_python公式大全
  12. MySQL有几部分_数据库系统有哪几部分组成?
  13. 曙光LINUX是什么系统,国产操作系统的曙光----深度操作系统Deepin
  14. APFS 苹果文件格式的小介绍 Apple File System
  15. YGG 西班牙 subDAO——Ola GG 正式成立
  16. nlp技能,jieba分词
  17. 计算机专业海报加文字,PS制作简洁漂亮的文字主题海报 -电脑资料
  18. 数据处理之文本分词、MMSEG分词工具、斯坦福NLTK分词工具
  19. python tkinter库引用tkk_Python之tkinter:调用python库的tkinter带你进入GUI世界(二)——Jason niu...
  20. 初试FitNesse

热门文章

  1. Linux多线程通信
  2. 大型网络游戏服务器的框架设计
  3. android设置字符串到剪贴板
  4. HDOJ 1465 不容易系列之一
  5. c语言static的用法_一文轻松掌握,单片机中C语言的数据存储与程序编写
  6. 游戏开发之C++指针的妙用(C++)
  7. 华为RSTP和MSTP相关配置命令
  8. 2017-2018-1 20155328 《信息安全系统设计基础》第13周学习总结
  9. 单元测试实践的主要问题与解决(2)
  10. 如何成为一名好的程序员的一些个人经验