删除列

df.drop(labels=[“列名1”, “列名2”], axis=1, inplace=True)
df.drop(df.columns[[0, 1,2,3,4,5,6,7,8,9,10]], axis=1, inplace=True)
第二种删除列的方式需要注意的是,如果你读取的是csv或者excel,且指定了index_col=0,即第一列为索引列,则df.columns[[0]]则为实际的第二列

  • 只要某些列

df = df.loc[(pd.isnull(df[" CompanyNumber"]) == False), [" CompanyNumber", “IncorporationDate”, “Accounts.NextDueDate”]]

  • 将列的某些值进行替换

df[“CompanyStatus”].replace(“Active”, “postive”, inplace=True)

  • 某字段的值为null或者空字符则不要

df = df.fillna(“”)
df = df[df[‘DISTRIBUTOR_NAME’].apply(lambda x: x.strip())!=‘’]

  • 将指定列包含指定内容的数据保留

df(df[“SICCode.SicText_1”].str.contains(“47749 -|5232 -”))

  • assign函数

将两列数据拼接,并生成新的一列 Adress
df = df.assign(Address=lambda x:x[‘RegAddress.Country’] + " | " + x[‘RegAddress.County’])

  • apply函数
## 这里的apply是对DataFrame进行操作,因此进入匿名函数的x是DataFrame的每行数据,类型为Series
df.loc[:,"xxx"] = df.apply(lambda x:print(type(x))
## 这里的df.loc[:,"xxx"]是Series 类型的数据, 因此每次进入匿名函数的x是该列的具体数据
df["xxx"] = df.loc[:, "xxx"].apply(lambda x:print(type(x))
  • 条件筛选

df.loc[df[‘高温’]-df[‘低温’]>=15,‘type’] = ‘高温差’
df.loc[df[‘高温’]-df[‘低温’]<15,‘type’] = ‘低温差’

  • 更改列名

df.rename(columns={“CompanyName”: “title”}, inplace=True)
df.rename(columns={" CompanyNumber": “DISTRIBUTOR_ID”}, inplace=True)

  • 分组聚合(groupby)
# 可以实现对dataframe的company列进行分组,然后得到几个分组后的df,再对salary列进行取平均值,然后赋值给avg_salary列
data['avg_salary'] = data.groupby('company')['salary'].transform('mean')

pandas常用方法相关推荐

  1. pandas归一化某一列_十分钟带你了解pandas常用方法

    pandas常用知识 一.读取csv文件为dataframe 二.dataframe的数据概况 三.取列数据 四.取行数据 五.取某一单元格数据 六.缺失值处理 七.归一化处理 八.排序 九.索引重新 ...

  2. Pandas常用方法总结

    1. 文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名,0,1,2,3...names=['A', 'B', 'C'...] 自定 ...

  3. pandas 基础用法

    pandas 是一个基于 Numpy 构建, 强大的数据分析工具包 主要功能 独特的数据结构 DataFrame, Series 集成时间序列功能 提供丰富的数学运算操作 灵活处理缺失数据 Serie ...

  4. pandas使用总结【转】

    原文https://www.jianshu.com/p/a4041bbdd460 0.pandas常用方法 import pandas as pddf = pd.read_csv("chic ...

  5. Py修行路 Pandas 模块基本用法

    pandas 安装方法:pip3 install pandas pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的模块. pandas的主要功能: 具备对其功能的数据结构D ...

  6. python——pandas

    pandas概述 pandas是python第三方库,提供高性能易用数据类型和分析工具 pandas基于numpy实现,常与numpy和matplotlib一同使用 pandas中有两大核心数据结构: ...

  7. python写excel文件不覆盖_python excel多sheet存储,同sheet不覆盖追加数据

    1.多sheet存储 方式一:读取数据库并存入excel多个sheet import cx_Oracle import pandas as pd conn_oracle = cx_Oracle.con ...

  8. Python csv、xlsx、json、二进制(MP3) 文件读写基本使用

    Python csv.xlsx.json.二进制(MP3) 文件读写基本使用 文章目录 Python csv.xlsx.json.二进制(MP3) 文件读写基本使用 前言 一.什么是文件读写? 二.文 ...

  9. day32 Python与金融量化分析(二)

    第一部分:金融与量化投资 股票: 股票是股份公司发给出资人的一种凭证,股票的持有者就是股份公司的股东. 股票的面值与市值 面值表示票面金额 市值表示市场价值 上市/IPO: 企业通过证券交易所公开向社 ...

最新文章

  1. 一档博士40万年薪+70万房补!引进224人!​这所大学2021年公开招聘专任教师公告...
  2. CondaHTTPError: HTTP 404 NOT FOUND for url https://pypi.tuna.tsinghua.edu.cn/simple/ 错误
  3. ComboBox.TextChanged等事件的注意问题
  4. 统计0到n之间1的个数
  5. jeesite快速开发平台(三)----项目文件结构与配置文件详解
  6. 前端开发面试题总结之——CSS3
  7. 深度学习实践总结:Sentiment Classification How To Frame Problems for a Neural Network
  8. for循环中一个不容小觑的问题
  9. 文本检测大满贯!自适应文本区域表示改进形状任意的文本检测
  10. JS获取FckEditor的值
  11. rfid在高速公路管理中的应用_RFID亮灯电子标签在仓储管理中的应用
  12. HDU 5835 Danganronpa 贪心
  13. 常用类 (七) ----- 包装类
  14. vue.js高德地图实现热点图
  15. 通信协议之广播---recvfrom 放回客户端的ip地址第一次全为0.0.0.0
  16. java实现数据的Excel导出(合并单元格、样式等)
  17. JS拖动技术--- 关于setCapture
  18. c oracle案例,Oracle 19c CRS重启案例记录
  19. 如何编写python爬虫_如何完整写一个爬虫框架
  20. AndroidStudio NDK开发环境配置及示例

热门文章

  1. 浏览器被恶意设置主页http://www.2345.com/?kunown的解决方法
  2. VS2005 C++ 项目怎样添加“依赖”、“库目录”和“包含目录”
  3. ORA-01422: exact fetch returns more than requested number of rows
  4. 【自然语言处理】【知识图谱】知识图谱表示学习(三):SE、SME、LFM、RESCAL、HOLE
  5. 跳转微信小程序和支付宝小程序
  6. 华为鸿蒙os设置界面,华为鸿蒙OS系统界面疑似曝光 运行性能提升超60%
  7. 苹果手机 不要删除服务器邮件,iCloud邮件无法删除怎么办?解决iCloud邮件占用空间方法...
  8. gcc编译程序的过程
  9. Git 忽略某些文件,忽略已提交的文件记录,Git 不追踪变更
  10. uniApp开发微信小程序减少包大小