pandas常用方法
删除列
df.drop(labels=[“列名1”, “列名2”], axis=1, inplace=True)
df.drop(df.columns[[0, 1,2,3,4,5,6,7,8,9,10]], axis=1, inplace=True)
第二种删除列的方式需要注意的是,如果你读取的是csv或者excel,且指定了index_col=0,即第一列为索引列,则df.columns[[0]]则为实际的第二列
- 只要某些列
df = df.loc[(pd.isnull(df[" CompanyNumber"]) == False), [" CompanyNumber", “IncorporationDate”, “Accounts.NextDueDate”]]
- 将列的某些值进行替换
df[“CompanyStatus”].replace(“Active”, “postive”, inplace=True)
- 某字段的值为null或者空字符则不要
df = df.fillna(“”)
df = df[df[‘DISTRIBUTOR_NAME’].apply(lambda x: x.strip())!=‘’]
- 将指定列包含指定内容的数据保留
df(df[“SICCode.SicText_1”].str.contains(“47749 -|5232 -”))
- assign函数
将两列数据拼接,并生成新的一列 Adress
df = df.assign(Address=lambda x:x[‘RegAddress.Country’] + " | " + x[‘RegAddress.County’])
- apply函数
## 这里的apply是对DataFrame进行操作,因此进入匿名函数的x是DataFrame的每行数据,类型为Series
df.loc[:,"xxx"] = df.apply(lambda x:print(type(x))
## 这里的df.loc[:,"xxx"]是Series 类型的数据, 因此每次进入匿名函数的x是该列的具体数据
df["xxx"] = df.loc[:, "xxx"].apply(lambda x:print(type(x))
- 条件筛选
df.loc[df[‘高温’]-df[‘低温’]>=15,‘type’] = ‘高温差’
df.loc[df[‘高温’]-df[‘低温’]<15,‘type’] = ‘低温差’
- 更改列名
df.rename(columns={“CompanyName”: “title”}, inplace=True)
df.rename(columns={" CompanyNumber": “DISTRIBUTOR_ID”}, inplace=True)
- 分组聚合(groupby)
# 可以实现对dataframe的company列进行分组,然后得到几个分组后的df,再对salary列进行取平均值,然后赋值给avg_salary列
data['avg_salary'] = data.groupby('company')['salary'].transform('mean')
pandas常用方法相关推荐
- pandas归一化某一列_十分钟带你了解pandas常用方法
pandas常用知识 一.读取csv文件为dataframe 二.dataframe的数据概况 三.取列数据 四.取行数据 五.取某一单元格数据 六.缺失值处理 七.归一化处理 八.排序 九.索引重新 ...
- Pandas常用方法总结
1. 文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名,0,1,2,3...names=['A', 'B', 'C'...] 自定 ...
- pandas 基础用法
pandas 是一个基于 Numpy 构建, 强大的数据分析工具包 主要功能 独特的数据结构 DataFrame, Series 集成时间序列功能 提供丰富的数学运算操作 灵活处理缺失数据 Serie ...
- pandas使用总结【转】
原文https://www.jianshu.com/p/a4041bbdd460 0.pandas常用方法 import pandas as pddf = pd.read_csv("chic ...
- Py修行路 Pandas 模块基本用法
pandas 安装方法:pip3 install pandas pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的模块. pandas的主要功能: 具备对其功能的数据结构D ...
- python——pandas
pandas概述 pandas是python第三方库,提供高性能易用数据类型和分析工具 pandas基于numpy实现,常与numpy和matplotlib一同使用 pandas中有两大核心数据结构: ...
- python写excel文件不覆盖_python excel多sheet存储,同sheet不覆盖追加数据
1.多sheet存储 方式一:读取数据库并存入excel多个sheet import cx_Oracle import pandas as pd conn_oracle = cx_Oracle.con ...
- Python csv、xlsx、json、二进制(MP3) 文件读写基本使用
Python csv.xlsx.json.二进制(MP3) 文件读写基本使用 文章目录 Python csv.xlsx.json.二进制(MP3) 文件读写基本使用 前言 一.什么是文件读写? 二.文 ...
- day32 Python与金融量化分析(二)
第一部分:金融与量化投资 股票: 股票是股份公司发给出资人的一种凭证,股票的持有者就是股份公司的股东. 股票的面值与市值 面值表示票面金额 市值表示市场价值 上市/IPO: 企业通过证券交易所公开向社 ...
最新文章
- 一档博士40万年薪+70万房补!引进224人!​这所大学2021年公开招聘专任教师公告...
- CondaHTTPError: HTTP 404 NOT FOUND for url https://pypi.tuna.tsinghua.edu.cn/simple/ 错误
- ComboBox.TextChanged等事件的注意问题
- 统计0到n之间1的个数
- jeesite快速开发平台(三)----项目文件结构与配置文件详解
- 前端开发面试题总结之——CSS3
- 深度学习实践总结:Sentiment Classification How To Frame Problems for a Neural Network
- for循环中一个不容小觑的问题
- 文本检测大满贯!自适应文本区域表示改进形状任意的文本检测
- JS获取FckEditor的值
- rfid在高速公路管理中的应用_RFID亮灯电子标签在仓储管理中的应用
- HDU 5835 Danganronpa 贪心
- 常用类 (七) ----- 包装类
- vue.js高德地图实现热点图
- 通信协议之广播---recvfrom 放回客户端的ip地址第一次全为0.0.0.0
- java实现数据的Excel导出(合并单元格、样式等)
- JS拖动技术--- 关于setCapture
- c oracle案例,Oracle 19c CRS重启案例记录
- 如何编写python爬虫_如何完整写一个爬虫框架
- AndroidStudio NDK开发环境配置及示例
热门文章
- 浏览器被恶意设置主页http://www.2345.com/?kunown的解决方法
- VS2005 C++ 项目怎样添加“依赖”、“库目录”和“包含目录”
- ORA-01422: exact fetch returns more than requested number of rows
- 【自然语言处理】【知识图谱】知识图谱表示学习(三):SE、SME、LFM、RESCAL、HOLE
- 跳转微信小程序和支付宝小程序
- 华为鸿蒙os设置界面,华为鸿蒙OS系统界面疑似曝光 运行性能提升超60%
- 苹果手机 不要删除服务器邮件,iCloud邮件无法删除怎么办?解决iCloud邮件占用空间方法...
- gcc编译程序的过程
- Git 忽略某些文件,忽略已提交的文件记录,Git 不追踪变更
- uniApp开发微信小程序减少包大小