pandas常用功能手册(自用)

文章目录

  • 前言
  • 一、创建
  • 二、读取数据
  • 三、常用操作
    • 取数据
    • 循环读取数据+tqdm进度条
    • 查询数据
    • menrge拼接
    • 修改列名
    • 去重
    • 去除某列空值
  • 四、保存文件
    • 输出excel
    • 输出csv
  • 总结

前言

pandas常用功能手册(自用)

pandas常用功能手册(自用),持续更新


一、创建

多个数组>>dateframe

pd_before = pd.DataFrame()
pd_before['new_x'] = new_x
pd_before['new_y'] = new_y
pd_before['new_plabel'] = new_plabel
pd_before['new_pinfo'] = new_pinfo

二、读取数据

读excel

df_drug_gene = pd.read_excel('../F1A-drug-go.xlsx', header = 0)  # header = 0 带列名数据

三、常用操作

取数据

已知列名,取指定列

df_drug_gene = df_drug_gene[['drug', 'gene']]

已知序号,取指定列

df.iloc[:, n]

循环读取数据+tqdm进度条

for index, row in tqdm(df.iterrows(), total=df.shape[0]):row[1] == 1

查询数据

#满足条件的行
df.loc[df['A']=='A']
#也可以取满足条件范围的行
df.loc[df['B'] > 6]
data.iloc[:10,:]
# 存在某个字段
df[df['A'].isin(['A'])]# 查找特定条件下的行索引
index = df[df.A == 'A'].index.tolist()[0]

menrge拼接

左拼接对齐

pd_result_1 = pd.merge(df_drug_gene, df_symmap_info, left_on = 'gene',  right_on = 'Gene_symbol', how = 'left')

修改列名

df_pw_Enrichment_result2.rename(columns={"go": "pw", "name": "pw_name"}, inplace=True)

去重

df_new = pd_before.drop_duplicates(subset = ['new_x', 'new_y'],  # 去重列,按这些列进行去重keep = 'first'  # 保存第一条重复数据)

去除某列空值

df_book = df_book.dropna(subset=['content_id'])

四、保存文件

输出excel

pd_result_2.to_excel('../result/drug-gene.xlsx', index = False) # index = False 不保存列名

输出csv

注意中文乱码问题

pd_result_2.to_csv('../result/drug-gene.csv', index = False, encoding='utf_8_sig')

总结

提示:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

pandas常用功能手册相关推荐

  1. Python Pandas常用功能速查

    0.下载和导入 (1)下载 在terminal中,openpyxl不装容易报错 pip install pandas pip install openpyxl (2)导入 在python中 impor ...

  2. pandas常用功能整理

    1.读写 读指定格式txt: train = pd.read_table('/home/hadoop/jzzz/train/subsidy_train.txt',sep=',',header=-1) ...

  3. 【Python】精选23个Pandas常用函数

    公众号:尤而小屋 作者:Peter 编辑:Peter 从26个字母中精选出23个Pandas常用的函数,将它们的使用方法介绍给大家.其中o.y.z没有相应的函数. import pandas as p ...

  4. pandas常用函数说明及速查表

    pandas常用函数说明及速查表 如果你用python做开发,那么几乎肯定会使用pandas库. Pandas 是 Python 语言的一个扩展程序库,用于数据分析. Pandas 是一个开放源码.B ...

  5. NumPy和Pandas常用库

    NumPy和Pandas常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数 ...

  6. pandas教程:pandas主要功能详解

    pandas基本功能 将文件数据导入Pandas 通过pandas提供的read_xxx相关的函数可以读取文件中的数据,并形成DataFrame,常用的数据读取方法为:read_csv,主要可以读取文 ...

  7. UBoot常用命令手册

    UBoot常用命令手册 U-Boot还提供了更加详细的命令帮助,可以通过"?"显示支持的命令列表,通过help [CommandName]命令还可以查看每个命令的参数说明. 1.b ...

  8. arcgis python脚本筛选与线共边的面_ArcGIS公共函数Python脚本,Arcgis,常用,功能

    Arcgis常用功能 Python脚本 对一些常用功能的python脚本进行总结,方便以后直接调用. 1. 根据属性值删除行 arcpy.MakeFeatureLayer_management(out ...

  9. CDA学习之Pandas - 常用函数和75个高频操作

    目录 一.函数 1.1 常用函数 1.1.1 导⼊数据 1.1.2 导出数据 1.1.3 查看数据 1.1.4 数据选取 1.1.5 数据处理 1.1.6 数据分组和排序 1.1.7 数据合并 1.1 ...

  10. Arcgis常用功能 Python脚本

    Arcgis常用功能 Python脚本 对一些常用功能的python脚本进行总结,方便以后直接调用. 1. 根据属性值删除行 arcpy.MakeFeatureLayer_management(out ...

最新文章

  1. Vue:Vue的< span >文字怎么加粗?
  2. mysql存储过程number类型_MySQL存储过程的基本函数(三)
  3. MAC安装mysql8.0.11以及修改root密码
  4. mysql每一步花费时间_MySQL花费更多时间发送数据
  5. 【笔记】JAVA中的泛型和反射
  6. Java中synchronized同步块的执行流程
  7. 湖南计算机对口专科学校,湖南计算机专业对口升学有哪些学校?
  8. linux 下生成中文pdf,Linux itex pdf生成中文不显示
  9. hdu 5755 Gambler Bo 高斯消元
  10. 离散数学蕴含等值式前件为假时命题为真的理解
  11. c语言操作数据库sql
  12. 力扣刷题 DAY_84 贪心
  13. (转)如何快速学习Tableau Desktop
  14. nowcoder20619 禁书目录
  15. Oracle 自定义数据类型Type
  16. CSS布局之——左边、上边固定,内容自适应(Vue)
  17. 2019年程序员最值得选择的100家互联网公司排名
  18. 使用Arthas热更新时,lombok注解导致mc命令编译失败
  19. 逆向中常见寄存器及常用汇编指令
  20. 信息管理导论 | 信息与信息资源、信息社会

热门文章

  1. 趋势Officescan的自动删除批处理脚本
  2. 原版windows下载地址
  3. 解决Protel 99se 老是未响应的问题
  4. nginx启动报错:Failed to start The nginx HTTP and reverse proxy server.
  5. php/html+css+js制作计算器
  6. 自动刷新wu2198股市直播内容
  7. SPSS处理bicomb矩阵——打开txt文件只有输出文档界面显示正在运行GET DATA,并不占用cpu,原因是编码格式不匹配
  8. 超星阅读器pdz文件转为xps文件或pdf文件说明
  9. 安装vbb的一些经验(包括mysql,apache)
  10. talib如何安装方法