在jupyter notebook里面shift+tab查看函数详情

常用的库/包

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

导入csv或者excel文件

os.chdir(r" ")
os.getcwd()#获取当前路径
os.listdir()
#当前文件夹的listdf=pd.read_csv('XXXXX.csv',sep=';',header=0)
#指定读入csv文件的分隔符
df=pd.read_excel("XXXX.xlsx",sheet_name=None)#为none表示读入所有的sheet
df.keys()#查看sheet的名称
df=pd.read_excel("XXXX.xlsx",sheet_name="Sheet1")
df=pd.read_excel("XXXX.xlsx",sheet_name="Sheet1",dtype='str')
#dtype='str'表示所有列读入的时候就指定数据类型,比较粗暴

其他转换数据类型的方法:

python 01数据类型转换_如何将所有或部分dataframe的数据类型转换为字符串_跑马的汉子_的博客-CSDN博客_dataframe将某列转为字符串读取原始数据的时候,经常会遇到字符型变量读入变成了数值型,比较定性的就是商户ID,银行卡号这类标识型数据, 可以使用三种方法解决这个问题:第一种:在读取数据的时候,指定数据类型data = pd.read_csv('test.txt',sep = '|',dtype = 'str')上面说的是, 1,读取工作文件路径中标题为test.txt的文件, 2,采用的分割符是’|’分隔符...https://blog.csdn.net/qq_34490873/article/details/81205523

数据检查:

#数据检查
df.info()
#数据大体情况
df.describe()#自定义函数
def data_check(df,if_detail_info=True):print("There are",df.shape[0],"rows and",df.shape[1],"columns")print("The variables are:",df.columns)if if_detail_info==True:print("---------------------------------------------")print(df.info())data_check(df)

关于merge函数的使用方式:

pd.merge()只能用于两个表的左右拼接

merge默认是inner内连接,只把主键相同的信息进行连接,不指定on,相同信息的列作为判断依据。所以,一般情况下都要指定on。

也可以使用索引进行左右拼接,left_index=True或者right_index=True就可以(默认为false),但基本用不上吧。

how="outer",外连接是保留两个表的所有信息,拼接的时候遇到标签不能对齐的部分,用NAN进行填充。

how="left",左连接是保留所有左表的信息,把右表中主键与左表一致的信息拼接进来,标签不能对齐的部分,用NAN进行填充。

indicator=True,设定显示拼接后的表中哪些信息来自于哪一个表格,默认为false

#两表合并
data=pd.merge(a,b,how="left",on=[" "," "])

pandas数据合并之一文弄懂pd.merge() - 知乎CDA数据分析师 出品在合并数据的操作中,除了pd.concat()函数,另一个常用的函数就是pd.merge()了,这两个函数也经常被拿来比较,其实只要弄懂了函数中重要参数的作用理解了每个函数的用法,自然就知道在哪种情况…https://zhuanlan.zhihu.com/p/132579724

pd.concat()多表拼接:

axis=0 表示上下堆叠,当axis=1表示左右拼接。默认axis为0。

#两张表字段是一样的,直接上下合并
df=pd.concat([df1,df2,df3])
#合并之后记得重置index
df.reset_index(inplace = True)

删除:

#删掉某列中某些不要的字段
data=df[-df.时间.isin(["1月","2月","3月"])]
#直接删掉某列
data.drop("Education",axis=1) #axis=0代表行,axis=1代表列,重要,如果不写默认为0

排序:

data.sort_values(by="Age",axis=0,ascending=True).head()
data.sort_values(by=["Age","Income"],axis=0,ascending=True).head()
#两个排序条件,从小到大排序把ascending改为false

pd.pivot_table()

python中的数据透视表pivot_table参数详解 - 知乎官方文档参考: Jupyter Notebook Viewer其他文档参考: Pandas_聚合数据_pivot_table()_Python_学习笔记-CSDN博客pd.pivot_table( data, values=None, index=None, columns=None, aggfunc='mean', fill_val…https://zhuanlan.zhihu.com/p/127811410

dataframe常用笔记相关推荐

  1. Python~Pandas 小白避坑之常用笔记

    Python~Pandas 小白避坑之常用笔记 提示:该文章仅适合小白同学,如有错误的地方欢迎大佬在评论处赐教 文章目录 Python~Pandas 小白避坑之常用笔记 前言 一.pandas安装 二 ...

  2. Spark SQL概述,DataFrames,创建DataFrames的案例,DataFrame常用操作(DSL风格语法),sql风格语法

    一. Spark SQL 1. Spark SQL概述 1.1. 什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作 ...

  3. flex简单常用笔记

    flex简单常用笔记 多行换行操作: ul {display: flex;flex-direction: row;justify-content: space-between;flex-wrap: w ...

  4. oracle常用笔记(二)

    文章目录 oracle常用笔记(二) 1. 视图 2. 索引 3. pl/sql 基本语法 1. 变量声明 2. if分支 3. LOOP 循环 4. 游标Cursor 4. 存储过程 5. 存储函数 ...

  5. 电脑常用笔记及软件个人存档

    ** 电脑常用笔记及软件 ** 打开自带的搜索Win+Q 计算器指令 calc(计算的意思) 全选 Ctrl+A 复制Crtl+C 粘贴Ctrl+V 打开剪切板 Win+V Alt+Tab 切换任务 ...

  6. 常用笔记软件对于视频网站嵌入播放支持

    前言 试了一下发现 onedriver 支持嵌入功能,故此测试以下几款常用笔记对于 onedriver 视频.YouTube 视频.哔哩哔哩 视频的嵌入播放的支持 具体测试 对于思源笔记 支持嵌入播放 ...

  7. 【NVM】NVM 常用笔记

    文章目录 [NVM]NVM 常用笔记 [NVM]NVM 常用笔记 下载地址 修改 setting.txt 增加阿里镜像地址 node_mirror: https://npm.taobao.org/mi ...

  8. dataframe常用操作_Pandas模块基础及常用方法

    Pandas是基于Numpy的数据处理与分析模块.包含两个最重要的基本类型:Series和DataFrame.其中Series类似numpy的一维数组,DataFrame类似二维数组,但可存储不同类型 ...

  9. 【pandas-汇总3】DataFrame常用属性、函数以及索引方式

    1.DataFrame常用属性.函数以及索引方式 1.1DataFrame简介 DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值.字符串.布尔值等).Data ...

最新文章

  1. 零积分下载,2014年辛星mysql教程秋季版第一本已经完工,期待您的支持
  2. win10电脑去掉快捷箭头_【搞机作战室】Win10系统电脑 常用快捷方式按键 (快捷键)介绍...
  3. autosar工具链_Autosar开发与手写代码开发的区别
  4. Updatexml函数再mysql中的作用
  5. Spring MVC 基础及相关概念(基础一)
  6. 苹果耳罩式耳机曝光 将于今年下半年发布
  7. oracle获取sysdba权限,Oracle 学习笔记: SYSDBA登陆权限问题
  8. 一文带你认清数据仓库“维度模型设计”与“分层架构” | 原力计划
  9. 准备好跟机器人正面交锋了吗?
  10. 封装echarts 柱状图和曲线
  11. Transformer提效之路干货笔记——一文梳理各种魔改版本Transformer
  12. WEEX|初始化工程
  13. 计算机如何更新目录,wps更新目录【设置办法】
  14. 机顶盒系统升级服务器地址,tvbox
  15. python支持向量机 股票_测 python 利用SVM预测股票涨跌
  16. Android 仿百合网超火爆社交app首页滑动效果
  17. android维持登录状态
  18. 机器人之自动回归原点方法实现
  19. 运放环路补偿及计算,零点、极点计算
  20. 使用pycallgraph分析python代码函数调用流程以及框架

热门文章

  1. 模拟计算机难以实现,人工智能的现状及今后发展趋势展望
  2. 网页期末作业 基于HTML+CSS中国传统节日-中秋节 6页
  3. 像TransactionScope一样使用DbTransaction
  4. https、公钥、私钥、数字签名、数字证书
  5. 读起来,微微心疼的句子
  6. PS合成的5个要点:场景、对比、氛围、模糊、纹理
  7. 论文撤稿后版面费能退吗?
  8. html 字段空两个字符串,html 空格字符代码 多个html空格符代码输入篇
  9. 如何换wordpress头像
  10. 十种增强记忆力的方法