pandas使用笔记(一)导入,查看,读取数据
pandas 预设
# 安装
pip install pandas pytables# 导入
import pandas as pd# 常用预设
# 下面两行命令均可显示数据的全部行
pd.set_option('display.max_rows', None)
# pd.options.display.max_rows = None# 下面两行命令均可显示数据的全部列
pd.set_option('expand_frame_repr', False)
# pd.options.display.max_columns = None# 显示数据的精度(保留小数点后第几位), 不会影响数据实际存储的值
pd.set_option('precision', 2)
pandas 导入和查看数据(DataFrame)
导入数据
这里以Excel数据为例, CSV,HDF等格式可以类似得到(具体请参考官方文档)
# 下列命令表示读取'test.xlsx'工作簿中的'Sheet 1'工作表
# 跳过第一行进行读取, 将列名设为第一行, 索引(行名)设为第一列(也可以使用列名, 如['date'])
# 设定编码为UTF-8(一般不乱码的话不需要设置), 设置将字符串转换为日期格式
df = pd.read_excel('test.xlsx', sheet_name="sheet 1", header=0, skiprows=1, index_col=0,encoding='utf8', parse_dates=['date'],)
查看
# 查看dataframe前5行
df.head(5)
# 查看后5行
df.tail(5)
# 查看3个样本(随机抽样), 固定比例则需要使用`frac=0.5`参数,表示抽取50%的数据
df.sample(3)
# 数据描述, 包含:行数,均值,标准差,最值,25,50,75分位数
df.describe()
DataFrame数据选取
生成测试数据
import numpy as np
arr = np.array([["jack",78,10],["lili",86,0],["amy",97,20],["tom",100,30]
])df = pd.DataFrame(arr,index=["1","2","3","4"],columns=["a","b",'c'])print(df)
"""
a b c
1 jack 78 10
2 lili 86 0
3 amy 97 20
4 tom 100 30
"""
按列名选取
# 此时选出的数据仍为DataFrame类型, 可以同时选出多个列
df[['a']]
# 此时选出的数据为Series类型
df['a']# .loc()方法进行选取(通过列名进行数据选取)
df.loc[:, 'a']
"""
1 jack
2 lili
3 amy
4 tom
Name: a, dtype: object
"""# 选取第a,c列
df.loc[:, ['a','c']]
"""a c
1 jack 10
2 lili 0
3 amy 20
4 tom 30
"""# 范围选取
df.loc[:, 'a':'c']
"""a b c
1 jack 78 10
2 lili 86 0
3 amy 97 20
4 tom 100 30
"""
按行名选取
df.loc['1'] # 选取第一行, 为Series类型数据
"""
a jack
b 78
c 10
Name: 1, dtype: object
"""df.loc[['1','3']] # 选取第1,3行
'''
a b c
1 jack 78 10
3 amy 97 20
'''df.loc['1': '3'] # 选取1到3行(范围选取)
"""a b c
1 jack 78 10
2 lili 86 0
3 amy 97 20
"""
按行号列号进行读取
# 使用.iloc()操作
df.iloc[0] # 第1行
df.iloc[:, 1] # 第2列
df.iloc[0:2, 0:2] # 第1,2行, 第1,2列
df.iat[1,2] # 第2行第3列元素
任意读取
# 读取所有行和列
df.loc[:]
# 等价于 df[:]"""
a b c
1 jack 78 10
2 lili 86 0
3 amy 97 20
4 tom 100 30
"""# 读取指定某个元素, .at()方法效率更高
df.at['1','a']
# 等价于df.loc['1','a']
"""
'jack'
"""
pandas使用笔记(一)导入,查看,读取数据相关推荐
- R语言小白学习笔记3—R语言读取数据
R语言小白学习笔记3-R语言读取数据 笔记链接 想说的话 学习笔记3-R语言读取数据 3.1 读取CSV文件 3.1.1 read_delim函数 3.1.2 fread函数 3.2 读取Excel数 ...
- pandas学习笔记(三):数据的变换与数据的管理
注:学习笔记基于文彤老师的pandas的系列课程 课程链接:https://study.163.com/course/courseMain.htm?courseId=1005124008&sh ...
- pandas学习笔记三之处理丢失数据
- pandas 终极版1:创建和查看DataFrame数据 mysql读取数据
在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame.Series类似于numpy中的一维数组,除了通吃一维数组可用的函数或方法,而且其可通过索引标签的方式获取数据, ...
- r导入txt乱码_R学习笔记系列—R语言从文本和Excel文件中读取数据-excel打开是乱码...
1.4.1 从文本文件中导入数据 可以使用 read.table() 函数从带分隔符的文本文件中导入数.调用格式为: 这个函数看上去很复杂,但其实很多参数在使用时不用明确指出来,使用默认值可以满足绝大 ...
- pandas 按字符串肚脐眼 读取数据_十分钟学习pandas! pandas常用操作总结!
学习Python, 当然少不了pandas,pandas是python数据科学中的必备工具,熟练使用pandas是从sql boy/girl 跨越到一名优秀的数据分析师傅的必备技能. 这篇pandas ...
- TensorFlow学习笔记(十一)读取自己的数据进行训练
1. 线性关系 数据csv文件读取 x,y 1,2 4,5 6,11 3,6 4,7 5,12 7,13 10,21 11,23 24,50 45,89 50,101 55,111 60,123 70 ...
- pandas 不要编号 加一行_文科生带你学Python|Pandas读取数据
16 2020-08 文科生带你学Python|Pandas读取数据 距离上一次更新时间有点久,原因么,被大佬的代码打击到了,于是回去自闭充了一波电-- LEARN MORE 图片来自网络,如侵删 向 ...
- python pandas 读取数据库_数据分析-pandas从数据库读取数据
数据分析-pandas从数据库读取数据 使用pandas读取数据到DataFrame,对于只是数据分析来说,重点是读取数据,读取数据过程越简单越好,并不需要写得很复杂显得自己很厉害的样子.最好就是代码 ...
最新文章
- Shell脚本个例二
- php开发 linux作用是什么,linux有什么用?
- bootstrap轮播图自动播放响应式箭头居中
- VS2013导入opencv320配置属性文件
- c面试题总结(含答案)
- java web右键菜单,win7右键菜单管理
- 404. Sum of Left Leaves 左叶子之和
- 全局变量_Python函数中的全局变量与局部变量
- ASP.NET MVC Global.cs - 应用程序事件
- 查找树的指定层级_阿里面试,问了B+树,这个回答让我通过了
- java 怎么匹配文章_Java 14 之模式匹配,非常赞的一个新特性!
- linux mc服务器 mod_我的世界:mc有哪些不为人知的“内幕”?Hypixel停服事件的真相...
- SolrCloud Hello Word
- R的数据可视化,各种图表,常用统计量计算
- 遗传算法优化的bp神经网络_【首发推荐】农学:基于遗传BP神经网络的采摘机器人手眼标定研究...
- inline-block和float
- HTML小游戏15 —— 网页版3D反恐英雄(附完整源码)
- 同时使用网线以及无线上网
- Pooling Revisited: Your Receptive Field is Suboptimal 论文解读和感想
- MT4 CRM 系统开发(一)