pandas 预设

# 安装
pip install pandas pytables# 导入
import pandas as pd# 常用预设
# 下面两行命令均可显示数据的全部行
pd.set_option('display.max_rows', None)
# pd.options.display.max_rows = None# 下面两行命令均可显示数据的全部列
pd.set_option('expand_frame_repr', False)
# pd.options.display.max_columns = None# 显示数据的精度(保留小数点后第几位), 不会影响数据实际存储的值
pd.set_option('precision', 2)

pandas 导入和查看数据(DataFrame)

导入数据

这里以Excel数据为例, CSV,HDF等格式可以类似得到(具体请参考官方文档)

# 下列命令表示读取'test.xlsx'工作簿中的'Sheet 1'工作表
# 跳过第一行进行读取, 将列名设为第一行, 索引(行名)设为第一列(也可以使用列名, 如['date'])
# 设定编码为UTF-8(一般不乱码的话不需要设置), 设置将字符串转换为日期格式
df = pd.read_excel('test.xlsx', sheet_name="sheet 1", header=0, skiprows=1, index_col=0,encoding='utf8', parse_dates=['date'],)

查看

# 查看dataframe前5行
df.head(5)
# 查看后5行
df.tail(5)
# 查看3个样本(随机抽样), 固定比例则需要使用`frac=0.5`参数,表示抽取50%的数据
df.sample(3)
# 数据描述, 包含:行数,均值,标准差,最值,25,50,75分位数
df.describe()

DataFrame数据选取

生成测试数据

import numpy as np
arr = np.array([["jack",78,10],["lili",86,0],["amy",97,20],["tom",100,30]
])df = pd.DataFrame(arr,index=["1","2","3","4"],columns=["a","b",'c'])print(df)
"""
a   b   c
1   jack    78  10
2   lili    86  0
3   amy 97  20
4   tom 100 30
"""

按列名选取


# 此时选出的数据仍为DataFrame类型, 可以同时选出多个列
df[['a']]
# 此时选出的数据为Series类型
df['a']# .loc()方法进行选取(通过列名进行数据选取)
df.loc[:, 'a']
"""
1    jack
2    lili
3     amy
4     tom
Name: a, dtype: object
"""# 选取第a,c列
df.loc[:, ['a','c']]
"""a c
1   jack    10
2   lili    0
3   amy 20
4   tom 30
"""# 范围选取
df.loc[:, 'a':'c']
"""a b   c
1   jack    78  10
2   lili    86  0
3   amy 97  20
4   tom 100 30
"""

按行名选取


df.loc['1'] # 选取第一行, 为Series类型数据
"""
a    jack
b      78
c      10
Name: 1, dtype: object
"""df.loc[['1','3']] # 选取第1,3行
'''
a   b   c
1   jack    78  10
3   amy 97  20
'''df.loc['1': '3'] # 选取1到3行(范围选取)
"""a b   c
1   jack    78  10
2   lili    86  0
3   amy 97  20
"""

按行号列号进行读取

# 使用.iloc()操作
df.iloc[0] # 第1行
df.iloc[:, 1] # 第2列
df.iloc[0:2, 0:2] # 第1,2行, 第1,2列
df.iat[1,2] # 第2行第3列元素

任意读取

# 读取所有行和列
df.loc[:]
# 等价于 df[:]"""
a   b   c
1   jack    78  10
2   lili    86  0
3   amy 97  20
4   tom 100 30
"""# 读取指定某个元素, .at()方法效率更高
df.at['1','a']
# 等价于df.loc['1','a']
"""
'jack'
"""

pandas使用笔记(一)导入,查看,读取数据相关推荐

  1. R语言小白学习笔记3—R语言读取数据

    R语言小白学习笔记3-R语言读取数据 笔记链接 想说的话 学习笔记3-R语言读取数据 3.1 读取CSV文件 3.1.1 read_delim函数 3.1.2 fread函数 3.2 读取Excel数 ...

  2. pandas学习笔记(三):数据的变换与数据的管理

    注:学习笔记基于文彤老师的pandas的系列课程 课程链接:https://study.163.com/course/courseMain.htm?courseId=1005124008&sh ...

  3. pandas学习笔记三之处理丢失数据

  4. pandas 终极版1:创建和查看DataFrame数据 mysql读取数据

    在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame.Series类似于numpy中的一维数组,除了通吃一维数组可用的函数或方法,而且其可通过索引标签的方式获取数据, ...

  5. r导入txt乱码_R学习笔记系列—R语言从文本和Excel文件中读取数据-excel打开是乱码...

    1.4.1 从文本文件中导入数据 可以使用 read.table() 函数从带分隔符的文本文件中导入数.调用格式为: 这个函数看上去很复杂,但其实很多参数在使用时不用明确指出来,使用默认值可以满足绝大 ...

  6. pandas 按字符串肚脐眼 读取数据_十分钟学习pandas! pandas常用操作总结!

    学习Python, 当然少不了pandas,pandas是python数据科学中的必备工具,熟练使用pandas是从sql boy/girl 跨越到一名优秀的数据分析师傅的必备技能. 这篇pandas ...

  7. TensorFlow学习笔记(十一)读取自己的数据进行训练

    1. 线性关系 数据csv文件读取 x,y 1,2 4,5 6,11 3,6 4,7 5,12 7,13 10,21 11,23 24,50 45,89 50,101 55,111 60,123 70 ...

  8. pandas 不要编号 加一行_文科生带你学Python|Pandas读取数据

    16 2020-08 文科生带你学Python|Pandas读取数据 距离上一次更新时间有点久,原因么,被大佬的代码打击到了,于是回去自闭充了一波电-- LEARN MORE 图片来自网络,如侵删 向 ...

  9. python pandas 读取数据库_数据分析-pandas从数据库读取数据

    数据分析-pandas从数据库读取数据 使用pandas读取数据到DataFrame,对于只是数据分析来说,重点是读取数据,读取数据过程越简单越好,并不需要写得很复杂显得自己很厉害的样子.最好就是代码 ...

最新文章

  1. Shell脚本个例二
  2. php开发 linux作用是什么,linux有什么用?
  3. bootstrap轮播图自动播放响应式箭头居中
  4. VS2013导入opencv320配置属性文件
  5. c面试题总结(含答案)
  6. java web右键菜单,win7右键菜单管理
  7. 404. Sum of Left Leaves 左叶子之和
  8. 全局变量_Python函数中的全局变量与局部变量
  9. ASP.NET MVC Global.cs - 应用程序事件
  10. 查找树的指定层级_阿里面试,问了B+树,这个回答让我通过了
  11. java 怎么匹配文章_Java 14 之模式匹配,非常赞的一个新特性!
  12. linux mc服务器 mod_我的世界:mc有哪些不为人知的“内幕”?Hypixel停服事件的真相...
  13. SolrCloud Hello Word
  14. R的数据可视化,各种图表,常用统计量计算
  15. 遗传算法优化的bp神经网络_【首发推荐】农学:基于遗传BP神经网络的采摘机器人手眼标定研究...
  16. inline-block和float
  17. HTML小游戏15 —— 网页版3D反恐英雄(附完整源码)
  18. 同时使用网线以及无线上网
  19. Pooling Revisited: Your Receptive Field is Suboptimal 论文解读和感想
  20. MT4 CRM 系统开发(一)

热门文章

  1. MYSQL 自定义排序
  2. 在ubuntu下面安装glew
  3. 父类对象由子类实例化【转载】
  4. 20155201 实验四《Java面向对象程序设计》实验报告
  5. path、classpath理解
  6. [转]用android LinearLayout和RelativeLayout实现精确布局
  7. k-means算法实现python
  8. 二叉树——求先序排列(洛谷 P1030)
  9. android widget 发送广播,android-从应用程序向小部件发送数据
  10. libssl-dev linux下载,libssl