数据挖掘 pandas基础入门之查看数据

为什么80%的码农都做不了架构师？>>>

import pandas
import numpy# 通过传递一个 numpyarray，时间索引以及列标签来创建一个DataFrame：
dates = pandas.date_range("20180509", periods=6)
df = pandas.DataFrame(numpy.random.randn(6, 4), index=dates, columns=list('ABCD'))
print("时间索引以及列标签来创建一个DataFrame:", df, sep="\n")# 查看DataFrame中头部和尾部的行
print("头部行: ", df.head(), sep="\n")  # 不给定head()参数时，默认除最后一行都是头部
print("尾部行: ", df.tail(), sep="\n")  # 不给定tail()参数时，默认除第一行都是尾部
print("头部行第一行: ", df.head(1), sep="\n")
print("尾部行最后一行: ", df.tail(1), sep="\n")# 显示索引、列和底层的numpy数据
print("索引：", df.index, sep="\n")
print("列：", df.columns, sep="\n")
print("值：", df.values, sep="\n")# describe()函数对于数据的快速统计汇总
print("数据统计：", df.describe(), sep="\n")# 对数据的转置
print("对数据的转置: ", df.T, sep="\n")# 按轴进行排序
print("按轴进行排序: ", df.sort_index(axis=0, ascending=False), sep="\n")  # ascending 是否自增# 按值进行排序
print("按值进行排序: ", df.sort_values(by='B'), sep="\n")

"E:\Python 3.6.2\python.exe" F:/PycharmProjects/test.py
时间索引以及列标签来创建一个DataFrame:A         B         C         D
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
头部行: A         B         C         D
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
尾部行: A         B         C         D
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
头部行第一行: A         B         C         D
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
尾部行最后一行: A         B         C         D
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
索引：
DatetimeIndex(['2018-05-09', '2018-05-10', '2018-05-11', '2018-05-12','2018-05-13', '2018-05-14'],dtype='datetime64[ns]', freq='D')
列：
Index(['A', 'B', 'C', 'D'], dtype='object')
值：
[[-1.90006837 -0.20879388 -0.52303491  1.24045481][ 1.51227925 -2.28349377  0.60860861  1.02705302][-3.32067045 -0.26080686  0.50871488  0.6629095 ][ 0.33834299 -1.73573353  1.5007895  -0.95984505][ 1.99076464  0.21448643 -1.24493715 -0.25851535][-1.04445367  0.36077537 -0.65740657 -0.59349347]]
数据统计：A         B         C         D
count  6.000000  6.000000  6.000000  6.000000
mean  -0.403968 -0.652261  0.032122  0.186427
std    2.054919  1.091991  1.013014  0.912672
min   -3.320670 -2.283494 -1.244937 -0.959845
25%   -1.686165 -1.367002 -0.623814 -0.509749
50%   -0.353055 -0.234800 -0.007160  0.202197
75%    1.218795  0.108666  0.583635  0.936017
max    1.990765  0.360775  1.500790  1.240455
对数据的转置: 2018-05-09  2018-05-10  2018-05-11  2018-05-12  2018-05-13  2018-05-14
A   -1.900068    1.512279   -3.320670    0.338343    1.990765   -1.044454
B   -0.208794   -2.283494   -0.260807   -1.735734    0.214486    0.360775
C   -0.523035    0.608609    0.508715    1.500790   -1.244937   -0.657407
D    1.240455    1.027053    0.662909   -0.959845   -0.258515   -0.593493
按轴进行排序: A         B         C         D
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
按值进行排序: A         B         C         D
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493Process finished with exit code 0

转载于:https://my.oschina.net/gain/blog/1812981

数据挖掘 pandas基础入门之查看数据相关推荐

数据挖掘 pandas基础入门之操作
为什么80%的码农都做不了架构师?>>> 统计 import pandas import numpy# 通过传递一个 numpyarray,时间索引以及列标签来创建一个Data ...
pandas基础操作大全之数据合并
在pandas 基础操作大全之数据读取&清洗&分析中介绍了pandas常见的数据处理操作,现在继续对pandas常用的数据合并操作做下介绍,便于大家快速了解,也方便后续需要时快速查询. ...
Pandas基础入门(一)
一.Pandas简介 Pandas是一个强大的分析结构化数据的工具集: (Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的函数和方法,能够快速便捷地处理数据) 它的使用 ...
Pandas基础入门知识点总结
目录 1.pandas 常用类 1.1 Series 1.1.1创建 Series 1.1.2 访问 Series 数据 1.1.3 更新.插入和删除 1.2 DataFrame 1.2.1 创建 D ...
Python数据处理之pandas基础入门
Pandas 是 Python 语言的一个扩展程序库,用于数据分析. Pandas 是一个开放源码.BSD 许可的库,提供高性能.易于使用的数据结构和数据分析工具. Pandas 名字衍生自术语 &q ...
hadoop 单机单间_零基础入门hadoop大数据四——Hadoop框架前奏，JDK环境配置
~~~~~~~~~一天更新两篇~~~~~~ 一.本章节完成的内容 1.使用secureCRT工具连接linux主机(配置非常方便,方便粘贴) 2.上传安装包到linux上(用filezilla) 3. ...
Linux编程基础——GDB（查看数据）
查看栈信息当程序被停住了,首先要确认的就是程序是在哪儿被断住的.这个一般是通过查看调用栈信息来看的.在gdb中,查看调用栈的命令是backtrace,可以简写为bt. (gdb) bt #0 ...
Python pandas基础入门
一.简介 pandas是一个强大的Python数据分析的工具包,是基于NumPy构建 pandas的主要功能: 具备对其功能的数据结构DataFrame.Series 集成时间序列功能提供丰富的教学 ...
数据科学包——pandas基础（处理丢失数据、统计、合并、分组）
文章目录一.处理丢失数据 1.为空值数据赋值 2.删除空数据行和列 3.填充所有缺失数据 4.判断是否有NaN值二.统计 1.平均值.求和.累加和 2.shift函数 3.sub函数 4.appl ...

数据挖掘 pandas基础入门之查看数据

数据挖掘 pandas基础入门之查看数据相关推荐

最新文章

热门文章