数据挖掘 pandas基础入门之查看数据
为什么80%的码农都做不了架构师?>>>
import pandas
import numpy# 通过传递一个 numpyarray,时间索引以及列标签来创建一个DataFrame:
dates = pandas.date_range("20180509", periods=6)
df = pandas.DataFrame(numpy.random.randn(6, 4), index=dates, columns=list('ABCD'))
print("时间索引以及列标签来创建一个DataFrame:", df, sep="\n")# 查看DataFrame中头部和尾部的行
print("头部行: ", df.head(), sep="\n") # 不给定head()参数时,默认除最后一行都是头部
print("尾部行: ", df.tail(), sep="\n") # 不给定tail()参数时,默认除第一行都是尾部
print("头部行第一行: ", df.head(1), sep="\n")
print("尾部行最后一行: ", df.tail(1), sep="\n")# 显示索引、列和底层的numpy数据
print("索引:", df.index, sep="\n")
print("列:", df.columns, sep="\n")
print("值:", df.values, sep="\n")# describe()函数对于数据的快速统计汇总
print("数据统计:", df.describe(), sep="\n")# 对数据的转置
print("对数据的转置: ", df.T, sep="\n")# 按轴进行排序
print("按轴进行排序: ", df.sort_index(axis=0, ascending=False), sep="\n") # ascending 是否自增# 按值进行排序
print("按值进行排序: ", df.sort_values(by='B'), sep="\n")
"E:\Python 3.6.2\python.exe" F:/PycharmProjects/test.py
时间索引以及列标签来创建一个DataFrame:A B C D
2018-05-09 -1.900068 -0.208794 -0.523035 1.240455
2018-05-10 1.512279 -2.283494 0.608609 1.027053
2018-05-11 -3.320670 -0.260807 0.508715 0.662909
2018-05-12 0.338343 -1.735734 1.500790 -0.959845
2018-05-13 1.990765 0.214486 -1.244937 -0.258515
2018-05-14 -1.044454 0.360775 -0.657407 -0.593493
头部行: A B C D
2018-05-09 -1.900068 -0.208794 -0.523035 1.240455
2018-05-10 1.512279 -2.283494 0.608609 1.027053
2018-05-11 -3.320670 -0.260807 0.508715 0.662909
2018-05-12 0.338343 -1.735734 1.500790 -0.959845
2018-05-13 1.990765 0.214486 -1.244937 -0.258515
尾部行: A B C D
2018-05-10 1.512279 -2.283494 0.608609 1.027053
2018-05-11 -3.320670 -0.260807 0.508715 0.662909
2018-05-12 0.338343 -1.735734 1.500790 -0.959845
2018-05-13 1.990765 0.214486 -1.244937 -0.258515
2018-05-14 -1.044454 0.360775 -0.657407 -0.593493
头部行第一行: A B C D
2018-05-09 -1.900068 -0.208794 -0.523035 1.240455
尾部行最后一行: A B C D
2018-05-14 -1.044454 0.360775 -0.657407 -0.593493
索引:
DatetimeIndex(['2018-05-09', '2018-05-10', '2018-05-11', '2018-05-12','2018-05-13', '2018-05-14'],dtype='datetime64[ns]', freq='D')
列:
Index(['A', 'B', 'C', 'D'], dtype='object')
值:
[[-1.90006837 -0.20879388 -0.52303491 1.24045481][ 1.51227925 -2.28349377 0.60860861 1.02705302][-3.32067045 -0.26080686 0.50871488 0.6629095 ][ 0.33834299 -1.73573353 1.5007895 -0.95984505][ 1.99076464 0.21448643 -1.24493715 -0.25851535][-1.04445367 0.36077537 -0.65740657 -0.59349347]]
数据统计:A B C D
count 6.000000 6.000000 6.000000 6.000000
mean -0.403968 -0.652261 0.032122 0.186427
std 2.054919 1.091991 1.013014 0.912672
min -3.320670 -2.283494 -1.244937 -0.959845
25% -1.686165 -1.367002 -0.623814 -0.509749
50% -0.353055 -0.234800 -0.007160 0.202197
75% 1.218795 0.108666 0.583635 0.936017
max 1.990765 0.360775 1.500790 1.240455
对数据的转置: 2018-05-09 2018-05-10 2018-05-11 2018-05-12 2018-05-13 2018-05-14
A -1.900068 1.512279 -3.320670 0.338343 1.990765 -1.044454
B -0.208794 -2.283494 -0.260807 -1.735734 0.214486 0.360775
C -0.523035 0.608609 0.508715 1.500790 -1.244937 -0.657407
D 1.240455 1.027053 0.662909 -0.959845 -0.258515 -0.593493
按轴进行排序: A B C D
2018-05-14 -1.044454 0.360775 -0.657407 -0.593493
2018-05-13 1.990765 0.214486 -1.244937 -0.258515
2018-05-12 0.338343 -1.735734 1.500790 -0.959845
2018-05-11 -3.320670 -0.260807 0.508715 0.662909
2018-05-10 1.512279 -2.283494 0.608609 1.027053
2018-05-09 -1.900068 -0.208794 -0.523035 1.240455
按值进行排序: A B C D
2018-05-10 1.512279 -2.283494 0.608609 1.027053
2018-05-12 0.338343 -1.735734 1.500790 -0.959845
2018-05-11 -3.320670 -0.260807 0.508715 0.662909
2018-05-09 -1.900068 -0.208794 -0.523035 1.240455
2018-05-13 1.990765 0.214486 -1.244937 -0.258515
2018-05-14 -1.044454 0.360775 -0.657407 -0.593493Process finished with exit code 0
转载于:https://my.oschina.net/gain/blog/1812981
数据挖掘 pandas基础入门之查看数据相关推荐
- 数据挖掘 pandas基础入门之操作
为什么80%的码农都做不了架构师?>>> 统计 import pandas import numpy# 通过传递一个 numpyarray,时间索引以及列标签来创建一个Data ...
- pandas基础操作大全之数据合并
在pandas 基础操作大全之数据读取&清洗&分析中介绍了pandas常见的数据处理操作,现在继续对pandas常用的数据合并操作做下介绍,便于大家快速了解,也方便后续需要时快速查询. ...
- Pandas基础入门(一)
一.Pandas简介 Pandas是一个强大的分析结构化数据的工具集: (Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的函数和方法,能够快速便捷地处理数据) 它的使用 ...
- Pandas基础入门知识点总结
目录 1.pandas 常用类 1.1 Series 1.1.1创建 Series 1.1.2 访问 Series 数据 1.1.3 更新.插入和删除 1.2 DataFrame 1.2.1 创建 D ...
- Python数据处理之pandas基础入门
Pandas 是 Python 语言的一个扩展程序库,用于数据分析. Pandas 是一个开放源码.BSD 许可的库,提供高性能.易于使用的数据结构和数据分析工具. Pandas 名字衍生自术语 &q ...
- hadoop 单机单间_零基础入门hadoop大数据四——Hadoop框架前奏,JDK环境配置
~~~~~~~~~一天更新两篇~~~~~~ 一.本章节完成的内容 1.使用secureCRT工具连接linux主机(配置非常方便,方便粘贴) 2.上传安装包到linux上(用filezilla) 3. ...
- Linux编程基础——GDB(查看数据)
查看栈信息 当程序被停住了,首先要确认的就是程序是在哪儿被断住的.这个一般是通过查看调用栈信息来看的.在gdb中,查看调用栈的命令是backtrace,可以简写为bt. (gdb) bt #0 ...
- Python pandas基础入门
一.简介 pandas是一个强大的Python数据分析的工具包,是基于NumPy构建 pandas的主要功能: 具备对其功能的数据结构DataFrame.Series 集成时间序列功能 提供丰富的教学 ...
- 数据科学包——pandas基础(处理丢失数据、统计、合并、分组)
文章目录 一.处理丢失数据 1.为空值数据赋值 2.删除空数据行和列 3.填充所有缺失数据 4.判断是否有NaN值 二.统计 1.平均值.求和.累加和 2.shift函数 3.sub函数 4.appl ...
最新文章
- python编程问题--第四次
- Project evaluation failed including an error in afterEvaluate {}. Run with --stacktrace for details
- 一文详尽系列之逻辑回归
- 线性代数思维导图_线性代数入门级思维导图
- python爬虫实际应用_如何使用python爬虫论坛?
- 什么样的简历,面试官一看就知道多少水份!!!
- 【C++】获取二维数组的行和列
- python 字体颜色_Python字体颜色设置
- windwos11降级,重装Windows10
- wince +C#拼音码形成代码
- 【 开源计划 - Flutter组件 】 星星也可以如此闪耀 flutter_star
- 300ETF期权和50ETF期权的区别
- 2020-我的跑步之路
- 【计算机毕业设计】基于微信小程序的图书馆座位预约系统
- 【LSTM分类】基于双向长短时记忆(BiLSTM)实现数据分类含Matlab源码
- 解决Docker镜像缺少字体的问题
- 轻量级简约的自动采集小说程序源码
- Python 编程从入门到实践 11-3
- 头文件和源文件的连接
- 简易的网上购物商城首页设计流程
热门文章
- .Net页面的生命周期(ZZ)
- java web问题
- Android studio | From Zero To One —— Hello Android
- Ubuntu | ubuntu 中配置静态 IP
- 使用numpy遇到ValueError: The truth value of an array with more than one element is ambiguous
- C++: int int int * int**的区别、联系和用途
- _cdecl、_stdcall 、_fastcall、_thiscall 函数调用方式与区别
- 多线程和MsgWaitForMultipleObjects
- LoadMenu使用方法
- f2812的c语言与标准c语言,关于F2812中用C语言来实现中断的说明