为什么80%的码农都做不了架构师?>>>   

import pandas
import numpy# 通过传递一个 numpyarray,时间索引以及列标签来创建一个DataFrame:
dates = pandas.date_range("20180509", periods=6)
df = pandas.DataFrame(numpy.random.randn(6, 4), index=dates, columns=list('ABCD'))
print("时间索引以及列标签来创建一个DataFrame:", df, sep="\n")# 查看DataFrame中头部和尾部的行
print("头部行: ", df.head(), sep="\n")  # 不给定head()参数时,默认除最后一行都是头部
print("尾部行: ", df.tail(), sep="\n")  # 不给定tail()参数时,默认除第一行都是尾部
print("头部行第一行: ", df.head(1), sep="\n")
print("尾部行最后一行: ", df.tail(1), sep="\n")# 显示索引、列和底层的numpy数据
print("索引:", df.index, sep="\n")
print("列:", df.columns, sep="\n")
print("值:", df.values, sep="\n")# describe()函数对于数据的快速统计汇总
print("数据统计:", df.describe(), sep="\n")# 对数据的转置
print("对数据的转置: ", df.T, sep="\n")# 按轴进行排序
print("按轴进行排序: ", df.sort_index(axis=0, ascending=False), sep="\n")  # ascending 是否自增# 按值进行排序
print("按值进行排序: ", df.sort_values(by='B'), sep="\n")
"E:\Python 3.6.2\python.exe" F:/PycharmProjects/test.py
时间索引以及列标签来创建一个DataFrame:A         B         C         D
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
头部行: A         B         C         D
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
尾部行: A         B         C         D
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
头部行第一行: A         B         C         D
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
尾部行最后一行: A         B         C         D
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
索引:
DatetimeIndex(['2018-05-09', '2018-05-10', '2018-05-11', '2018-05-12','2018-05-13', '2018-05-14'],dtype='datetime64[ns]', freq='D')
列:
Index(['A', 'B', 'C', 'D'], dtype='object')
值:
[[-1.90006837 -0.20879388 -0.52303491  1.24045481][ 1.51227925 -2.28349377  0.60860861  1.02705302][-3.32067045 -0.26080686  0.50871488  0.6629095 ][ 0.33834299 -1.73573353  1.5007895  -0.95984505][ 1.99076464  0.21448643 -1.24493715 -0.25851535][-1.04445367  0.36077537 -0.65740657 -0.59349347]]
数据统计:A         B         C         D
count  6.000000  6.000000  6.000000  6.000000
mean  -0.403968 -0.652261  0.032122  0.186427
std    2.054919  1.091991  1.013014  0.912672
min   -3.320670 -2.283494 -1.244937 -0.959845
25%   -1.686165 -1.367002 -0.623814 -0.509749
50%   -0.353055 -0.234800 -0.007160  0.202197
75%    1.218795  0.108666  0.583635  0.936017
max    1.990765  0.360775  1.500790  1.240455
对数据的转置: 2018-05-09  2018-05-10  2018-05-11  2018-05-12  2018-05-13  2018-05-14
A   -1.900068    1.512279   -3.320670    0.338343    1.990765   -1.044454
B   -0.208794   -2.283494   -0.260807   -1.735734    0.214486    0.360775
C   -0.523035    0.608609    0.508715    1.500790   -1.244937   -0.657407
D    1.240455    1.027053    0.662909   -0.959845   -0.258515   -0.593493
按轴进行排序: A         B         C         D
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
按值进行排序: A         B         C         D
2018-05-10  1.512279 -2.283494  0.608609  1.027053
2018-05-12  0.338343 -1.735734  1.500790 -0.959845
2018-05-11 -3.320670 -0.260807  0.508715  0.662909
2018-05-09 -1.900068 -0.208794 -0.523035  1.240455
2018-05-13  1.990765  0.214486 -1.244937 -0.258515
2018-05-14 -1.044454  0.360775 -0.657407 -0.593493Process finished with exit code 0

转载于:https://my.oschina.net/gain/blog/1812981

数据挖掘 pandas基础入门之查看数据相关推荐

  1. 数据挖掘 pandas基础入门之操作

    为什么80%的码农都做不了架构师?>>>    统计 import pandas import numpy# 通过传递一个 numpyarray,时间索引以及列标签来创建一个Data ...

  2. pandas基础操作大全之数据合并

    在pandas 基础操作大全之数据读取&清洗&分析中介绍了pandas常见的数据处理操作,现在继续对pandas常用的数据合并操作做下介绍,便于大家快速了解,也方便后续需要时快速查询. ...

  3. Pandas基础入门(一)

    一.Pandas简介 Pandas是一个强大的分析结构化数据的工具集: (Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的函数和方法,能够快速便捷地处理数据) 它的使用 ...

  4. Pandas基础入门知识点总结

    目录 1.pandas 常用类 1.1 Series 1.1.1创建 Series 1.1.2 访问 Series 数据 1.1.3 更新.插入和删除 1.2 DataFrame 1.2.1 创建 D ...

  5. Python数据处理之pandas基础入门

    Pandas 是 Python 语言的一个扩展程序库,用于数据分析. Pandas 是一个开放源码.BSD 许可的库,提供高性能.易于使用的数据结构和数据分析工具. Pandas 名字衍生自术语 &q ...

  6. hadoop 单机单间_零基础入门hadoop大数据四——Hadoop框架前奏,JDK环境配置

    ~~~~~~~~~一天更新两篇~~~~~~ 一.本章节完成的内容 1.使用secureCRT工具连接linux主机(配置非常方便,方便粘贴) 2.上传安装包到linux上(用filezilla) 3. ...

  7. Linux编程基础——GDB(查看数据)

    查看栈信息 当程序被停住了,首先要确认的就是程序是在哪儿被断住的.这个一般是通过查看调用栈信息来看的.在gdb中,查看调用栈的命令是backtrace,可以简写为bt. (gdb) bt     #0 ...

  8. Python pandas基础入门

    一.简介 pandas是一个强大的Python数据分析的工具包,是基于NumPy构建 pandas的主要功能: 具备对其功能的数据结构DataFrame.Series 集成时间序列功能 提供丰富的教学 ...

  9. 数据科学包——pandas基础(处理丢失数据、统计、合并、分组)

    文章目录 一.处理丢失数据 1.为空值数据赋值 2.删除空数据行和列 3.填充所有缺失数据 4.判断是否有NaN值 二.统计 1.平均值.求和.累加和 2.shift函数 3.sub函数 4.appl ...

最新文章

  1. python编程问题--第四次
  2. Project evaluation failed including an error in afterEvaluate {}. Run with --stacktrace for details
  3. 一文详尽系列之逻辑回归
  4. 线性代数思维导图_线性代数入门级思维导图
  5. python爬虫实际应用_如何使用python爬虫论坛?
  6. 什么样的简历,面试官一看就知道多少水份!!!
  7. 【C++】获取二维数组的行和列
  8. python 字体颜色_Python字体颜色设置
  9. windwos11降级,重装Windows10
  10. wince +C#拼音码形成代码
  11. 【 开源计划 - Flutter组件 】 星星也可以如此闪耀 flutter_star
  12. 300ETF期权和50ETF期权的区别
  13. 2020-我的跑步之路
  14. 【计算机毕业设计】基于微信小程序的图书馆座位预约系统
  15. 【LSTM分类】基于双向长短时记忆(BiLSTM)实现数据分类含Matlab源码
  16. 解决Docker镜像缺少字体的问题
  17. 轻量级简约的自动采集小说程序源码
  18. Python 编程从入门到实践 11-3
  19. 头文件和源文件的连接
  20. 简易的网上购物商城首页设计流程

热门文章

  1. .Net页面的生命周期(ZZ)
  2. java web问题
  3. Android studio | From Zero To One —— Hello Android
  4. Ubuntu | ubuntu 中配置静态 IP
  5. 使用numpy遇到ValueError: The truth value of an array with more than one element is ambiguous
  6. C++: int int int * int**的区别、联系和用途
  7. _cdecl、_stdcall 、_fastcall、_thiscall 函数调用方式与区别
  8. 多线程和MsgWaitForMultipleObjects
  9. LoadMenu使用方法
  10. f2812的c语言与标准c语言,关于F2812中用C语言来实现中断的说明