本文参考《利用python进行数据分析》的第五章 pandas入门python

1 pandas数据结构介绍

pandas有两种主要的数据结构:series和DataFrame

Series:一种相似于一维数组的对象,由一组数据(各类Numpy数据类型)以及一组与之对应的数据标签(索引)组成。

第一列为索引,从0开始,第二列为数据值。

能够经过values属性获取数组的表示形式,经过index属性获取索引对象:

索引能够本身定义:

能够经过索引,选取Series中单个或一组值:

进行numpy数组运算,都会保留索引和值之间的连接:

能够将Series当作是一个定长的有序字典, 它是索引值到数据值的一个映射,能够用在许多本来须要字典参数的函数中:

若是数据被存放在Python字典中,能够直接经过这个字典来建立Series:

若是只传入一个字典(上图),则Series中的索引就是原字典的键;若是传入index(下图),与索引匹配的值会被找出来并放到相应的位置,没有匹配的,则为NaN(缺失值)。

pandas的isnull和notnull能够检测确实数据,也可以使用b.isnull(), b.notnull(),效果同样:

Series的最重要的一个功能是:在算术运算中汇自动对齐不一样索引的数据

Series对象自己及索引都有一个name属性:

Series的索引能够经过赋值的方式就地修改(会把b.index.name删掉):

DataFrame:

DataFrame是一个表格型的数据结构,它含有一组有序的列:每列能够是不一样的值类型(数值、字符串、布尔值等)。DataFrame既有行索引,也有列索引,能够被看作由Series组成的字典(共用同一个索引)。

构建DataFrame最经常使用的方法是直接传入一个由等长列表或Numpy数组组成的字典:

DataFrame会自动加上索引,且所有列会被有序排列;若是须要列按照指定顺序排列,需指定列序号:

跟Series同样,若是传入的列在数据中找不到,就会产生NaN值:

将DataFrame的列获取为一个Series,返回的Series拥有原DataFrame相同的索引,且其name属性也被相应的设置好了;行也能够经过相应的位置或名称的方式获取,好比用索引字段ix:

列能够经过赋值的方式进行修改,能够赋值一个标量或者一组值:

将列表或数组赋值给某个列时,其长度必须跟DataFrame的长度匹配。若是赋值是一个Series,就会精确匹配DataFrame的索引,全部的空位都将被填上缺失值:

为不存在的列赋值会建立出一个新列;关键字del用于删除列:

警告:经过索引方式返回的列是相应数据的视图,而不是副本,所以对返回的Series所作的任何就地修改都会反应到源DadaFrame上。

另外一种常见的数据形式是嵌套字典,将他传入DataFrame,被解释为外层字典的键做为列,内层的键做为索引:

转置操做:

内层字典的键会被合并、排序以造成最终的索引。若是显式指定索引,则不会这样:

设置索引和列的名字:

索引对象

obj.index就是一个索引对象,不可修改。

python数据分析包pandas论文_python数据分析pandas包入门学习(一)pandas数据结构介绍...相关推荐

  1. python数据分析与挖掘论文_Python数据分析与挖掘实战 --对应的代码文件以及目录信息...

    CSDN下载: 哔哩哔哩视频:https://www.bilibili.com/vide... 文件夹 PATH 列表 卷序列号为 4E8D-6931 C:. │ .txt │ Python数据分析与 ...

  2. python数据可视化课程论文_Python数据分析与数据可视化选修课答案

    What do you think ___________?[ ]A. he will happenB. will happen to himC. he happensD. happen to him ...

  3. python中df是什么_python数据分析之pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]...

    1 引言 Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用.本文主要介绍Pandas的几种数据选取的方法. Pandas中,数据主要保存为Dataframe和Se ...

  4. python数据分析第三方库是_python数据分析复盘——数据分析相关库之Pandas

    编辑推荐: 本文来源csdn,本文主要对Python的第三方库Pandas,进行高性能易用数据类型和分析. 1.Pandas 简介 1.1 pandas是什么 Pandas是Python第三方库,提供 ...

  5. pythonmysql数据分析_Python操作Mysql数据库入门——数据导入pandas(数据分析准备)...

    原标题:Python操作Mysql数据库入门--数据导入pandas(数据分析准备) 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求 ...

  6. python数据分析基础 余本国_Python数据分析基础

    本书根据作者多年教学经验编写, 条理清楚, 内容深浅适中, 尽量让读者从实例出发, 结合课后练习, 少走弯路.本书涉及的内容主要包括Python数据类型与运算.流程控制及函数与类.Pandas库的数据 ...

  7. python做数据可视化视频_Python数据分析系列视频课程--玩转数据可视化

    matplotlib包是基于Python平台的统计绘图利器,是在python平台上完成数据可视化不可或缺的工具,而基于matplotlib进一步开发的seaborn,更是将数据呈现与可视化的可用性推到 ...

  8. python数据分析基础 阮敬_Python数据分析用到的几个重要的库

    NumPy NumPy(Numerical Python的简称)是Python科学计算的基础包.它提供了以下功能(不限于此):快速高效的多维数组对象ndarray. 用于对数组执行元素级计算以及直接对 ...

  9. python 银行数据分析_银行业务概述_Python数据分析行业案例课程--信用评分方法_数据挖掘与分析视频-51CTO学院...

    注意: 1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能. 2. 本课程的核心目的是协助学员学习具体业 ...

最新文章

  1. python学习第一模块练习
  2. 小小一招巧解任何电脑的开机密码,无需任何工具,无需放电
  3. python画图-如何用python画图
  4. DQN 笔记 State-action Value Function(Q-function)
  5. Linux-2.6.20的cs8900驱动分析
  6. Python包的相对导入时出现问题解决
  7. 计算机科学与技术班级口号八字,班级的八字口号
  8. java责任链设计模式 订单_Java责任链设计模式实例分析
  9. 后台拿webshell的常用方法总结
  10. 人脸识别测试维度定义(欢迎大家拍砖并补充谢谢!)
  11. Python中表达式和语句及for、while循环练习
  12. lvs+keepalived配置
  13. talib如何安装方法
  14. Mapping new ns http://schemas.android.com/repository/android/common/02 to old ns解决方法
  15. 提前还清房贷的感觉真好
  16. 前端白屏问题_首页白屏的引发的思考(一)
  17. 大数据要掌握哪些语言?怎样才能学好大数据?
  18. 这些年,我与Google不得不说的那些事儿
  19. 部署开源LWM2M服务器 leshan
  20. Android9.0新特性

热门文章

  1. alias命令的用法
  2. macOS mkv文件修改封装格式为mp4或mov
  3. 使用selenium登录知乎(这里采用使用社交账号微博账号登录)
  4. java根据模板导出word
  5. 使用PTR运算符的情况
  6. Web安全渗透学习-SQL注入
  7. C#利用zxing.net生成二维码和条形码并实现打印的功能
  8. R语言天气可视化应用
  9. 我的stm32学习——HC-SR04超声波测距模块
  10. Linux运维实战:CentOS7.6操作系统从入门到精通(6-10)