Series()   
#创建序列,类似一维数组,是pandas的基本数据结构
s = pd.Series([1, 2, 3], index=['a', 'b', 'c'])    #创建一个序列s,每个Series都会带有一个对应的index,用来标记不同的元素,index的内容不一定是数字,也可以是字母,中文等
print(s)

a    1
b    2
c    3
dtype: int64

DataFrame()   
#数据表格,类似一张二维的表格,它的每一列都是一个Series,是pandas的基本数据结构
d = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c'])    #创建一个表
print(d)

a  b  c
0  1  2  3
1  4  5  6

s = pd.Series([1, 2, 3], index=['a', 'b', 'c'])    #创建一个序列s,每个Series都会带有一个对应的index,用来标记不同的元素,index的内容不一定是数字,也可以是字母,中文等
d2 = pd.DataFrame(s)    #也可以用已有的序列来创建表格
print(d2)

0
a  1
b  2
c  3

DataFrame.head()    #默认预览前5行数据 d = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c'])    #创建一个表
print d.head(1)    #预览前1条数据

a  b  c
0  1  2  3

DataFrame.describe()    #数据基本统计量 d = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c'])    #创建一个表
print(d.describe())

a        b        c
count  2.00000  2.00000  2.00000
mean   2.50000  3.50000  4.50000
std    2.12132  2.12132  2.12132
min    1.00000  2.00000  3.00000
25%    1.75000  2.75000  3.75000
50%    2.50000  3.50000  4.50000
75%    3.25000  4.25000  5.25000
max    4.00000  5.00000  6.00000

read_excel()  #读取excel文件,创建DataFrame inputfile = '../data/catering_sale.xls'
data = pd.read_excel(inputfile)
print(type(data))

<class 'pandas.core.frame.DataFrame'>

read_csv()    #读取csv文件,创建DataFrame inputfile = '../data/catering_sale.csv'
data = pd.read_csvl(inputfile, encoding='utf-8')    #读取文本格式的数据,一般用encoding指定编码
DataFrame.iloc[start,stop,interval]    #取表中的行 print(data.iloc[0])    #取第一行数据

年龄        41.000000
教育         3.000000
工龄        17.000000
地址        12.000000
收入       176.000000
负债率        9.300000
信用卡负债     11.359392
其他负债       5.008608
违约         1.000000
Name: 0, dtype: float64

print(data.iloc[0:8])    #取值范围0-7

年龄  教育  工龄  地址   收入   负债率      信用卡负债       其他负债  违约
0  41   3  17  12  176   9.3  11.359392   5.008608   1
1  27   1  10   6   31  17.3   1.362202   4.000798   0
2  40   1  15  14   55   5.5   0.856075   2.168925   0
3  41   1  15  14  120   2.9   2.658720   0.821280   0
4  24   2   2   0   28  17.3   1.787436   3.056564   1
5  41   2   5   5   25  10.2   0.392700   2.157300   0
6  39   1  20   9   67  30.6   3.833874  16.668126   0
7  43   1  12  11   38   3.6   0.128592   1.239408   0

print(data.iloc[0:8:2])

年龄  教育  工龄  地址   收入   负债率      信用卡负债       其他负债  违约
0  41   3  17  12  176   9.3  11.359392   5.008608   1
2  40   1  15  14   55   5.5   0.856075   2.168925   0
4  24   2   2   0   28  17.3   1.787436   3.056564   1
6  39   1  20   9   67  30.6   3.833874  16.668126   0

print(data.iloc[:,:8])    #表示取8列数据,该表一供有9列

年龄  教育  工龄  地址   收入   负债率      信用卡负债       其他负债
0    41   3  17  12  176   9.3  11.359392   5.008608
1    27   1  10   6   31  17.3   1.362202   4.000798
2    40   1  15  14   55   5.5   0.856075   2.168925
3    41   1  15  14  120   2.9   2.658720   0.821280
4    24   2   2   0   28  17.3   1.787436   3.056564
5    41   2   5   5   25  10.2   0.392700   2.157300
6    39   1  20   9   67  30.6   3.833874  16.668126
7    43   1  12  11   38   3.6   0.128592   1.239408
8    24   1   3   4   19  24.4   1.358348   3.277652
9    36   1   0  13   25  19.7   2.777700   2.147300
10   27   1   0   1   16   1.7   0.182512   0.089488

print(data.iloc[:,8])    #表示取第9列的数据(列从0开始计数)

0      1
1      0
2      0
3      0
4      1
5      0
6      0
7      0
8      1
9      0
10     0

DataFrame.as_matrix()    #将表格转换位其编号数组表示
pandas 0.23.0开始建议使用values()代替
x = data.iloc[0:8:2].as_matrix()

[[ 41.         3.        17.        12.       176.         9.3
   11.359392   5.008608   1.      ]
 [ 40.         1.        15.        14.        55.         5.5
    0.856075   2.168925   0.      ]
 [ 24.         2.         2.         0.        28.        17.3
    1.787436   3.056564   1.      ]
 [ 39.         1.        20.         9.        67.        30.6
    3.833874  16.668126   0.      ]]

DateFrame.columns[index]    #index作为索引项取值 print(data.columns)    #取列

#Index([u'年龄', u'教育', u'工龄', u'地址', u'收入', u'负债率', u'信用卡负债', u'其他负债', u'违约'], dtype='object')

print(data.columns)[2,3,5,7]

工龄,地址,负债率,信用卡负债

pandas常用函数(更新中)相关推荐

  1. 【Python学习】常用函数(更新中……)

    系列文章目录 目录 系列文章目录 普通函数 一.输入输出函数 1. print()函数 2. input()函数 二.进制转换函数 1. bin(),oct(),hex()进制转换函数(带前缀) 2. ...

  2. SQL Server常用函数 -- 更新中

    1.截取字段:left(),right(),substring select 字段名, left(字段名, 2) from 表名 --截取字段内容的前四位 2.去除左右空格:ltrim()与rtrim ...

  3. pandas 常用函数整理

    pandas常用函数整理,作为个人笔记. 仅标记函数大概用途做索引用,具体使用方式请参照pandas官方技术文档. 约定 from pandas import Series, DataFrame im ...

  4. pandas常用函数说明及速查表

    pandas常用函数说明及速查表 如果你用python做开发,那么几乎肯定会使用pandas库. Pandas 是 Python 语言的一个扩展程序库,用于数据分析. Pandas 是一个开放源码.B ...

  5. blankcount函数python,Python pandas常用函数详解

    本文研究的主要是pandas常用函数,具体介绍如下. 1 import语句 2 文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名, ...

  6. 【Python】精选23个Pandas常用函数

    公众号:尤而小屋 作者:Peter 编辑:Peter 从26个字母中精选出23个Pandas常用的函数,将它们的使用方法介绍给大家.其中o.y.z没有相应的函数. import pandas as p ...

  7. 深度盘点:整理100个 Pandas 常用函数

    大家好,Pandas 是 Python 中最频繁.最受欢迎使用的模块之一,本文我将对 pandas 常用操作进行总结. 内容主要涉及:读取数据和保存数据.数据详情信息.数据处理.数据切片.筛选.排序. ...

  8. CDA学习之Pandas - 常用函数和75个高频操作

    目录 一.函数 1.1 常用函数 1.1.1 导⼊数据 1.1.2 导出数据 1.1.3 查看数据 1.1.4 数据选取 1.1.5 数据处理 1.1.6 数据分组和排序 1.1.7 数据合并 1.1 ...

  9. C++string类常用函数 c++中的string常用函数用法总结

    string类的构造函数: string(const char *s);    //用c字符串s初始化 string(int n,char c);     //用n个字符c初始化 此外,string类 ...

  10. mysqlsql常用函数_MySQL中的常用函数

    在MySQL中,函数不仅可以出现在select语句及其子句中,而且还可以出现在update.delete语句中. 常用的函数有: 1. 字符串函数:主要用于处理字符串. 2. 数值函数:主要用于处理数 ...

最新文章

  1. iOS开发笔记-两种单例模式的写法
  2. leetcode--最长回文子串--python
  3. android canves rotate 详解
  4. java自学语法_Java自学笔记(一):基础知识
  5. Windows2008下搭建NFS实现windows空间提供linux使用
  6. 如何做好技术 Team Leader
  7. JS子元素oumouseover触发父元素onmouseout
  8. uniapp光标自动定义到文本框_解决这3个问题,你就敢使用自动编号了
  9. 一个简单的例子教会您使用javap
  10. 如何利用光衰减器测试光纤收发器的灵敏度?
  11. jQuery 1.6 中更新的几个功能
  12. 大牛用emacs还是vim_Emacs,Vim还是其他?
  13. 实现electron-bridge
  14. 开源PaaS Rainbond发布v3.7.2版本,帮助企业快速构建应用市场
  15. 解决属性名和字段名不一致的问题(Mybatis)
  16. struts2入门之action获取表单提交数据
  17. Just for fun--Linus
  18. 公司财务(书籍学习过程总结)
  19. Windows系统基础配置
  20. 【MySQL入门指北】第六篇 按条件筛选

热门文章

  1. Linux系统查看内存的几个小命令
  2. /proc/net/tcp中各项参数说明
  3. Android+微信 弹出层无法滚动?
  4. 前端捕捉轨迹_基于JavaScript实现每日签到打卡轨迹功能
  5. y电容如何选型_高压并联补偿电容器基础及运行管理
  6. select函数返回值_Vue学习笔记之函数、高阶函数、v-model的应用
  7. select自定义箭头样式
  8. java集合转js数值_前端js调用接口转换Map数组数据
  9. 代码管理_阿里巴巴自研代码管理平台技术解密
  10. 阿里云服务器和mysql的原理_mysql 数据库同步原理