Python数据分析:pandas玩转Excel(一)
文章目录
- 1 pandas简介
- 2 导入
- 3 使用
- 4 读取、写入
1 pandas简介
1.Pandas是什么?
Pandas是一个强大的分析结构化数据的工具集;
它的使用基础是Numpy(提供高性能的矩阵运算);
用于数据挖掘和数据分析,同时也提供数据清洗功能。
2.DataFrame
DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。
pandas 相当于 python 中 excel:它使用表(也就是 dataframe),能在数据上做各种变换,但还有其他很多功能。
class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
参数 | 意义 | 数据结构 |
---|---|---|
data | 需要被转换的数据 | ndarray (structured or homogeneous), Iterable, dict, or DataFrame |
index | 设置行索引 | Index or array-like |
columns | 设置列名 | Index or array-like |
dtype | 设置数据类型 | dtype, default None |
copy | 备份数据 | boolean, default False |
3.Series
它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。
4.pandas 网址
官网:https://pandas.pydata.org/
中文网:https://www.pypandas.cn/
2 导入
符号 | 含义 |
---|---|
df | 二维的表格型数据结构DataFrame |
s | 一维数组Series (一个一维的标签矩阵) |
还需要执行以下导入才能开始:
import pandas as pd
import numpy as np
3 使用
# 使用Pandas
>>> import pandas as pd
>>> df = pd.DataFrame()
>>> print(df)# 输出结果
Empty DataFrame
Columns: []
Index: []
4 读取、写入
import pandas as pddf = pd.read_excel("D:/项目/资料/People.xlsx") # 把文件读到内存中形成DataFrame
print(df.shape) # 读取文件行数和列数
print(df.columns) # 读取列名
print(df.head(3)) # 打印前3行
print(df.tail(3)) # 打印后3行df = pd.DataFrame({"ID":[1,2,3],"Name":["jack","小明","小红"]})
df = df.set_index("ID") # 把ID那一列当索引,并产生新的DataFramedf.to_excel("D:/项目/我爱你.xlsx") # 写入文件
print("Done!")
Python数据分析:pandas玩转Excel(一)相关推荐
- Python数据分析pandas之分组统计透视表
Python数据分析pandas之分组统计透视表 数据聚合统计 Padans里的聚合统计即是应用分组的方法对数据框进行聚合统计,常见的有min(最小).max(最大).avg(平均值).sum(求和) ...
- Python数据分析pandas之数据拼接与连接
Python数据分析pandas之数据拼接与连接 数据拼接处理 数据拼接处理指的是numpy.pandas里对数据的拼接.连接.合并等多种方法的概称.有时我们处理的数据会分很多步骤,而中间或者最终的结 ...
- Python数据分析pandas之dataframe初识
Python数据分析pandas之dataframe初识 声明与简介 pandas是一个基于python的.快速的.高效.灵活.易用的开源的数据处理.分析包(工具)..pandas构建在numpy之上 ...
- Python数据分析pandas之series初识
Python数据分析pandas之series初识 声明与简介 pandas是一个基于python的.快速的.高效.灵活.易用的开源的数据处理.分析包(工具)..pandas构建在numpy之上,它通 ...
- 【Python数据分析】Python3操作Excel(二) 一些问题的解决与优化
[Python数据分析]Python3操作Excel(二) 一些问题的解决与优化 参考文章: (1)[Python数据分析]Python3操作Excel(二) 一些问题的解决与优化 (2)https: ...
- Python数据分析pandas之多层高维索引
Python数据分析pandas之多层高维索引 DataFrame多层索引 多层索引简介 众所周知Pandas的Series和DataFrame存放的是一维和二维数组,那么想存放多维数组就得通过多层索 ...
- Python数据分析——Pandas基础:dt.datetime与pivot_table()数据透视表
系列文章目录 Chapter 1:创建与探索DF.排序.子集化:Python数据分析--Pandas基础入门+代码(一) Chapter 2:聚合函数,groupby,统计分析:Python数据分析- ...
- Python数据分析pandas入门(一)------十分钟入门pandas
Python数据分析基础 一.导入常用库 二.创建对象 三.查看数据 四.选取 五.通过标签选取 六.通过位置选取 七.布尔索引 八.赋值 九.缺失值处理 十.运算与统计 十一.Apply函数的作用 ...
- 【学习笔记】python数据分析-Pandas
目录 pandas数据结构 创建Series数据 创建DataFrame数据 pandas的索引操作 重新索引 更换索引 索引选取 选取行 选取列 布尔选择 pandas的增删改 增加行或列 删除行或 ...
- python填写excel-Python玩转Excel的读写改实例
摘要: 利用xlrd读取excel 利用xlwt写excel 利用xlutils修改excel 利用xlrd读取excel 先需要在命令行中pip install xlrd:读取xls文件的流程为: ...
最新文章
- linux驱动:音频驱动(六)ASoc之codec设备
- Linux+Oracle+12c+RAC+安装配置详细-GI安装
- SpringCloud Zuul(八)之ERROR Filter
- 非IT人士的云栖酱油之行 (程序猿迷妹的云栖之行)
- as3 physaxe 2d 物理引擎
- 【POI1999codevs3634】积水,关于sunshine爷的NOIP(suan)水(ge)题(pi)赛
- 利用JS实现 TABLE的分页
- char强制类型转换为int_常量、变量、基本数据类型转换、和运算符
- python选股并导入通达信自选股
- 恩智浦智能车入门——一定避免那些坑
- QTreeWidget 设置图片以及图片大小
- 仿CAD画椭圆弧步骤思路(附加代码)
- RAID - 提升IO性能及数据安全
- android apk很大,从Android Studio生成的Apk文件太大
- USB无线网卡和PCI-E无线网卡如何选择?
- A-Level商务例题解析及练习
- 8583协议报文例子。
- KEIL MDK中的RO、RW和ZI
- 短语、直接短语、句柄、素短语
- 迭代阈值图像分割matlab,Matlab 图像分割 (阈值处理)
热门文章
- PAT乙级(1037 在霍格沃茨找零钱 )
- android listview的理解,Android ListView的理解
- r语言数据变量分段_使用R语言实现数据分段
- c扩展php 对象,PHP扩展开发之面向对象
- python使用ide_python使用什么ide?[关闭]
- 昇腾CANN论文上榜CVPR,全景图像生成算法交互性再增强
- 4种Spring Boot 实现通用 Auth 认证方式
- 即使不会node.js,拖拽就可完成数据的可视化展示
- 这些都是当年在C/C++上折的地儿…
- 共享共建会让中国的5G加速吗?