目录

系列文章目录

一. 关于pandas库:

二. pandas库的安装

三. pandas的两种基本数据结构——Series 与 DataFrame(附代码)

四. pandas库的应用(附代码)

五. 总结


系列文章目录

第一章:python数据分析的钥匙——pandas库

第二章:python轻松实现数据可视化的法宝——matplotlib库


一. 关于pandas库:

pandas库是一个专门用来解决数据分析的库,主要有以下两大优势:

1)速度快:快速处理大型数据集;

2)效率高:提供大量高效处理数据的函数和方法;


二. pandas库的安装

1.打开命令行

 按住快捷键:Win+R,即可打开“运行”窗口,在“运行”窗口中输入:cmd,回车,即可打开命令行。

2.执行安装命令

在命令行中输入命令:python install pandas,回车。等待,即可安装完成Pandas库。


三. pandas的两种基本数据结构——Series 与 DataFrame(附代码)

3.1 Series主要用于存储一个序列这样一种数据:

Series 主要由一组数据及其对应的索引组成:

# 插入pandas库,以pd代称
import pandas as pd#声明一个Series对象
datas = pd.Series([1,0,2,1,2,3], index = ['white','white','blue','green','green','yellow'])#找出Series对象中所有不同元素
unique_datas = datas.unique()
#找出Series对象中所有不同元素并标记出现的次数
counts_datas = datas.value_counts()#判断所属关系,返回布尔值
isin_datas = datas.isin([0,3])
#判断所属关系,返回真实值
isin_datas1 = datas[datas.isin([0,3])]#Series对象可直接转化字典对象
mydict = {'red':2000, 'blue':1000, 'yellow':500, 'orange':1000}
myseries = pd.Series(mydict)#Series对象之间的运算(只对共有的对象运算,其他的对象的值均为NAN)
mydict1 = {'red':400, 'black':1000, 'yellow':1000, 'green':1000}
myseries1 = pd.Series(mydict1)
add_series = myseries + myseries1

datas

unique_datas

counts_datas

isin_datas

isin_datas1

myseries

add_series

3.2  DataFrame作为更复杂的数据结构,则用于存储多维数据:

           DataFrame对象是⼀种表格型的数据结构,包含⾏索引、列索引以及⼀组数据 :

# 插入pandas库,以pd代称
import pandas as pddata = {'color': ['blue', 'green', 'yellow', 'red', 'white'], 'object': ['ball', 'prn', 'pencil', 'paper', 'mug'],'price': [1.2, 1.0, 0.6, 0.9, 1.7]}#声明一个DataFrame对象
frame = pd.DataFrame(data)#选取指定列
frame2 = pd.DataFrame(data, columns=['object','price'])#给与标签作为DataFrame的索引
index_frame = pd.DataFrame(data, index=['one', 'two', 'three', 'four', 'five'])

frame

frame2

index_frame

frame_T

3.3 Series 和 DataFrame 知识总结


四. pandas库的应用(附代码)

4.1 pandas数据读写:

数据读写对数据分析非常重要,所以pandas库也有一组被称为I/O API的函数:

这些函数被分为完全对称的两大类:读写函数和写入函数(以下以txt文件举例)

# 插入pandas库,以pd代称
import pandas as pd# 读取txt文件
datas = pd.read_csv('text.txt', sep ='\D+', header = None, encoding = ' utf-8')
'''
'text.txt'是文件相对路径sep 是分隔符header 指表头(header = None表示无表头,读取文件时自动生成表头)
'''# 生成txt文件
datas.to_csv("result.xlsx")
# 生成excel文件
datas.to_excel("result.xlsx")

4.2 pandas数据处理

数据处理可以分为3个阶段:数据准备,数据转换,数据聚合

       4.2.1 数据准备

4.2.2 数据转换

        4.2.3 数据聚合


五. 总结

以上就是今天要讲的内容,本文简单介绍了pandas库的知识及应用,而数据分析以可以以pandas库为基础进行更多方便有效的分析研究,本文还未完结,希望大家多多支持。

欢迎大家留言一起讨论问题~~~

python数据分析的钥匙——pandas库相关推荐

  1. azw3 python数据分析 活用pandas库_Python数据分析 活用Pandas库 数据科学教程数据分析入门图书 Python编程入门数据处理...

    内容介绍 本书是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手.具体内容包括:Python及Pandas基础知识,加载和查看数据集,Pandas的DataFrame对象和 ...

  2. python数据分析与展示--Pandas库入门

    一.Pandas库的引用 Pandas是python第三方库,通过了高性能易用的数据类型和分析工具;Pandas库包含了Series,DataFrame两个数据类型,基于这两个数据类型可以实现基本,运 ...

  3. python数据分析 活用pandas库_Python数据分析:活用Pandas库:Pandas for everyone

    序 iv 前言 v 致谢 xi 关于作者 xiv 第 一部分 简介 1 第 1章 Pandas DataFrame基础知识 2 1.1 简介 2 1.2 加载数据集 3 1.3 查看列.行.单元格 5 ...

  4. python数据分析活用pandas库 pdf_Python数据分析:活用Pandas库

    献词 iii 序 iv 前言 v 致谢 xi 关于作者 xiv 第 一部分 简介 1 第 1章 Pandas DataFrame基础知识 2 1.1 简介 2 1.2 加载数据集 3 1.3 查看列. ...

  5. Python数据分析入门之pandas基础总结

    Pandas--"大熊猫"基础 Series Series: pandas的长枪(数据表中的一列或一行,观测向量,一维数组...) Series1 = pd.Series(np.r ...

  6. Python 数据分析三剑客之 Pandas(九):时间序列

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  7. Python 数据分析三剑客之 Pandas(一):认识 Pandas 及其 Series、DataFrame 对象

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  8. python数据分析方向的第三方库是_python数据分析方向的第三方库是什么

    python数据分析方向的第三方库是:1.Numpy:2.Pandas:3.SciPy:4.Matplotlib:5.Scikit-Learn:6.Keras:7.Gensim:8.Scrapy. 本 ...

  9. Python 数据分析三剑客之 Pandas(十):数据读写

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

最新文章

  1. is this mysql server_远程连接MySQL数据库报错:is not allowed to connect to this MYSQL server的解决办法...
  2. 数学建模第四节2020.4.24-5.3补
  3. websocket 之入门 (一)
  4. 厂办大集体改制不签字_许昌二印,磨砂技术被外国觊觎,老工人说烂在肚子里也不外漏...
  5. _临武县组合式桥梁伸缩缝F型伸缩缝—批发
  6. centos中安装、升级git
  7. java登录抓取网页_java模拟登录内部系统抓取网页内容
  8. JavaScript面向对象轻松入门之概述(demo by ES5、ES6、TypeScript)
  9. 空间点到空间直线的距离求解
  10. Golang 编译成DLL文件
  11. 钽电容和贴片电容的区别
  12. 使用LSTM神经网络+CTC loss识别freetype库生成的不定长验证码
  13. 使用mybatisPlus时,报错 Data truncation: Out of range value for column ‘id‘ at row 1
  14. 1小时,不会代码的我如何完成 网易云音乐 大作业网页制作?(IVX 第2篇)
  15. C语言经典项目之二——扫雷
  16. RK3128-Android7.1-IR-深度剖析
  17. 【转载】sdcard中平添文件总是提示Failed to push the item(s)Failed to push XXXXX.txt on emulato...
  18. 洛谷 P2327 [SCOI2005]扫雷
  19. 常用的英文缩写和短信缩写
  20. 2022-2028全球电脑备份软件行业调研及趋势分析报告

热门文章

  1. 考点图文详解 - 局域网与城域网(第四章)
  2. 六款窗口比较器电路设计原理
  3. CSP/NOIP 复赛注意点
  4. 登录中国专利电子申请网的正确姿势
  5. 极进网络将收购斑马技术的无线局域网业务并获蓝筹客户
  6. UCI on PUSCH 协议角度解析
  7. 1(基于SpringBoot)疫情下的在线办公签到系统-从零构建后端项目基础篇
  8. 顺丰快递代码表java_JAVA接入顺丰快递
  9. 基于马尔科夫吸收概率的显着区域检测_MAP(Saliency Region Detection Based on Markov Absorption Probabilities)
  10. Python 中的 import 语句使用