七月在线之python数据处理

  • python常用导入函数
  • ndarray
    • np之常用函数创建
    • ndarray之聚合操作
  • pandas
    • pandas之series
      • Series的创建
      • Series的索引和切片
  • 可视化

python常用导入函数

from IPython.display import display
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
from PIL import Image  import matplotlib.pyplot as plt
%matplotlib inline  %config ZMQInteractiveShell.ast_node_interactivity='all'    # nootbook使用
from scipy import interp             # 线性插值

ndarray

np之常用函数创建

np.ones(shape, dtype=None, order=‘C’)
#ones–>创建指定长度或形状全部为1的数组
参数说明:
shape:维度
dtype:数据类型,默认是float
order: 可选规定返回数组元素在内存的存储顺序:看源码两个选项:{‘C’, ‘F’},
C(C语言)-rowmajor;F(Fortran《FormulaTranslation)的缩写,是一种编程语言》)column-major






ndarray之聚合操作

以三维数组求和为例:

%config ZMQInteractiveShell.ast_node_interactivity=‘all’
a = np.random.randint(0,10,size = [3,2,3])
a.shape
b = a.min(axis = 0) # 按三维,对应位置比较
c = a.min(axis = 1) # 按两维,行比较
d = a.min(axis = 2) # 按1维,列比较
e = a.min(axis = -1) # 按1维,列比较
display(b,c,d,e)

其他聚合操作:

 Function Name   NaN-safe Version    Descriptionnp.sum   np.nansum   Compute sum of elementsnp.prod  np.nanprod  Compute product of elementsnp.mean  np.nanmean  Compute mean of elementsnp.std  np.nanstd   Compute standard deviationnp.var    np.nanvar   Compute variancenp.min  np.nanmin   Find minimum valuenp.max    np.nanmax   Find maximum valuenp.argmin np.nanargmin    Find index of minimum valuenp.argmax    np.nanargmax    Find index of maximum valuenp.median    np.nanmedian    Compute median of elementsnp.percentile np.nanpercentile    Compute rank-based statistics of elementsnp.any N/A Evaluate whether any elements are truenp.all    N/A Evaluate whether all elements are truenp.power 幂运算

pandas

pandas之series

Series的创建

Series是一种类似与一维数组的对象,由下面两个部分组成:

values:一组数据(ndarray类型)
index:相关的数据索引标签

Series的索引和切片

 import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as plt%matplotlib inline # %matplotlib inline这一句是IPython的魔法函数,# 可以在IPython编译器里直接使用,作用是内嵌画图,省略掉plt.show()这一步,直接显示图像s = Series(nd,index = ['a','b','c','d','e'])# 显示索引s[['a','d']]s.loc[['a','d']]# 隐式索引s[[0,3]]s.iloc[[0,3]]# 以隐式索引为例,取一段连续的s.iloc[[0,1,2,3]]# 索引如果要取一段连续的值,就要多个索引,# 对索引稍加修改,去掉一个中括号,逗号改冒号,引入切片# 切片s['a':'d']#左闭右闭s.loc['a':'d']s[0:4]s.iloc[0:4]#左闭右开

执行结果:

后四行代码,运用切片方法

可视化

十分钟掌握Seaborn,进阶Python数据可视化分析:https://zhuanlan.zhihu.com/p/49035741

matlplob官网:https://matplotlib.org/api/_as_gen/matplotlib.pyplot.plot.html#matplotlib.pyplot.plot

matlplob中文文档:https://www.matplotlib.org.cn/tutorials/introductory/usage.html

Matplotlib可视化最有价值的 50 个图表http://liyangbit.com/pythonvisualization/matplotlib-top-50-visualizations/

Python之pandas,series,可视化相关推荐

  1. Python库Pandas数据可视化实战案例

    >关注公众号:大数据技术派,回复`资料`,领取`1024G`资料. 数据可视化可以让我们很直观的发现数据中隐藏的规律,察觉到变量之间的互动关系,可以帮助我们更好的给他人解释现象,做到一图胜千文的 ...

  2. python数据分析图_Python数据分析:手把手教你用Pandas生成可视化图表的教程

    大家都知道,Matplotlib 是众多 Python 可视化包的鼻祖,也是Python最常用的标准可视化库,其功能非常强大,同时也非常复杂,想要搞明白并非易事.但自从Python进入3.0时代以后, ...

  3. 【Python基础】Pandas数据可视化原来也这么厉害

    一.可视化概述 在Python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易. seaborn:是建构于matplot ...

  4. pandas to_csv参数详解_【Python基础】Pandas数据可视化原来也这么厉害

    一.可视化概述 在Python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易. seaborn:是建构于matplot ...

  5. python使用pandas模块介绍以及使用,dataframe结构,Series结构,基本数据操作,DataFrame运算,pandas画图,存储,缺失值处理,离散化,合并

    目录 1 pandas介绍 1.1 Pandas介绍 1.2 为什么使用Pandas 1.3 案例:在numpy当中创建的股票涨跌幅数据形式 1.4 DataFrame 1.4.1 DataFrame ...

  6. Python中的数据可视化工具与方法——常用的数据分析包numpy、pandas、statistics的理解实现和可视化工具matplotlib的使用

    Python中的数据可视化工具与方法 本文主要总结了: 1.本人在初学python时对常用的数据分析包numpy.pandas.statistics的学习理解以及简单的实例实现 2.可视化工具matp ...

  7. AI算法工程师 | 03人工智能基础-Python科学计算和可视化(三)Pandas

    文章目录 Python 之 数据处理分析模块 Pandas 一.Pandas 开发环境搭建 二.Pandas 数据类型 1. Series 对象创建 2. DataFrame 对象创建 3. 获取 S ...

  8. python数据分析pandas画图_Pandas数据可视化基础绘图教程

    众所周知,Pandas是基于Python平台的大数据分析与处理的利器.在数据为王的时代,想要掌握数据分析能力,学会Pandas数据可视化工具是十分重要的.本文将带领大家一步一步学习Pandas数据可视 ...

  9. Seaborn可视化使用relplot函数可视化数据长度不同的时间序列实战:two Pandas Series of different lengths

    Seaborn可视化使用relplot函数可视化数据长度不同的时间序列实战:two Pandas Series of different lengths 目录

  10. python使用pandas通过聚合获取时序数据的最后一个指标数据(例如长度指标、时间指标)生成标签并与原表连接(join)进行不同标签特征的可视化分析

    python使用pandas通过聚合获取时序数据的最后一个指标数据(例如长度指标.时间指标)生成标签并与原表连接(join)进行不同标签特征的可视化分析 目录

最新文章

  1. vc++给控件添加消息和函数
  2. acwing算法题--多重背包问题二
  3. mysql8.0.17下载教程_mysql 8.0.17 安装配置图文教程
  4. Android开发遇到手机无法弹出Toast
  5. go语言第一个程序-hello world
  6. java中sesion
  7. git add -A 、git add -u 、 git add . 三种区别
  8. 插入始终是1_OneNote使用小记(1)——针对PPT做笔记及最合适的PPT插入方式
  9. 全球知名大学课件下载地址汇总
  10. 灰度MANA信托增持729.04万MANA,FIL持仓增长185%
  11. vc mscomm串口通信使用了CButtonST按钮类软件分析
  12. 360浏览器清凉新版让手机解暑
  13. 关于.NET内存中的堆和栈
  14. BOS v2.0后台管理系统 JQuery Easyui 相关知识讲解
  15. MCU设计电路的总结
  16. 拼多多商品详情百亿补贴数据采集接口代码展示
  17. sails 数据库字段
  18. linux crontab : mailed 85 bytes of output but got status 0x004b#012 问题
  19. 量子技术将如何颠覆未来战争形态
  20. 团体程序设计天梯赛 -- 练习集 (L1合集)

热门文章

  1. string:删除string中指定位置的字符?指定的所有字符?
  2. vue分页+spring boot +分页插件pagehelper
  3. 在MySQL中保存Java对象_java对象储存到数据库
  4. 简易航空订票系统_基于C++实现简易航空票务,飞机订票系统!
  5. 机器人瓦力漫威_86、机器人瓦力
  6. 山东专升本access知识点_专升本计算机速背知识点(十八)
  7. 数据中心运营商如何选择合适的蓄电池
  8. 云数据中心异构资源管理大有可为
  9. 成功解决RuntimeError: filter weights array has incorrect shape.
  10. DL之GoogleNet:GoogleNet(InceptionV1)算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略