文件下载链接（csv）

文件下载

题目

Date表示价格调查的日期，AveragePrice表示当天的平均价格，region表示调查的城市。

彬彬想要获取2015-2018中纽约（“NewYork”）与芝加哥（“Chicago”）每月牛油果平均价格，并计算全美国的每月牛油果平均价格，画出3条折线图进行比较。
具体步骤如下：

导入模块、读取文件、并将字体设置为"Arial Unicode MS"
根据城市（“region”），将原数据分组、采样聚合，获取纽约和芝加哥两个城市每个月的牛油果平均价格
在这之后，以月份为x轴，绘制展示纽约牛油果每月均价的折线图，并将折线颜色设置为skyblue，标记点的样式设置为"o"，图例设置为"纽约价格水平"
同时，以月份为x轴，绘制展示芝加哥牛油果每月均价的折线图，并将折线颜色设置为blue，标记点的样式为"o"，图例设置为"芝加哥价格水平"
利用所学知识，计算全美国每个月的牛油果均价，并制作对应的折线图，将折线颜色设置为green，标记点的样式为"o"，图例设置为"全美价格水平"
最后，将x轴标题为"时间"，y轴标题设置为"价格水平"，图例显示在左上角

本人代码

import pandas as pd
import matplotlib.pyplot as pltdata = pd.read_csv("/Users/binbin/avocado.csv" )#设置字体
plt.rcParams["font.sans-serif"] = "Arial Unicode MS"#将Date转换为时间数据
data["Date"] = pd.to_datetime(data["Date"])
data = data.set_index("Date")
#根据region和时间分组
groupByRegion = data.groupby(data["region"]).resample("M").mean()#获取纽约和芝加哥两个城市每个月的牛油果平均价格
averagePriceNY = groupByRegion.loc["NewYork"]["AveragePrice"]
averagePriceCH = groupByRegion.loc["Chicago"]["AveragePrice"]#计算全美国每月的牛油果均价
averagePriceUSA = data.resample("M").mean()#以月份为x轴，绘制展示纽约牛油果每月均价的折线图，并将折线颜色设置为skyblue，marker设置为"o"，图例设置为"纽约价格水平"#NewYork
plt.plot(averagePriceNY.index, averagePriceNY, color="skyblue", marker="o", label="纽约价格水平")
plt.legend(loc="upper left")
plt.xlabel("时间")
plt.ylabel("价格水平")#Chicago
plt.plot(averagePriceCH.index, averagePriceCH, color="blue", marker="o", label="芝加哥价格水平")
plt.legend(loc="upper left")
plt.xlabel("时间")
plt.ylabel("价格水平")#America
plt.plot(averagePriceUSA.index, averagePriceUSA, color="green", marker="o", label="全美价格水平")
plt.legend(loc = "upper left")
plt.xlabel("时间")
plt.ylabel("价格水平")
plt.show()

方法解释

plt.rcParams["font.sans-serif"] = "Arial Unicode MS": 将字体设置为Arial Unicode MS
pd. to_datetime: 将str类型数据转换为datetime类型数据
data.set_index(): 将data中的某一列作为data新的行索引（index）
groupByRegion = data.groupby(data["region"]).resample("M").mean()：将data按照"region"分组，并以每月为单位重采样来计算每月的平均价格
averagePriceNY = groupByRegion.loc["NewYork"]["AveragePrice"]
averagePriceCH = groupByRegion.loc["Chicago"]["AveragePrice"]：将groupByRegion中行索引对应"NewYok"和"Chicago"的行分别截取出来，并根据列索引(columns)为"AveragePrice"来截取数据赋值

运行结果

Python数据分析分组聚合重采样典型例题及其解法相关推荐

python数据分析————数据聚合与分组运算
分组:使⽤特定的条件将原数据划分为多个组聚合:对每个分组中的数据执⾏某些操作,最后将计算的结果进⾏整合 groupby⽅法参数说明 by ⽤于确定进⾏分组的依据 axis 表⽰分组轴的⽅向 sor ...
python数据分析-分组把DataFrame列转行
问题:遇到了一个问题是需要根据DataFrame中的某一列把对应另一列的数据由列转为行. 一.数据展示 a = pd.DataFrame({'name1':['a','a','b','c','b',' ...
python pandas聚合_Python Pandas分组聚合的实现方法
Pycharm 鼠标移动到函数上,CTRL+Q可以快速查看文档,CTR+P可以看基本的参数. apply(),applymap()和map() apply()和applymap()是DataFrame ...
跟小白学Python数据分析——绘制仪表盘
本文继续采用PyEcharts v1.x版本进行绘制仪表盘. 注:PyEcharts分为 v0.5.x 和 v1.x 两个大版本,v0.5.x 和 v1.x 间不兼容,v0.5.x是基于Python2 ...
跟小白学Python数据分析——绘制水球图
本文继续采用PyEcharts v1.x版本进行绘制水球图. 注:PyEcharts分为 v0.5.x 和 v1.x 两个大版本,v0.5.x 和 v1.x 间不兼容,v0.5.x是基于Python2 ...
python数据分析及可视化（九）pandas数据规整（分组聚合、数据透视表、时间序列、数据分析流程）
作业拼接多个csv文件去除重复数据,重新索引自动挡和手动挡数目计算每个城市二手车数量统计每个汽车品牌平均售价价格(不是原价) 分组与聚合如下表所示,5行3列的表格,5种水果分别对应的名称, ...
【Python数据分析与处理实训03】 --- 酒类消费信息分析（数据分组聚合 group().agg()应用）
[Python数据分析与处理实训03] - 酒类消费信息分析(数据分组聚合 group().agg()应用) 探索酒类消费信息对于下面的数据集进行简单的一些数据的分析训练若需要源数据请私信~ 1 ...
python 数据分析（六）astype('category')按类别分组 + 分组聚合操作 + 透视表 + 交叉表 + excel表的数据处理
文章目录一.按照类别单独分类astype() 1. astype()用法二.时间操作 1. 第一种:直接利用to_datetime() 2. 第二种:Series.dt 三.分组聚合操作 1. 分 ...
Python数据分析pandas之分组统计透视表
Python数据分析pandas之分组统计透视表数据聚合统计 Padans里的聚合统计即是应用分组的方法对数据框进行聚合统计,常见的有min(最小).max(最大).avg(平均值).sum(求和) ...

Python数据分析分组聚合重采样典型例题及其解法

快速浏览

文件下载链接（csv）

题目

本人代码

方法解释

运行结果

Python数据分析分组聚合重采样典型例题及其解法相关推荐

最新文章

热门文章