本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

以下文章来源于菜J学Python ,作者小小明

最近遇到一个有点烧脑的需求,其实也不算烧脑,主要是判断条件过多,对于我这种记忆力差,内存小的人来说容易出现内存溢出导致大脑宕机。也可能是因为我还没有找到能减小大脑内存压力的方法。

先看看需求吧:

主要就是要根据左侧的表格自动生成右侧的Word统计报告,实际的各种可能性情况远比图中展示的要更加复杂。

好了,直接开始干代码吧!

1数据读取

importpandas as pd

df= pd.read_csv("11月份数据.csv", encoding='gbk')#当前统计月份

month = 11df= df.query('月份==@month')

df.head(10)

预览数据:

2异常数据过滤

查看缺失值数量:

pd.isnull(df).sum()

结果:

区域 0

月份 0

降雨量(mm) 0

降雨距平(mm)1观测站 0

dtype: int64

仅一个缺失值数据,可直接删除:

df.dropna(inplace=True)

3计算观测站降雨量相对往年的变化

计算降雨量比往年高,跟往年比无变化,以及比往年低的次数分别是多少:

rainfall_high = df.eval('`降雨距平(mm)` > 0').value_counts().get(True, 0)

rainfall_equal= df.eval('`降雨距平(mm)` == 0').value_counts().get(True, 0)

rainfall_low= df.eval('`降雨距平(mm)` < 0').value_counts().get(True, 0)print(rainfall_high, rainfall_equal, rainfall_low)13 1 18

上面的结果中rainfall_high表示降雨量比往年平均水平高的次数,rainfall_equal表示降雨量比往年平均水平持平的次数,rainfall_low表示降雨量比往年平均水平低的次数。

于是分情况讨论生成第一段的报告:

p1 = f"{month}月份"

if rainfall_low == 0 or rainfall_high ==0:if rainfall_equal !=0:

p1+= f"除{rainfall_equal}个观测站降雨量较往年无变化外,"

if rainfall_high ==0:

p1+= f"各气象观测站降雨量较往年均偏低。"

elif rainfall_low ==0:

p1+= f"各气象观测站降雨量较往年均偏高。"

else:#10%以内差异认为是持平

if rainfall_high > rainfall_low*1.1:

p1+= f"大部分气象观测站降雨量较往年偏高。"

elif rainfall_low > rainfall_high*1.1:

p1+= f"大部分气象观测站降雨量较往年偏低。"

else:

p1+= f"各气象观测站降雨量较往年整体持平。"p1

结果:

'11月份大部分气象观测站降雨量较往年偏低。'

4计算各区域降雨量的极值

再生成第二段的报告:

p2 = ""t= df['降雨量(mm)']

p2+= f"各区域降雨量在{t.min()}~{t.max()}mm之间,其中{df.loc[t.argmax(), '区域']}区域的降雨量最大,为{t.max()}mm。"p2

结果:

'各区域降雨量在0.0~16.0mm之间,其中51a45区域的降雨量最大,为16.0mm。'

5分观测站统计

让我脑袋疼的地方就是从这里的代码开始的,后面还有更复杂的需求就不公布了。

对每个观测站分别统计哪些区域偏高,哪些区域持平,哪些区域偏低:

p3s =[]for station, tmp in df.groupby('观测站'):

t= tmp['降雨量(mm)']

p3= f"各区域降雨量在{t.min()}~{t.max()}mm之间,"rainfall_high_mask= tmp.eval('`降雨距平(mm)` > 0')

rainfall_equal_mask= tmp.eval('`降雨距平(mm)` == 0')

rainfall_low_mask= tmp.eval('`降雨距平(mm)` < 0')

rainfall_high=rainfall_high_mask.value_counts().get(True, 0)

rainfall_equal=rainfall_equal_mask.value_counts().get(True, 0)

rainfall_low=rainfall_low_mask.value_counts().get(True, 0)#print(rainfall_high, rainfall_equal, rainfall_low)

if rainfall_low == 0 or rainfall_high ==0:if rainfall_equal !=0:

p3+= '除'p3+= '、'.join(tmp.loc[rainfall_equal_mask, '区域']+'区域')

p3+= "降雨量较往年无变化外,"

if rainfall_high ==0:

p3+= f"各区域降雨量均较往年偏低"

elif rainfall_low ==0:

p3+= f"各区域降雨量均较往年偏高"t= tmp['降雨距平(mm)'].abs()

p3+= f"{t.min()}~{t.max()}mm;"

else:if rainfall_equal !=0:

p3+= '除'p3+= '、'.join(tmp.loc[rainfall_equal_mask, '区域']+'区域')

p3+= "降雨量较往年无变化,"

#10%以内差异认为是持平

if rainfall_high > rainfall_low*1.1:if rainfall_equal ==0:

p3+= '除'p3+= '、'.join(tmp.loc[rainfall_low_mask, '区域']+'区域')

p3+= "降雨量较往年偏低"t= tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs()if t.shape[0] > 1:

p3+= f"{t.min()}~{t.max()}mm"

else:

p3+= f"{t.min()}mm"p3+= "外,"t= tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs()

p3+= f"其余各区域降雨量较往年偏高{t.min()}~{t.max()}mm;"

elif rainfall_low > rainfall_high*1.1:if rainfall_equal ==0:

p3+= '除'p3+= '、'.join(tmp.loc[rainfall_high_mask, '区域']+'区域')

p3+= "降雨量较往年偏高"t= tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs()if t.shape[0] > 1:

p3+= f"{t.min()}~{t.max()}mm"

else:

p3+= f"{t.min()}mm"p3+= "外,"t= tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs()

p3+= f"其余各区域降雨量较往年偏低{t.min()}~{t.max()}mm;"

else:if rainfall_equal !=0:

p3= p3[:-1]+'外,'p3+= f"各区域降雨量较往年偏高和偏低的数量持平,其中"p3+= '、'.join(tmp.loc[rainfall_low_mask, '区域']+'区域')

p3+= "降雨量较往年偏低"t= tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs()if t.shape[0] > 1:

p3+= f"{t.min()}~{t.max()}mm,"

else:

p3+= f"{t.min()}mm,"p3+= '、'.join(tmp.loc[rainfall_high_mask, '区域']+'区域')

p3+= "降雨量较往年偏高"t= tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs()if t.shape[0] > 1:

p3+= f"{t.min()}~{t.max()}mm;"

else:

p3+= f"{t.min()}mm;"p3s.append([station, p3])

p3s[-1][-1] = p3s[-1][-1][:-1]+"。"p3s

可能是我还没有想出较好的封装方式导致代码变得这么复杂,如果有巧妙解决这个问题的朋友,希望能够加菜J学Python交流群一起探讨。

6将组织好的文本写入到word中

Word模板文件docxtemplate.docx的内容:

一、{{ month }}月各气象观测站降雨量实况

(一)降水

{{ p1 }}

{{ p2 }}

{%p for station,p3 in p3s %}

{{ station }}:{{ p3 }}

{%p endfor %}

即:

Python渲染代码:

from docxtpl importDocxTemplate

tpl= DocxTemplate("docxtemplate.docx")

context={'month': month,'p1': p1,'p2': p2,'p3s': p3s,

}

tpl.render(context)

tpl.save("11月降雨量报告.docx")

执行完毕,得到Word统计分析报告:

python实现气象数据分析统计服_Python数据分析实战:降雨量统计分析报告分析相关推荐

  1. python爬虫餐饮行业数据分析统计服_Python数据分析实战,简单快速制作餐饮行业商业化报告...

    前些天有个朋友向我求救,他们公司最近要针对餐饮行业做数据分析,并为某些商家做出线上营销方案.但是他一头雾水,不知道该从哪方面下手. 我提醒他,是否先从商家的线上评价作为数据分析的入口例如美团.大众点评 ...

  2. python时间序列数据分析统计服_python数据分析之:时间序列二

    将Timestamp转换为Period 通过使用to_period方法,可以将由时间戳索引的Series和DataFrame对象转换为以时期索引 rng=pd.date_range('1/1/2000 ...

  3. Python数据分析实战:降雨量统计分析报告分析

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于菜J学Python ,作者小小明 最近遇到一个有点烧脑的需求,其实也不算烧pytho ...

  4. python做excel数据分析统计服_Python也能做到Excel那样,条件统计轻松解决工作需求...

    此系列文章收录在公众号中:数据大宇宙 > 数据处理 >E-pd 转发本文并私信我"python",即可获得Python资料以及更多系列文章(持续更新的) 经常听别人说 ...

  5. python excel 数据分析统计服_数据分析从入门到进阶(透彻讲解EXCEL.SQL.TABLEAU、PYTHON四项数据分析必会工具.免费提供1GB数据集...

    透彻讲解Excel.SQL.Tableau.Python四项数据分析必会工具,数据分析工作者的案头推荐工具书.系统介绍数据分析的策略.方法(数据分析之道):实例讲解引导.快速掌握数据分析工具(数据分析 ...

  6. python数据分析实况_Python数据分析实战:降雨量统计分析报告分析

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于菜J学Python ,作者小小明 最近遇到一个有点烧脑的需求,其实也不算烧脑,主要是 ...

  7. python软件设计数据分析统计服_Python 和 R 数据分析/挖掘工具互查

    写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种.当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到书签中. 如果大家还 ...

  8. python房价数据分析统计服_Python 爬取分析全国 12 个城市 4 万条房价信息,告诉你该怎样买房?...

    原标题:Python 爬取分析全国 12 个城市 4 万条房价信息,告诉你该怎样买房? 作者 | 月小水长 责编 | 伍杏玲通过分页.线程池.代理池等技术,快速爬取链家网近4万条在售二手房信息,速度可 ...

  9. python电商数据分析统计服_python爬虫学习:电商数据分析

    通常我们在使用爬虫的时候会爬取很多数据,而这些数据里边什么是有用的数据,什么是没用的数据这个是值得我们关注的,在这一篇文章里,我们将通过一个简单的爬虫,来去简单介绍下如何使用python来去做数据分析 ...

最新文章

  1. Color Picker like PhotoShop
  2. 《软技能:代码之外的生存指南》一一21.1 为什么博客如此重要
  3. 生成tfreocrds
  4. boost::mp11::mp_bind_back相关用法的测试程序
  5. python中索引是从什么开始_python索引从0开始,那负数索引算什么?三秋道果说python...
  6. MySQL为什么有时候会选错索引?
  7. day01 python基本概念
  8. input发送a.jax_与时俱进:在JAX-RS API中采用OpenAPI v3.0.0
  9. 4月1日被愚了吗,我就看看你们都比较都喜欢哪些教程?
  10. 使用Leaflet创建地图拓扑图
  11. 除了国内红海拼刀,移动 App 在海外能否挖到新机会?
  12. java awt run_JAVA教程 第五讲 AWT图形用户界面设计(一)
  13. 计算机word的函数怎么用,Word公式编辑器怎么使用,教您怎么使用
  14. CSDN刷博 - 最简单有效的方法
  15. 电子料盘 电容 物料标识识别
  16. 【CAD】CAD插件
  17. 温肯本科学习回忆录一:简述我的本科专业
  18. [上海博物馆全集列表]
  19. ESXi-6.7.0U3b nvme固态硬盘无法识别解决方法
  20. 【雷达通信】雷达探测项目仿真(Matlab代码实现)

热门文章

  1. 天津大学计算机科学学院夏令营,天津大学计算机科学与技术学院(专业学位)计算机技术保研夏令营...
  2. 数字化测图是利用计算机自动绘制地形图,运用VirtuoZo软件实现航空摄影测量数字化测图...
  3. 两物体的相对速度公式_最全物理公式合集,高考这一份就够了!
  4. oracle restart 静默安装,CentOS下静默安装Oracle 10.2.0.1.0
  5. java动态语言_java动态类型语言支持(三)
  6. axure中的拐弯箭头_Axure 8.0制作水平方向上一直来回移动的箭头
  7. php jquery ajax裁剪图照片,php+jquery+ajax无刷新图片上传裁切,模拟flash头像上传实例...
  8. php对称算法_php里简单的对称加密算法
  9. canal mysql重置_canal: 首先装完阿里的canal,然后数据库同步,仅供学习参考
  10. ios弧形进度条_ios 圆形进度条