知识点:

  • 动态数据抓包
  • requests发送请求
  • 结构化+非结构化数据解析

开发环境:

  • python 3.8 运行代码
  • pycharm 2021.2 辅助敲代码
  • requests

如果安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests)回车
  2. 在pycharm中点击Terminal(终端) 输入安装命令

代码实现:

  1. 发送请求
  2. 获取数据
  3. 解析数据
  4. 保存数据

采集天气数据代码

导入模块

源码.点击领取即可

import requests     # 第三方模块 提前安装  发送请求 (Python里面浏览器)  爆红是因为你没有安装模块
# 如果安装了 但还是爆红是因为什么呢? 解释器在pycharm里面配置的不对
import parsel
import csv
# 翻译插件
with open('天气.csv', mode='a', encoding='utf-8', newline='') as f:csv_writer = csv.writer(f)csv_writer.writerow(["日期", "最高温度", "最低温度", "天气", "风向", "城市"])
city_list = [54511, 58362, 59287, 59493]
for city in city_list:for year in range(2011, 2022):for month in range(1, 13):url = f'https://tianqi.2345.com/Pc/GetHistory?areaInfo%5BareaId%5D={city}&areaInfo%5BareaType%5D=2&date%5Byear%5D={year}&date%5Bmonth%5D={month}'

1. 发送请求

response = requests.get(url=url)
# <Response [200]>: 请求成功

2. 获取数据

# json数据传输格式
json_data = response.json()
# 字典类型数据

3.解析数据

 # 结构化数据解析html_data = json_data['data']selector = parsel.Selector(html_data)# 正则 css xpath json字典数据解析tr_list = selector.css('.history-table tr')# tr_list[1:] 从列表的第二个元素开始取for tr in tr_list[1:]:# <X>fhwaeuifhwiuf</X>td = tr.css('td::text').getall()if td[2] == '°':td[2] = td[1]if city == 54511:td.append("北京")elif city == 58362:td.append("上海")elif city == 59287:td.append("广州")elif city == 59493:td.append("深圳")print(td)# 文件名 写入方式 追加写入  编码方式 utf-8  数据空行with open('天气.csv', mode='a', encoding='utf-8', newline='') as f:csv_writer = csv.writer(f)csv_writer.writerow(td)

数据分析代码

导入包

源码.点击领取即可

import pandas as pd
import datetime
from pyecharts import options as opts
from pyecharts.charts import *
from pyecharts.commons.utils import JsCode

读入数据

data = pd.read_csv('天气.csv')
data

数据预览

data.sample(5)data.info()

分割日期/星期

data[['日期','星期']] = data['日期'].str.split(' ',expand=True,n=1)
data

去除多余字符

data[['最高温度','最低温度']] = data[['最高温度','最低温度']].apply(lambda x: x.str.replace('°',''))
data.head()

计算下雪天气

data.loc[data['天气'].str.contains('雪'),'下雪吗']='是'
data.fillna('否',inplace=True)

分割日期时间

data['日期'] = pd.to_datetime(data['日期'])
data[['最高温度','最低温度']] = data[['最高温度','最低温度']].astype('int')data['年份'] = data['日期'].dt.year
data['月份'] = data['日期'].dt.month
data['日'] = data['日期'].dt.day
# 预览
data.sample(5)

各城市初雪的时间

s_data = data[data['下雪吗']=='是']
s_data[(s_data['月份']>=9)].groupby('年份').first().reset_index()

各城市下雪天气分布

s_data.groupby(['城市','年份'])['日期'].count().to_frame('下雪天数').reset_index()

做透视表

data_bj = data[(data['年份'] == 2021) & (data['城市'] == '北京')]
data_bj = data_bj.groupby(['月份','天气'], as_index=False)['日期'].count()data_pivot =  pd.pivot(data_bj,values='日期',index='月份',columns='天气')
data_pivot = data_pivot.astype('float')
# 按照 索引年月倒序排序
data_pivot.sort_index(ascending=False,inplace=True)
data_pivot
python学习交流Q群:770699889 ### 源码领取

北上广深2021年10月份天气热力图分布

import matplotlib.pyplot as plt
import matplotlib.colors as mcolors
import seaborn as sns#设置全局默认字体 为 雅黑
plt.rcParams['font.family'] = ['Microsoft YaHei']
# 设置全局轴标签字典大小
plt.rcParams["axes.labelsize"] = 14
# 设置背景
sns.set_style("darkgrid",{"font.family":['Microsoft YaHei', 'SimHei']})
# 设置画布长宽 和 dpi
plt.figure(figsize=(18,8),dpi=100)
# 自定义色卡
cmap = mcolors.LinearSegmentedColormap.from_list("n",['#95B359','#D3CF63','#E0991D','#D96161','#A257D0','#7B1216'])
# 绘制热力图ax = sns.heatmap(data_pivot, cmap=cmap, vmax=30, annot=True, # 热力图上显示数值linewidths=0.5,)
# 将x轴刻度放在最上面
ax.xaxis.set_ticks_position('top')
plt.title('北京最近10个月天气分布',fontsize=16) #图片标题文本和字体大小
plt.show()data_gz= data[(data['年份'] == 2021) & (data['城市'] == '广州')]
data_gz = data_gz.groupby(['月份','天气'], as_index=False)['日期'].count()
data_sz= data[(data['年份'] == 2021) & (data['城市'] == '深圳')]
data_sz = data_sz.groupby(['月份','天气'], as_index=False)['日期'].count()
data_sh= data[(data['年份'] == 2021) & (data['城市'] == '上海')]
data_sh = data_sh.groupby(['月份','天气'], as_index=False)['日期'].count()python学习交流Q群:770699889 ### 源码领取
data_pivot_sz =  pd.pivot(data_sz,values='日期',index='月份',columns='天气')
data_pivot_sz = data_pivot_sz.astype('float')
# 按照 索引年月倒序排序
data_pivot_sz.sort_index(ascending=False,inplace=True)#设置全局默认字体 为 雅黑
plt.rcParams['font.family'] = ['Microsoft YaHei']
# 设置全局轴标签字典大小
plt.rcParams["axes.labelsize"] = 14
# 设置背景
sns.set_style("darkgrid",{"font.family":['Microsoft YaHei', 'SimHei']})
# 设置画布长宽 和 dpi
plt.figure(figsize=(18,8),dpi=100)
# 自定义色卡
cmap = mcolors.LinearSegmentedColormap.from_list("n",['#95B359','#D3CF63','#E0991D','#D96161','#A257D0','#7B1216'])
# 绘制热力图ax_sz = sns.heatmap(data_pivot_sz, cmap=cmap, vmax=31, annot=True, # 热力图上显示数值linewidths=0.5,)
# 将x轴刻度放在最上面
ax_sz.xaxis.set_ticks_position('top')
plt.title('深圳最近10个月天气分布',fontsize=16) #图片标题文本和字体大小
plt.show()data_pivot_gz =  pd.pivot(data_gz,values='日期',index='月份',columns='天气')
data_pivot_gz = data_pivot_gz.astype('float')
# 按照 索引年月倒序排序
data_pivot_gz.sort_index(ascending=False,inplace=True)#设置全局默认字体 为 雅黑
plt.rcParams['font.family'] = ['Microsoft YaHei']
# 设置全局轴标签字典大小
plt.rcParams["axes.labelsize"] = 14
# 设置背景
sns.set_style("darkgrid",{"font.family":['Microsoft YaHei', 'SimHei']})
# 设置画布长宽 和 dpi
plt.figure(figsize=(18,8),dpi=100)
# 自定义色卡
cmap = mcolors.LinearSegmentedColormap.from_list("n",['#95B359','#D3CF63','#E0991D','#D96161','#A257D0','#7B1216'])
# 绘制热力图ax_sz = sns.heatmap(data_pivot_gz, cmap=cmap, vmax=31, annot=True, # 热力图上显示数值linewidths=0.5,)
# 将x轴刻度放在最上面
ax_sz.xaxis.set_ticks_position('top')
plt.title('广州最近10个月天气分布',fontsize=16) #图片标题文本和字体大小
plt.show()
data_pivot_sh =  pd.pivot(data_sh,values='日期',index='月份',columns='天气')
data_pivot_sh = data_pivot_sh.astype('float')
# 按照 索引年月倒序排序
data_pivot_sh.sort_index(ascending=False,inplace=True)#设置全局默认字体 为 雅黑
plt.rcParams['font.family'] = ['Microsoft YaHei']
# 设置全局轴标签字典大小
plt.rcParams["axes.labelsize"] = 14
# 设置背景
sns.set_style("darkgrid",{"font.family":['Microsoft YaHei', 'SimHei']})
# 设置画布长宽 和 dpi
plt.figure(figsize=(18,8),dpi=100)
# 自定义色卡
cmap = mcolors.LinearSegmentedColormap.from_list("n",['#95B359','#D3CF63','#E0991D','#D96161','#A257D0','#7B1216'])
# 绘制热力图ax_sz = sns.heatmap(data_pivot_sh, cmap=cmap, vmax=31, annot=True, # 热力图上显示数值linewidths=0.5,)
# 将x轴刻度放在最上面
ax_sz.xaxis.set_ticks_position('top')
plt.title('上海最近10个月天气分布',fontsize=16) #图片标题文本和字体大小
plt.show()data_bj = data[(data['城市']=='北京') & (data['年份'] == 2021)]
data_bj['日期'] = pd.to_datetime(data_bj.日期,format="%Y年%m月%d日")
data_bj = data_bj.sort_values(by='日期',ascending=True)

北京2021年每日最高最低温度变化

python学习交流Q群:770699889 ### 源码领取
color0 = ['#FF76A2','#24ACE6']
color_js0 = """new echarts.graphic.LinearGradient(0, 1, 0, 0,[{offset: 0, color: '#FFC0CB'}, {offset: 1, color: '#ed1941'}], false)"""
color_js1 = """new echarts.graphic.LinearGradient(0, 1, 0, 0,[{offset: 0, color: '#FFFFFF'}, {offset: 1, color: '#009ad6'}], false)"""tl = Timeline()
for i in range(0,len(data_bj)):coordy_high = list(data_bj['最高温度'])[i]coordx = list(data_bj['日期'])[i]coordy_low = list(data_bj['最低温度'])[i]x_max = list(data_bj['日期'])[i]+datetime.timedelta(days=10)y_max = int(max(list(data_bj['最高温度'])[0:i+1]))+3y_min = int(min(list(data_bj['最低温度'])[0:i+1]))-3title_date = list(data_bj['日期'])[i].strftime('%Y-%m-%d')c = (Line(init_opts=opts.InitOpts(theme='dark',#设置动画animation_opts=opts.AnimationOpts(animation_delay_update=800),#(animation_delay=1000, animation_easing="elasticOut"),#设置宽度、高度width='1500px',height='900px', )).add_xaxis(list(data_bj['日期'])[0:i]).add_yaxis(series_name="",y_axis=list(data_bj['最高温度'])[0:i], is_smooth=True,is_symbol_show=False,linestyle_opts={'normal': {'width': 3,'shadowColor': 'rgba(0, 0, 0, 0.5)','shadowBlur': 5,'shadowOffsetY': 10,'shadowOffsetX': 10,'curve': 0.5,'color': JsCode(color_js0)}},itemstyle_opts={"normal": {"color": JsCode("""new echarts.graphic.LinearGradient(0, 0, 0, 1, [{offset: 0,color: '#ed1941'}, {offset: 1,color: '#009ad6'}], false)"""),"barBorderRadius": [45, 45, 45, 45],"shadowColor": "rgb(0, 160, 221)",}},).add_yaxis(series_name="",y_axis=list(data_bj['最低温度'])[0:i], is_smooth=True,is_symbol_show=False,
#             linestyle_opts=opts.LineStyleOpts(color=color0[1],width=3),itemstyle_opts=opts.ItemStyleOpts(color=JsCode(color_js1)),linestyle_opts={'normal': {'width': 3,'shadowColor': 'rgba(0, 0, 0, 0.5)','shadowBlur': 5,'shadowOffsetY': 10,'shadowOffsetX': 10,'curve': 0.5,'color': JsCode(color_js1)}},).set_global_opts(title_opts=opts.TitleOpts("北京2021年每日最高最低温度变化\n\n{}".format(title_date),pos_left=330,padding=[30,20]),xaxis_opts=opts.AxisOpts(type_="time",max_=x_max),#, interval=10,min_=i-5,split_number=20,axistick_opts=opts.AxisTickOpts(length=2500),axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color="grey"))yaxis_opts=opts.AxisOpts(min_=y_min,max_=y_max),#坐标轴颜色,axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color="grey"))))tl.add(c, "{}".format(list(data_bj['日期'])[i]))tl.add_schema(axis_type='time',play_interval=100,  # 表示播放的速度pos_bottom="-29px",is_loop_play=False, # 是否循环播放width="780px",pos_left='30px',is_auto_play=True,  # 是否自动播放。is_timeline_show=False)
tl.render_notebook()
data_10 = data[(data['年份'] == 2021) & ( data['月份'] == 10)]
data_10.head()

北上广深10月份每日最高气温变化

# 背景色
background_color_js = ("new echarts.graphic.LinearGradient(0, 0, 0, 1, ""[{offset: 0, color: '#c86589'}, {offset: 1, color: '#06a7ff'}], false)"
)# 线条样式
linestyle_dic = { 'normal': {'width': 4,  'shadowColor': '#696969', 'shadowBlur': 10,  'shadowOffsetY': 10,  'shadowOffsetX': 10,  }}timeline = Timeline(init_opts=opts.InitOpts(bg_color=JsCode(background_color_js),width='980px',height='600px'))bj, gz, sh, sz= [], [], [], []
all_max = []
x_data = data_10[data_10['城市'] == '北京']['日'].tolist()
for d_time in range(len(x_data)):bj.append(data_10[(data_10['日'] == x_data[d_time]) & (data_10['城市']=='北京')]["最高温度"].values.tolist()[0])gz.append(data_10[(data_10['日'] == x_data[d_time]) & (data_10['城市']=='广州')]["最高温度"].values.tolist()[0])sh.append(data_10[(data_10['日'] == x_data[d_time]) & (data_10['城市']=='上海')]["最高温度"].values.tolist()[0])sz.append(data_10[(data_10['日'] == x_data[d_time]) & (data_10['城市']=='深圳')]["最高温度"].values.tolist()[0])line = (Line(init_opts=opts.InitOpts(bg_color=JsCode(background_color_js),width='980px',height='600px')).add_xaxis(x_data,).add_yaxis('北京',bj,symbol_size=5,is_smooth=True,is_hover_animation=True,label_opts=opts.LabelOpts(is_show=False),).add_yaxis('广州',gz,symbol_size=5,is_smooth=True,is_hover_animation=True,label_opts=opts.LabelOpts(is_show=False),).add_yaxis('上海',sh,symbol_size=5,is_smooth=True,is_hover_animation=True,label_opts=opts.LabelOpts(is_show=False),).add_yaxis('深圳',sz,symbol_size=5,is_smooth=True,is_hover_animation=True,label_opts=opts.LabelOpts(is_show=False),).set_series_opts(linestyle_opts=linestyle_dic).set_global_opts(title_opts=opts.TitleOpts(title='北上广深10月份最高气温变化趋势',pos_left='center',pos_top='2%',title_textstyle_opts=opts.TextStyleOpts(color='#DC143C', font_size=20)),tooltip_opts=opts.TooltipOpts(trigger="axis",axis_pointer_type="cross",background_color="rgba(245, 245, 245, 0.8)",border_width=1,border_color="#ccc",textstyle_opts=opts.TextStyleOpts(color="#000"),),xaxis_opts=opts.AxisOpts(
#                 axislabel_opts=opts.LabelOpts(font_size=14, color='red'),
#                 axisline_opts=opts.AxisLineOpts(is_show=True,
#                 linestyle_opts=opts.LineStyleOpts(width=2, color='#DB7093'))is_show = False),yaxis_opts=opts.AxisOpts(name='最高气温',            is_scale=True,
#                 min_= int(min([gz[d_time],sh[d_time],sz[d_time],bj[d_time]])) - 10,max_= int(max([gz[d_time],sh[d_time],sz[d_time],bj[d_time]])) + 10,name_textstyle_opts=opts.TextStyleOpts(font_size=16,font_weight='bold',color='#5470c6'),axislabel_opts=opts.LabelOpts(font_size=13,color='#5470c6'),splitline_opts=opts.SplitLineOpts(is_show=True, linestyle_opts=opts.LineStyleOpts(type_='dashed')),axisline_opts=opts.AxisLineOpts(is_show=True,linestyle_opts=opts.LineStyleOpts(width=2, color='#5470c6'))),legend_opts=opts.LegendOpts(is_show=True, pos_right='1%', pos_top='2%',legend_icon='roundRect',orient = 'vertical'),))timeline.add(line, '{}'.format(x_data[d_time]))timeline.add_schema(play_interval=1000,          # 轮播速度is_timeline_show=True,      # 是否显示 timeline 组件is_auto_play=True,          # 是否自动播放pos_left="0",pos_right="0"
)
timeline.render_notebook()

效果展示(部分)

源码.点击领取即可

最后

今天的分享到这里就结束了

给大家推荐一些Python视频教程,希望对大家有所帮助:

Python零基础教学合集

对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦
觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/

Python采集天气数据,做可视化分析【附源码】相关推荐

  1. leaflet 结合 d3.js 实现 geojson 数据地形剖面分析(附源码下载)

    前言 leaflet 入门开发系列环境知识点了解: leaflet api文档介绍,详细介绍 leaflet 每个类的函数以及属性等等 leaflet 在线例子 leaflet 插件,leaflet ...

  2. Python爬取天气数据及可视化分析!

    来源丨Python之王 Python爬取天气数据及可视化分析 说在前面 天气预报我们每天都会关注,我们可以根据未来的天气增减衣物.安排出行,每天的气温.风速风向.相对湿度.空气质量等成为关注的焦点.本 ...

  3. Python爬取天气数据及可视化分析

    Python爬取天气数据及可视化分析 文章目录 Python爬取天气数据及可视化分析 说在前面 1.数据获取 请求网站链接 提取有用信息 保存csv文件 2.可视化分析 当天温度变化曲线图 当天相对湿 ...

  4. bilibili助手C2C服务器,Bilibili (B站)200万用户数据爬取与分析(附源码)

    原标题:Bilibili (B站)200万用户数据爬取与分析(附源码) 数据挖掘入门与实战 公众号: datadw 该爬虫仅供学习使用 B站用户爬虫 B站视频爬虫 B站弹幕下载器 关注并回复公众号da ...

  5. 100个必会的python脚本-100行Python代码实现自动抢火车票(附源码)

    前言 又要过年了,今年你不妨自己写一段代码来抢回家的火车票,是不是很Cool.下面话不多说了,来一起看看详细的介绍吧. 先准备好: 12306网站用户名和密码 chrome浏览器及下载chromedr ...

  6. 20220517 Python 制作一个儿童学习软件 (附源码和软件下载) 包含语音合成 视频播放 pyqt pptsx3 Qmovie request pygame 音频播放

    20220517 Python 制作一个儿童学习软件 (附源码和软件下载) 包含语音合成 视频播放 pyqt pptsx3 Qmovie request pygame 音频播放 文章目录 202205 ...

  7. 【手把手教你】Python获取财经数据和可视化分析

    内容来自:微信公众号:python金融量化 关注可了解更多的金融与Python干货. "巧妇难为无米之炊",找不到数据,量化分析也就无从谈起.对于金融分析者来说,获取数据是量化分析 ...

  8. 手把手教你做一个数据图表生成器(附源码)...

    我的需求:手动配置X轴.Y轴.图表标题等参数自动通过Pyecharts模块生成可视化的html数据图表,并将浏览器图表展示到UI界面上. [阅读全文] 制作出图表后的效果展示如下: 另外,生成后的图表 ...

  9. 用Python自动刷新抢12306火车票(附源码)

    專 欄 ❈ 作者:marvin,互联网从业者,现居上海张江 ❈ 一年一度的春运又来了,今年我自己写了个抢票脚本.使用Python+Splinter自动刷新抢票,可以成功抢到.(依赖自己的网络环境太厉害 ...

最新文章

  1. 微信同步通讯录服务器繁忙,企业微信同步通讯录时提示 mobile existed
  2. 你想过 Controller 这些方法里的参数是如何工作的吗?
  3. MariaDB CEO 痛斥云厂商对开源的无尽掠夺,从不回馈社区
  4. Eclipse下新建Maven项目、自动打依赖jar包
  5. Git分支高级管理[四]
  6. 前端开发如何做好本地接口模拟
  7. RFID打印机有什么用
  8. 【NOIP 2016】组合数问题
  9. mac 配置mysql 环境变量
  10. 加密狗登录PHP开发,C# 使用加密狗登录 示例源码
  11. Windows常见错误
  12. 在HBuilder上打开PHP文件
  13. C#对.CSV格式的文件--逗号分隔值文件 的读写操作及上传ftp服务器操作方法总结
  14. Windows下利用Chrome调试IOS设备页面
  15. java构造方法:有参构造方法和无参构造方法区别
  16. long term recurrent convolutional networks for visual recognition and description
  17. Python: 玩转各种多媒体+视频+音频+图片
  18. 阿里云服务器选择不同地域有什么区别
  19. 【不同的子序列II】
  20. CF13A 最大公约数加进制转换

热门文章

  1. Redis入门指南之三(入门)
  2. eclipse设置护眼色(一劳永逸)
  3. python入门——四叶玫瑰数
  4. 我的平台型产品设计分析缺了什么
  5. foxmail 发送邮件到 Poste邮件服务的端口设置
  6. 无法启动此程序因为计算机中丢失d3dx942,《骑马与砍杀》游戏运行时提示缺少d3dx9_42.dll怎么办?...
  7. python中单例模式是什么_Python中单例模式总结
  8. WEBGAME策划的40个办法
  9. scrapy爬虫之中间件Middleware
  10. 【R语言上市公司财务数据描述性数据统计】