Python爬虫解析多级嵌套json

最近刚接触Python爬虫,正好最近肺炎在全国蔓延,所以准备从网站爬取肺炎实时数据,并解析自己想要的数据。获取json数据网址为 https://m.look.360.cn/events/feiyan

爬取网址:

def main():

url='https://m.look.360.cn/events/feiyan'

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36 QIHU 360EE'}

parse_page(url)

解析并保存json格式文件:

state = json.loads(response.content)

with open("feiyan.json", "w",encoding='utf-8') as f:

f.write(json.dumps(state,indent=2,ensure_ascii=False))

print("保存成功")

获取json文件后发现为嵌套格式,具体格式大家可以打开上方网址查看:

{

"data":[

{

"data":{省份}

"citys":[

{城市}{}.....

]

}

{

"data":{省份}

"citys":[

{城市}{}.....

]

}

"country":[

{其他国家}

]

]

}

解析数据

因为我只想获取各个城市的名称、感染人数、治愈人数和死亡人数,所以需要嵌套循环来获取并逐个输出。代码如下:

省级数据获取:

provincename = state['data'][i]['data']['provinceName']

confirmedCount = state['data'][i]['data']['confirmedCount']

curedCount = state['data'][i]['data']['curedCount']

deadCount = state['data'][i]['data']['deadCount']

城市数据获取:

cityName = state['data'][i]['cities'][j]['cityName']

diagnosed = state['data'][i]['cities'][j]['diagnosed']

cured = state['data'][i]['cities'][j]['cured']

died = state['data'][i]['cities'][j]['died']

国外城市数据获取:

countryname = state['country'][c]['provinceName']

diagnosed = state['country'][c]['diagnosed']

cured = state['country'][c]['cured']

died = state['country'][c]['died']

以上就是嵌套json解析格式。

输出效果:

python解析多层嵌套json_Python爬虫解析多个嵌套JSON,多级,json相关推荐

  1. python网页结构分析图_Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存中, ...

  2. python如何解析网页的json_python 如何从网页jQuery中爬取JSON中的内容

    感谢您的回复! 我试了一下,还是报同样的错误. import json import requests import time def asas(url): headers = { "Con ...

  3. fastjson解析多层数据_怎么解析三层List json数据

    注意 这个json格式不对 前后的 [ ] 应该要去掉. (我不是说你缺少的结束符) FastJSON 随意解决的事情. 0, compile 'com.alibaba:fastjson:1.2.7' ...

  4. python 多层嵌套 json_python解析多层json操作示例

    本文实例讲述了python解析多层json操作.分享给大家供大家参考,具体如下: 原始文件内容: { "MaskPolygonItem": { "0": { & ...

  5. python 处理json多层嵌套_python解析多层嵌套json

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 这样多层json结构已完成. 补充拓展:python 读取多层嵌套的json数据 ...

  6. Python爬虫 解析库的使用

    已写章节 第一章 网络爬虫入门 第二章 基本库的使用 第三章 解析库的使用 第四章 数据存储 第五章 动态网页的抓取 文章目录 已写章节 第三章 解析库的使用 3.1BeautifulSoup 3.1 ...

  7. go语言爬虫解析html,Python爬虫【如何爬取内容(html)和解析内容】-Go语言中文社区...

    1 基础 HTML解析:定位基础是xpath,了解下面的链接的基本知识. 在python中使用HTML解析等操作时,需要安装lxml包,在pycharm的terminal下:pip install l ...

  8. java解析多层嵌套json字符串

    java解析多层嵌套json字符串 java分别解析下面两个json字符串 package jansonDemo;import com.alibaba.fastjson.JSON; import co ...

  9. Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存中, ...

最新文章

  1. 【转】利用WCF的双工通信
  2. anaconda3下opencv安装
  3. 手把手教你入门和实践特征工程 的全方位万字笔记,附代码下载
  4. MySQL5.7 常用系统表大全
  5. Windows学习总结(15)——Notepad++ 快捷键大全
  6. 七类常见的兼职骗局,你需要知道
  7. 日本用活体肌肉构建机械臂,人类与机器融合取得新突破
  8. 业务逻辑层的Helper基类
  9. python项目实战:实现任意位置文件分割
  10. 中小型企业无线网络设计
  11. 挂茶馆热血传奇私服辅助开发教程
  12. html chm如何打开方式,解答chm文件如何打开
  13. 记一次 黑软件 kthreaddi 攻防战
  14. 对于企业是云服务器划算还是自购服务器划算?
  15. 解决Kubernetes的flannel pod出现Init:RunContainerError问题
  16. micropython RX8025T 驱动简单演示
  17. 关于1M=1024K 和1M=1000K的主要使用区别
  18. discuz x2.5 mysql_最新 Discuz X2.5安装教程,最小白教程
  19. 三十行代码教你做个通用文字识别程序
  20. 微信聊天记录的词云制作

热门文章

  1. Spring MVC控制器的单元测试:配置
  2. MOXy是GlassFish 4中新的默认JSON绑定提供程序
  3. 使用番石榴的5个理由
  4. GWT MVP变得简单
  5. 播放框架模块:分而治之
  6. macOS/MacBook Air设置使用iCloud的APP
  7. Sublime Text for Mac 最新版安装后,无法搜索到Install Package的解决办法
  8. python3字符串截取_从python3中的字符串中获取特定文本
  9. 算法:删除顺序表中重复的元素
  10. java json注解_返回json用什么注解