python读取多个文件夹_Python:从文件夹中读取多个json文件
小编典典
一种选择是使用os.listdir列出目录中的所有文件,然后仅查找以’.json’结尾的文件:
import os, json
import pandas as pd
path_to_json = 'somedir/'
json_files = [pos_json for pos_json in os.listdir(path_to_json) if pos_json.endswith('.json')]
print(json_files) # for me this prints ['foo.json']
现在,您可以使用pandas DataFrame.from_dict将json(此时为python字典)读入pandas数据帧:
montreal_json = pd.DataFrame.from_dict(many_jsons[0])
print montreal_json['features'][0]['geometry']
印刷品:
{u'type': u'Point', u'coordinates': [-73.6051013, 45.5115944]}
在这种情况下,我将一些json附加到列表中many_jsons。我列表中的第一个json实际上是一个geojson,其中包含蒙特利尔的一些地理数据。我已经很熟悉内容了,所以我打印出了“几何图形”,这让我对蒙特利尔感到满意。
以下代码总结了以上所有内容:
import os, json
import pandas as pd
# this finds our json files
path_to_json = 'json/'
json_files = [pos_json for pos_json in os.listdir(path_to_json) if pos_json.endswith('.json')]
# here I define my pandas Dataframe with the columns I want to get from the json
jsons_data = pd.DataFrame(columns=['country', 'city', 'long/lat'])
# we need both the json and an index number so use enumerate()
for index, js in enumerate(json_files):
with open(os.path.join(path_to_json, js)) as json_file:
json_text = json.load(json_file)
# here you need to know the layout of your json and each json has to have
# the same structure (obviously not the structure I have here)
country = json_text['features'][0]['properties']['country']
city = json_text['features'][0]['properties']['name']
lonlat = json_text['features'][0]['geometry']['coordinates']
# here I push a list of data into a pandas DataFrame at row given by 'index'
jsons_data.loc[index] = [country, city, lonlat]
# now that we have the pertinent json data in our DataFrame let's look at it
print(jsons_data)
对我来说,这印:
country city long/lat
0 Canada Montreal city [-73.6051013, 45.5115944]
1 Canada Toronto [-79.3849008, 43.6529206]
了解此代码对于在目录名称“ json”中有两个geojsons可能会有所帮助。每个json具有以下结构:
{"features":
[{"properties":
{"osm_key":"boundary","extent":
[-73.9729016,45.7047897,-73.4734865,45.4100756],
"name":"Montreal city","state":"Quebec","osm_id":1634158,
"osm_type":"R","osm_value":"administrative","country":"Canada"},
"type":"Feature","geometry":
{"type":"Point","coordinates":
[-73.6051013,45.5115944]}}],
"type":"FeatureCollection"}
2020-07-27
python读取多个文件夹_Python:从文件夹中读取多个json文件相关推荐
- python怎么从excel获取数据_python怎么从excel中读取数据?/python 读取 excle
如何通过python快速输出数据库数据到excel 扩展库 xlrd 读excle xlwt 写excle 直接度就能下载 下载后使用 import xlrd 就可excle文件了 打开文件: xls ...
- SpringBoot/Java 将MongoDB中的数据转换为json文件
项目背景: 我最近在做SpringBoot的项目,其中数据库使用的是MongoDB,前端框架用的是layui.在我使用layui的数据表格组件时,其数据接口对应的是json文件,所有我得将MongoD ...
- python批量下载网页文件夹_Python实现批量从不同的Linux服务器下载文件
基于Python实现批量从不同的Linux服务器下载文件 by:授客 实现功能 批量从不同的Linux服务器下载指定文件 测试环境 Win7 64位 Python 3.3.2 pscp 64位 下载地 ...
- 从指定文件夹下很多个excel中读取指定内容,并合并成一个表,再增加字段
注册csdn十多年了,之前都是偷师学艺,工作中用excel比较多,最近开始使用python,主要是想结合excel做点小工具,提高工作效率,顺便记录一下学习历程. 从D:\XXX\YYY中的所有exc ...
- 如何在Python中优雅地处理JSON文件
1. 引言 在本文中,我们将学习如何使用Python读取.解析和编写JSON文件. 我们将讨论如何最好地处理简单的JSON文件以及嵌套的JSON文件,当然我们也将讨论如何访问Json文件数据中的特定值 ...
- linux查找最近访问的文件,教您在Linux系统中查找最近修改的文件/文件夹
如果您使用Linux系统进行日常操作,则主目录文件将随时间急剧增加.如果您有成千上万个文件,很可能不记得最近更改的文件名,本文将教您在Linux系统中查找最近修改的文件/文件夹.另外,如果要检查出于任 ...
- java怎么引入html文件路径_如何在public_html中读取文件但在域外?使用相对路径...
我正在尝试从我的(附加组件)域目录之外的目录中读取文件 . 这是我的目录结构: public_html / domain / file_read.php file_write.php sensitiv ...
- java读取同包文件_Java实现从jar包中读取指定文件的方法
本文实例讲述了Java实现从jar包中读取指定文件的方法.分享给大家供大家参考,具体如下: 以下的Java代码实现了从一个jar包中读取指定文件的功能: /** * This class implem ...
- android复用字符串文件夹,如何从Android Studio中的值xml字符串文件夹更改字体
我一直在努力了解如何更改值/ Strings.xml目录的字体系列.有没有简单的方法来改变字体?我已经加了我想要的字体到资产的文件夹,但我的标题是在strings.xml中值目录像这里面:如何从And ...
- c#读取solidworks文件_CSharpSolidworks C#打开程序路径中后缀为SLDPRT的 文件 C#编程 238万源代码下载- www.pudn.com...
文件名称: CSharpSolidworks下载 收藏√ [ 5 4 3 2 1 ] 开发工具: C# 文件大小: 402 KB 上传时间: 2013-10-30 下载次数: 11 详细说明 ...
最新文章
- python函数的组成要素_python函数要素有哪些?这7点是你写好python代码的关键
- Java——匿名内部类实现线程的两种方式
- java中位数_java 计算中位数方法
- 【网站】 简单通用微信QQ跳转浏览器打开代码
- notnull注解_Hibernate Validator 第19篇:自定义约束-约束注解
- 软件工程实践_Task2_sudoku
- 在Mysql中遇到关于区间范围内的索引优化
- 印第安纳大学计算机语言学,语言学
- 路飞学城-Python爬虫集训-第二章
- docker自动部署脚本
- dell笔记本电脑驱动_2020年最佳笔记本电脑top榜
- python内置函数系列之str(一)(持续更新)
- Dreamweaver入门基础与HTML视频教程
- PHP微信小程序生成带参二维码getwxacodeunlimit
- python弹性碰撞次数圆周率_期末作业 - 作业部落 Cmd Markdown 编辑阅读器
- 如何让函数只执行一次
- MNIST手写体数字识别数据集
- 人工智能实战2019 第0次作业 焦宇恒
- 学习笔记1 - ResNet网络学习
- android加载本地图库,Android读取本地图库与调用摄像头拍摄