XML文件如下:

红楼梦书名>

曹雪芹作者>

描述贾宝玉和林黛玉的爱情故事主要内容>

人民文学出版社出版社>

图书>

一、python读取XML格式文件代码:

import xml.sax

import xml.sax.handler

class BooksHander(xml.sax.ContentHandler):

def __init__(self):

self.CurrentData=""

self.name=""

self.author=""

self.contents=""

self.press=""

def startElement(self,tag,attributes):

self.CurrentData=tag

if tag =="图书":

print("--------内容--------")

def endElement(self,tag):

if self.CurrentData=="书名":

print("书名:",self.name)

elif self.CurrentData=="作者":

print("作者:",self.author)

elif self.CurrentData=="主要内容":

print("主要内容:",self.contents)

elif self.CurrentData=="出版社":

print("出版社:",self.press)

self.CurrentData = ""

def characters(self,conten):

if self.CurrentData=="书名":

self.name=conten

elif self.CurrentData=="作者":

self.author=conten

elif self.CurrentData=="主要内容":

self.contents=conten

elif self.CurrentData=="出版社":

self.press=conten

if __name__ == '__main__':

parser=xml.sax.make_parser()

parser.setFeature(xml.sax.handler.feature_namespaces,0)

Handler=BooksHander()

parser.setContentHandler(Handler)

parser.parse("图书.xml")

二、将XML格式转换成json格式文件

import xmltodict

import json

xml=open('图书.xml','r',encoding='UTF-8')

xml_str=xml.read()

xml_json=xmltodict.parse(xml_str)

xml_json=json.dumps(xml_json,indent=4)

with open('图书.json','w') as f:

f.write(xml_json)

python获取的html转换为json,python读取XML格式文件并转为json格式相关推荐

  1. python rtf转txt_将DOC、RTF格式文件批量转为TXT格式文件

    Windows 下将目录下所有文件下的文件 拷贝到一个目录中:搜索"." 安装python 及 win32com模块 pip install pypiwin32 创建LDA_RTF ...

  2. 使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本

    使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本 文章目录 使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本 前言: 背景 tm ...

  3. LabelMe标记后的json文件怎么转为COCO格式

    LabelMe标记后的json文件怎么转为COCO格式 步骤如下: Step 1: 下载labelme ,链接为https://github.com/wkentaro/labelme Step 2: ...

  4. python获取指定单元格内容_python读取excel表格指定位置的内容

    今天是第一次写博客,对之前学以致用的内容做一些总结,以备日后忘了或者可以给别人提供一些帮助.话不多说,开始写内容. python读取excel表格指定位置的内容 需求:现在有一个excel表格,里面有 ...

  5. python将文件内容转为json格式

    目录 1. 需求分析 2.解决方法 2.1 技术分析 2.2 代码实现 2.3 实验结果 2.4 测试数据 3. 参考文献 1. 需求分析 写这篇文章主要是自己为了偷懒不想将生成的数据手动一个个弄成j ...

  6. Python获取磁盘使用信息,python获取GPU信息,python根据进程号获取进程信息,pynvml 获取GPU信息,psutil 获取进程信息,系统信息等

    一.工具:psutil模块 psutil是一个跨平台模块,试用相应方法可以直接获取计算机CPU,内存,磁盘,网络等资源使用情况:可以使用我们学习知识与这模块用来做系统监控,性能分析:如果大家熟悉Lin ...

  7. python 获取唯一值_从Python列表中获取唯一值

    python 获取唯一值 In this article, we will be understanding 3 ways to get unique values from a Python lis ...

  8. python刷网易云_利用Python获取网易云音乐数据,python

    #!/usr/bin/env python # -*- coding: utf-8 -*- import json import re import urllib.request import pan ...

  9. python获取字符串首字母_[Python] Python 获取中文的首字母 和 全部拼音首字母

    原博文 2019-07-08 04:18 − Python 获取中文的首字母 和 全部拼音首字母 代码如下: import pinyin def getStrAllAplha(str): return ...

最新文章

  1. 武器化道路越走越远的无人机
  2. ITJ上的一篇论文(E-WsFrame)
  3. SPOJ - PHRASES Relevant Phrases of Annihilation —— 后缀数组 出现于所有字符串中两次且不重叠的最长公共子串...
  4. 数据库的一些基本知识
  5. matlab 格式化文件,格式化matlab文件01_新建普通文件
  6. Linux下载安装一个源码包
  7. Mozilla发布最大公共语音数据集Common Voice
  8. oracle的文件后缀名,转:数据文件的扩展名是ora,dbf,dat的,有什么区别?
  9. java客户端作为kafka消费者测试
  10. 微软将推出Surface Duo双屏手机:售价1399美元
  11. #Pragma Pack(n)与内存分配 pragma pack(push,1)与#pragma pack(1)的区别
  12. # 创业计划书-样例参考五千套(一)
  13. jieba 使用笔记
  14. Excel汇总的撤销整个工作表保护的2种操作方法!
  15. lisp6 暖通cad_cad.(CAD 分哪几种?)
  16. 全国区号省份mysql_中国各个省份的区号
  17. 从根本上降低采购成本,不割韭菜~
  18. Spark多版本共存
  19. 微信支付.商家转账到零钱案例
  20. 有机化学研究生博士生为什么被要求长时间工作

热门文章

  1. mac vim 配置文件
  2. I.MX6 make menuconfig OTG to slave only mode
  3. 《深入Ajax架构和最佳实践》读书笔记
  4. 大数据时代:数据质量逐渐成关注焦点
  5. POJ 3252 Round Numbers
  6. --6、专业信息表(表)
  7. 重磅! flutter视图局部更新
  8. Codeforces.888G.Xor-MST(Borůvka算法求MST 贪心 Trie)
  9. 【Django】ImportError: cannot import name 'execute_manager'
  10. 如何清除图片下方出现几像素的空白间隙?