python获取的html转换为json,python读取XML格式文件并转为json格式
XML文件如下:
红楼梦书名>
曹雪芹作者>
描述贾宝玉和林黛玉的爱情故事主要内容>
人民文学出版社出版社>
图书>
一、python读取XML格式文件代码:
import xml.sax
import xml.sax.handler
class BooksHander(xml.sax.ContentHandler):
def __init__(self):
self.CurrentData=""
self.name=""
self.author=""
self.contents=""
self.press=""
def startElement(self,tag,attributes):
self.CurrentData=tag
if tag =="图书":
print("--------内容--------")
def endElement(self,tag):
if self.CurrentData=="书名":
print("书名:",self.name)
elif self.CurrentData=="作者":
print("作者:",self.author)
elif self.CurrentData=="主要内容":
print("主要内容:",self.contents)
elif self.CurrentData=="出版社":
print("出版社:",self.press)
self.CurrentData = ""
def characters(self,conten):
if self.CurrentData=="书名":
self.name=conten
elif self.CurrentData=="作者":
self.author=conten
elif self.CurrentData=="主要内容":
self.contents=conten
elif self.CurrentData=="出版社":
self.press=conten
if __name__ == '__main__':
parser=xml.sax.make_parser()
parser.setFeature(xml.sax.handler.feature_namespaces,0)
Handler=BooksHander()
parser.setContentHandler(Handler)
parser.parse("图书.xml")
二、将XML格式转换成json格式文件
import xmltodict
import json
xml=open('图书.xml','r',encoding='UTF-8')
xml_str=xml.read()
xml_json=xmltodict.parse(xml_str)
xml_json=json.dumps(xml_json,indent=4)
with open('图书.json','w') as f:
f.write(xml_json)
python获取的html转换为json,python读取XML格式文件并转为json格式相关推荐
- python rtf转txt_将DOC、RTF格式文件批量转为TXT格式文件
Windows 下将目录下所有文件下的文件 拷贝到一个目录中:搜索"." 安装python 及 win32com模块 pip install pypiwin32 创建LDA_RTF ...
- 使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本
使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本 文章目录 使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本 前言: 背景 tm ...
- LabelMe标记后的json文件怎么转为COCO格式
LabelMe标记后的json文件怎么转为COCO格式 步骤如下: Step 1: 下载labelme ,链接为https://github.com/wkentaro/labelme Step 2: ...
- python获取指定单元格内容_python读取excel表格指定位置的内容
今天是第一次写博客,对之前学以致用的内容做一些总结,以备日后忘了或者可以给别人提供一些帮助.话不多说,开始写内容. python读取excel表格指定位置的内容 需求:现在有一个excel表格,里面有 ...
- python将文件内容转为json格式
目录 1. 需求分析 2.解决方法 2.1 技术分析 2.2 代码实现 2.3 实验结果 2.4 测试数据 3. 参考文献 1. 需求分析 写这篇文章主要是自己为了偷懒不想将生成的数据手动一个个弄成j ...
- Python获取磁盘使用信息,python获取GPU信息,python根据进程号获取进程信息,pynvml 获取GPU信息,psutil 获取进程信息,系统信息等
一.工具:psutil模块 psutil是一个跨平台模块,试用相应方法可以直接获取计算机CPU,内存,磁盘,网络等资源使用情况:可以使用我们学习知识与这模块用来做系统监控,性能分析:如果大家熟悉Lin ...
- python 获取唯一值_从Python列表中获取唯一值
python 获取唯一值 In this article, we will be understanding 3 ways to get unique values from a Python lis ...
- python刷网易云_利用Python获取网易云音乐数据,python
#!/usr/bin/env python # -*- coding: utf-8 -*- import json import re import urllib.request import pan ...
- python获取字符串首字母_[Python] Python 获取中文的首字母 和 全部拼音首字母
原博文 2019-07-08 04:18 − Python 获取中文的首字母 和 全部拼音首字母 代码如下: import pinyin def getStrAllAplha(str): return ...
最新文章
- 武器化道路越走越远的无人机
- ITJ上的一篇论文(E-WsFrame)
- SPOJ - PHRASES Relevant Phrases of Annihilation —— 后缀数组 出现于所有字符串中两次且不重叠的最长公共子串...
- 数据库的一些基本知识
- matlab 格式化文件,格式化matlab文件01_新建普通文件
- Linux下载安装一个源码包
- Mozilla发布最大公共语音数据集Common Voice
- oracle的文件后缀名,转:数据文件的扩展名是ora,dbf,dat的,有什么区别?
- java客户端作为kafka消费者测试
- 微软将推出Surface Duo双屏手机:售价1399美元
- #Pragma Pack(n)与内存分配 pragma pack(push,1)与#pragma pack(1)的区别
- # 创业计划书-样例参考五千套(一)
- jieba 使用笔记
- Excel汇总的撤销整个工作表保护的2种操作方法!
- lisp6 暖通cad_cad.(CAD 分哪几种?)
- 全国区号省份mysql_中国各个省份的区号
- 从根本上降低采购成本,不割韭菜~
- Spark多版本共存
- 微信支付.商家转账到零钱案例
- 有机化学研究生博士生为什么被要求长时间工作
热门文章
- mac vim 配置文件
- I.MX6 make menuconfig OTG to slave only mode
- 《深入Ajax架构和最佳实践》读书笔记
- 大数据时代:数据质量逐渐成关注焦点
- POJ 3252 Round Numbers
- --6、专业信息表(表)
- 重磅! flutter视图局部更新
- Codeforces.888G.Xor-MST(Borůvka算法求MST 贪心 Trie)
- 【Django】ImportError: cannot import name 'execute_manager'
- 如何清除图片下方出现几像素的空白间隙?