最近需要读取一堆XML文件的数据,这批XML文件很大,虽说用Excel读取很方便,但是读取速度特别慢,故使用Python结合pandas、xml、multiprocessing包实现了数据的快速读取。

# xml2xlsx
import xml.dom.minidom
import pandas as pd
import os
from multiprocessing import Pool
# Read XML file and convert it to XLSX
# Use multiprocessdef xml2excel(filename):print(filename + '...')save_path = '/home/pc/xadf'xml_report = os.path.join(output_path, filename)outputname = filename.split('.')[0]xls_report = os.path.join(save_path, outputname + '.xlsx')#XML文件读取dom = xml.dom.minidom.parse(xml_report)z_tag = dom.getElementsByTagName('z')N = len(z_tag)z = [z_tag[i].firstChild.data for i in range(N)]surface_name_tag = dom.getElementsByTagName('s')surface_name = [surface_name_tag[0].firstChild.data for i in range(N)]label_tag = dom.getElementsByTagName('l')label = [label_tag[i//(512*128)].firstChild.data for i in range(N)]#XLSX文件写入all_dict = {'surface_name': surface_name, 'label': label, 'z': z}  df = pd.DataFrame(all_dict)  with pd.ExcelWriter(xls_report) as Writer:df.to_excel(Writer, 'Sheet1', index=False, header=False)output_path = '/home/pc/akjhfkd'
filenames = os.listdir(output_path)
#并行处理,但不能设置太大,否则容易卡死
pool = Pool(6)
pool.map(xml2excel, filenames)
pool.close()
pool.join()

Python并行实现XML文件转换为XLSX文件相关推荐

  1. 【使用ChatGPT自动化】批量转换.csv文件为.xlsx文件

    第1次提问: 我:我想使用Python批量转换.csv文件为.xlsx文件,请你提供代码 它:好的,以下是使用Python批量转换.csv文件为.xlsx文件的代码: import os import ...

  2. Python 把csv文件转换为excel文件

    背景 由于其他部门给的数据是 csv 文件,业务人员一般都是熟悉 excel 文件,为了方便查看数据,因此需要写个程序,把 csv 文件转换为 excel 文件,由于是经常使用,小编的脚本程序,写成了 ...

  3. python批量pdf转word,python批量实现Word文件转换为PDF文件

    本文为大家分享了python批量转换Word文件为PDF文件的具体方法,供大家参考,具体内容如下 1.目的 通过万能的Python把一个目录下的所有Word文件转换为PDF文件. 2.遍历目录 作者总 ...

  4. php 删除xls文件,使用PHPExcel将xls文件转换为xlsx时出错

    我正在使用库PHPExcel在PHP中创建一个Web应用程序,一个功能是将xls文件转换为xlsx . 这是功能的代码: set_include_path(get_include_path() . P ...

  5. python npy文件_python实现npy格式文件转换为txt文件操作

    如下代码会将npy的格式数据读出,并且输出来到控制台: import numpy as np ##设置全部数据,不输出省略号 import sys np.set_printoptions(thresh ...

  6. python 将excel文件转换为txt文件_python利用pandas将excel文件转换为txt文件的方法

    python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将 ...

  7. python csv文件和xlsx文件混杂时,提取指定列数据并合并

    这篇文章是R语言 如何合并csv文件(批量读取csv文件)的姊妹篇.提供更为强大的功能. 解决的问题是提取csv文件和xlsx文件混杂时,文件合并问题.具体来说,下面的代码是提取指定列文本,简单清洗后 ...

  8. python如何打开npy文件_python实现npy格式文件转换为txt文件操作

    如下代码会将npy的格式数据读出,并且输出来到控制台: import numpy as np ##设置全部数据,不输出省略号 import sys np.set_printoptions(thresh ...

  9. python excel文件转换成字符串_python利用pandas将excel文件转换为txt文件的方法

    python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将 ...

  10. Python将CSV文件转换为Excel文件

    不多说,直接贴代码 from pandas.io.excel import ExcelWriter import pandas as pd with ExcelWriter('xxx.xlsx') a ...

最新文章

  1. 一步一步SharePoint 2007之十六:注册并配置一个网站用户
  2. IDEA下用freemarker热更新的问题
  3. PHP的错误机制总结
  4. 用DOS命令来运行Java代码
  5. EasyUI中layout布局的简单使用
  6. kubectl 安装
  7. axure 图片切换图片的交互_AxureRP8中实现伸缩式的图片展示交互效果
  8. mongoDB 使用手册
  9. Flex3与BlazeDS HelloWorld 详解
  10. MAT插件分析内存泄露之二
  11. 信号与系统——初识信号的原理与分类
  12. php语言能开发app吗_如何利用PHP语言开发手机APP
  13. photoshop笔记
  14. Hbase------regionServer
  15. 花菁染料Cy3.5 炔烃,Cy3.5 alkyne储存条件及光谱特性解析
  16. 一个初级运维工程师对于运维工作的一些浅显认知
  17. 记录一个被自己蠢到的事——解决Potplay等播放器播放视频异常打不开故障
  18. Python换硬币(换钱)
  19. linux 单机安装yum,Linux搭建Nacos服务(单机版)
  20. 第五次作业:《国际贸易学》—WTO及区域经济一体化

热门文章

  1. 记一篇JAR冲突的问题:Inceptor-Ddriver-4.7.1
  2. matlab运行C程序
  3. Python-变分模态分解(VMD)python代码及其测试用例
  4. 反编译与计算机软件的知识产权保护
  5. ROST反剽窃论文检测系统介绍
  6. linux 备份配置文件
  7. 管家婆破解版7.1 软件下载
  8. 程序设计与c语言区别,c语言程序设计和c程序设计有什么区别啊
  9. 如何做好产品需求设计和开发
  10. php汉字转拼音 字库型