您遇到此问题是因为您正在向iText的XML Worker提供HTML. XML Worker需要XML,因此您需要将HTML转换为XHTML.

有关如何在官方iText网站上执行此操作的示例:D00_XHTML

public static void tidyUp(String path) throws IOException {

File html = new File(path);

byte[] xhtml = Jsoup.parse(html, "US-ASCII").html().getBytes();

File dir = new File("results/xml");

dir.mkdirs();

FileOutputStream fos = new FileOutputStream(new File(dir, html.getName()));

fos.write(xhtml);

fos.close();

}

在这个例子中,我们获得了一个普通HTML文件的路径(类似于你所拥有的).然后,我们使用Jsoup库将HTML解析为XHTML字节数组.在这个例子中,我们使用该字节数组将XHTML文件写入磁盘.您可以直接使用字节数组作为XML Worker的输入.

标签生成html怎么转换,如何进行HTML到XML转换以生成封闭标签?相关推荐

  1. abap xml转换(1)XSLT程序

    导语:最近做一个银企直连的接口改造,原来数据传输格式为XML格式,现在要转成josn格式,我的方案是xml转成abap,abap转成josn,这里就不分享abap转josn的过程了,感兴趣可以在[ab ...

  2. GAN生成对抗网络-CycleGAN原理与基本实现-图像转换-10

    CycleGAN的原理可以概述为: 将一类图片转换成另一类图片 .也就是说,现在有两个样 本空间,X和Y,我们希望把X空间中的样本转换成Y空间中 的样本.(获取一个数据集的特征,并转化成另一个数据 集 ...

  3. java读取pem格式私钥_openssl生成RSA格式及pkcs1与pkcs8格式互相转换

    openssl简介 OpenSSL 是一个开源项目,其组成主要包括以下三个组件: openssl:多用途的命令行工具 libcrypto:加密算法库 libssl:加密模块应用库,实现了ssl及tls ...

  4. openssl生成RSA格式及pkcs1与pkcs8格式互相转换

    openssl简介 OpenSSL 是一个开源项目,其组成主要包括一下三个组件: openssl:多用途的命令行工具 libcrypto:加密算法库 libssl:加密模块应用库,实现了ssl及tls ...

  5. PDF转换工具类(byte[]转PDF并生成文件)

    PDF转换工具类(byte[]转PDF并生成文件) 对html转为标准的xhtml public byte[] transferHtml2XHtml(byte[] html){Tidy tidy = ...

  6. Word转换成pdf技巧:pdf虚拟打印机生成pdf文件攻略

    相信转换成PDF文件的好处,大家已然清楚,小编就不啰嗦了,直接进入主题了.Word如何转换PDF文件?如今Word转换PDF文件的方法也有很多了,但仍有朋友不知道,今天小编就总结了以下三种方法,有简单 ...

  7. 【深度学习人类语言处理】3 语音转换——类别(特征分解、直接转换)、语音分离(评价指标、深度聚类、PIT、TaskNet)

    Deep Learning for Human Ianguage Processing 3 1. 语音转换应用场景 2. 语音转换类别 2.1 成对的资料 2.2 不成对的资料 2.2.1 特征分解 ...

  8. 【目标检测】TT100K数据集使用,提取标注信息并转换成VOC格式的xml文件或yolo格式的txt文件

    1 TT100K 官网 TT100K官网 1.1 数据集介绍 本人下载的是2021的数据集,训练集 6105张图片, 测试集 3071 张图片,每张图片的分辨率为2048 * 2048,共有232 种 ...

  9. 解析错误:相邻的JSX元素必须包装在一个封闭标签中

    本文翻译自:Parse Error: Adjacent JSX elements must be wrapped in an enclosing tag I am trying to set up m ...

  10. xml怎么转换html文件,xml转换成html文件方法

    xml转换成html文件方法 /// < summary> ///将xml转化为html /// < /summary> /// < param name="x ...

最新文章

  1. 初识Tcl(四):Tcl 决策
  2. Scala vs. Groovy vs. Clojure [已结束]
  3. mysql服务启动很久_Mysql服务启动问题
  4. hdu4882 水贪心
  5. 《云计算》学习笔记1
  6. ajax不能访问本地php文件,php – 使用htaccess拒绝ajax文件访问
  7. 数组的连续最大子段和
  8. 前端拆分_如何在消费者驱动的合同测试的帮助下拆分前端和后端的部署
  9. iPhone 13 Pro系列最新渲染图曝光:小刘海+大尺寸后置相机模组
  10. 程序员想早点下班被经理拒绝,一气之下要辞职,经理慌了
  11. oracle typehandler,Mybatis实现自定义的类型转换器TypeHandler
  12. c++调用powershell_告别 Windows 终端的难看难用,从改造 PowerShell 的外观开始
  13. vue实现元素过渡效果
  14. linux centos中使用cp命令复制文件的时候出现omitting directory报错如何解决
  15. sys.path.append()
  16. Java中常见的30道例题(附代码)
  17. php数字和字母互换,PHP实现十进制数字与二十六进制字母串相互转换操作示例
  18. Unity中进行网络通信:三:unity客户端和Unity服务端互相发消息
  19. 设计模式----装饰模式
  20. tcpcopy简单用法

热门文章

  1. ios::ate和ios::app在C++文件中的区别
  2. 稀疏矩阵与 spdiags函数图解
  3. 终于有人把深度学习讲明白了!
  4. keras实现DCGAN生成mnist原代码
  5. moss 搜索 属性过滤 值被移除了
  6. QT练习5:显示GIF图片
  7. 有时我们经常碰到某目录下文件名乱码的情况,convmv可以批量转换文件名编码。...
  8. 孩子们各显神通对付 iOS 12「屏幕使用时间」的限制
  9. OpenCV颜色空间——HLS颜色空间
  10. 【Retinex】【Frankle-McCann Retinex】matlab代码注释