图像通常用于表示 Word 文档中的重要信息。在文本旁边包含图像使内容更具吸引力。在某些情况下,您可能需要以编程方式提取嵌入在 Word 文档中的图像。为此,本文介绍了如何使用 Java 从 Word 文档中提取图像。

Aspose.Words for . java 最新下载(qun:761297826)https://www.evget.com/product/4116/download

Java API 从 Word 文档中提取图像

Aspose.Words for Java是一个功能强大且功能丰富的 API,用于创建、操作和转换 MS Word 文档。因此,我们将使用此 API 从 MS Word DOCX/DOC 文档中提取图像。您可以使用以下 Maven 配置下载API 的 JAR 或将其安装到您的 Java 应用程序中。

<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>

如何从 Word 文档中提取图像

Word 文档中的图像使用形状对象表示。因此,要检索图像,您必须处理文档中的每个形状。以下是从 Java 中的 Word DOCX 文档中提取图像的步骤。

  • 首先,使用Document类加载 Word 文件。
  • 然后,使用Document.getChildNodes(NodeType.SHAPE, Boolean)方法将所有形状放入NodeCollection对象中。
  • 循环遍历检索到的形状。
  • 在每次迭代中,使用Shape.hasImage()方法检查形状是否有图像。
  • 最后,提取图像并使用Shape.getImageData().save(string)方法保存。

以下代码示例展示了如何从 Java 中的 DOCX 文档中提取图像。

// Load Word document
Document doc = new Document("Document.docx");// Get all the shapes
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;// Loop through the shape collection
for (Shape shape : shapes) {// Check if shape has image
if (shape.hasImage()) {// Extract and save the image
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}

结论

在本文中,您学习了如何使用 Java 从 Word 文档中提取图像。此外,代码示例还展示了如何从 DOCX 文件中提取图像并将其保存到所需位置。此外,Aspose.Words for Java 提供了广泛的文档操作功能。此外,您可以通过我们的论坛提出您的问题也可以通过在线客服联系我们。

Word处理控件Aspose.Words功能演示:从 Java 中的 Word 文档中提取图像相关推荐

  1. Word处理控件Aspose.Words功能演示:使用 C# 在 Word 文档中创建和修改 VBA 宏

    Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...

  2. Word处理控件Aspose.Words功能演示:在 Python 中将 Word DOCX 或 DOC 转换为 PDF

    Word 到PDF是最流行和执行最广泛的文档转换之一.DOCX或DOC文件在打印或共享之前会转换为 PDF 格式.在本文中,我们将在 Python 中自动将 Word 转换为 PDF.步骤和代码示例将 ...

  3. Word处理控件Aspose.Words功能演示:在 Python 中将 Word 文档转换为 PNG、JPEG 或 BMP

    MS Word 文件到图像格式的转换让您可以将文档的页面嵌入到您的 Web 或桌面应用程序中.为了在 Python 应用程序中执行此转换,本文介绍了如何使用 Python 将 Word DOCX或DO ...

  4. Word处理控件Aspose.Words功能演示:使用C#在电子邮件正文中发送Word文档

    电子邮件正文的呈现是吸引读者的重要因素之一.因此,电子邮件使用标题,子标题,表格,图像等进行了很好的格式化.但是,大多数内置的电子邮件编辑器不提供高级格式化选项.为了解决此限制,本文介绍如何使用Wor ...

  5. Word处理控件Aspose.Words功能演示:使用 Python 将 Word 文档的内容复制到另一个文档

    在各种情况下,您可能需要将 Word 文档的内容复制到另一个文档中.此外,您可能需要创建原始 Word 文档的克隆.为了自动化这些操作,本文介绍了如何在 Python 中将内容从一个 Word 文档复 ...

  6. Word处理控件Aspose.Words功能演示:使用 Python 合并 Word 文档

    当您必须将多个 Word 文档合并到一个文件中时,可能会有多种情况.例如,当多人编写文档的不同部分时,您需要在最后组合内容.另一方面,您可能需要将所有发票合并到一个 Word 文档中.为了以编程方式执 ...

  7. Word处理控件Aspose.Words功能演示:使用 C++ 在 Word (DOC/DOCX) 中添加或删除水印

    Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...

  8. Word处理控件Aspose.Words功能演示:使用 C# 将 Word 文档转换为 HTML

    在各种情况下,您需要在 Web 或桌面应用程序中显示 Word 文档的内容.在这种情况下,合适的选项之一是将 Word 文档转换为HTML.为了在 .NET 应用程序中实现这一点,本文介绍了如何使用 ...

  9. Word处理控件Aspose.Words功能演示:使用 C# 将 Word 文档转换为 Markdown

    如今,大量的文章.博客和文档都是以Markdown ( MD ) 格式编写的.但是,对于大型文档,Markdown 语法通常变得难以记忆和编写.为方便起见,您可以在 MS Word 中编写内容,然后将 ...

最新文章

  1. php打印出来乱码_PHP输出中文乱码的解决方法(转载)
  2. Storage-on-Chip:从“芯”架构VTL到云存储
  3. OVS DPDK vhost-user详解(十二)
  4. 新版appium 支持name定位的方法(没试 记录再此)
  5. 分布式mysql一致性问题_分布式缓存数据库一致性问题
  6. [转]svn常用命令
  7. TypeScript 变量声明
  8. 易学源码html,HTML
  9. JSP的4大域对象及范围(简)
  10. python中backward_pytorch的梯度计算以及backward方法详解
  11. FPGA开发设计流程
  12. atitit.提升兼容性最佳实践 p825.doc
  13. 神经网络加速器设计(1)理论准备
  14. 联想Y720安装双系统详解win10+ubuntu14.04+gtx1060显卡驱动
  15. Newton-Raphson法求解非线性方程复根
  16. 何凯明深度残差网络翻译
  17. ps怎样查看图片坐标
  18. 初识MIMO(六):MU-MIMO的仿真
  19. python版公众号爬虫
  20. dom解析,解析xml文件

热门文章

  1. matlab中lab颜色空间,使用Matlab绘制图像的rgb颜色空间和Lab颜色空间分量图和分量直方图...
  2. 服务器系统不用关机,云服务器不用了要关机吗
  3. Use HAProxy to load balance 300k concurrent tcp socket connections: Port Exhaustion, Keep-alive and
  4. 用java判断三角形类型_判断三角形类型
  5. 联想小新520新品实测,对比当贝投影D3X竟无还手之力
  6. 大鱼号的收益怎么样?自媒体平台大鱼号,最大方的就是它
  7. padavan做副路由,主路由是原厂固件,如何使用adguardHome过滤广告
  8. unicode编码 中文标点符号
  9. 【2018年7月英语学习】--零散中星星点点
  10. 使用Locust进行性能测试,Locust启动失败