C# 读取Word文档中的文本内容

这篇文章将介绍如何使用C#和Free Spire.Doc组件读取Word文档中的文本内容。Free Spire.Doc提供了两种方法来读取Word文档中的内容,一种是直接获取文档中的所有文本内容,另一种是遍历文档中的节和其中的段落,然后获取段落中的文本,下面将逐一介绍这两种方法。

Word文档截图:

在使用以下代码前,需要先在Visual studio中创建一个C#应用程序,然后引用Spire.Doc.dll到程序中。

方法一 直接获取所有文本

//加载Word文档
Document doc = new Document();
doc.LoadFromFile("Input.docx");//使用GetText方法获取文档中的所有文本
string s = doc.GetText();File.WriteAllText("文本1.txt", s.ToString());

效果图:

方法二 遍历段落获取文本

//加载Word文档
Document document = new Document();
document.LoadFromFile(@"测试文档.docx");StringBuilder sb = new StringBuilder();//遍历节和段落,获取段落中的文本
foreach (Section section in document.Sections)
{foreach (Paragraph paragraph insection.Paragraphs){sb.AppendLine(paragraph.Text);}
}File.WriteAllText("文本2.txt",sb.ToString());

效果图:

总结

这两种方法结果都差不多,第一种方法更简便,通过一个方法可以一次性获取文档中的内容,但第二种方法更灵活,可以获取到文档中指定节或指定段落中的文本,可以根据自己的需要选择相应的方法。

C# 读取Word文档中的文本内容相关推荐

  1. Free Spire.Doc组件C# 读取Word文档中的文本内容

    C# 读取Word文档中的文本内容 这篇文章将介绍如何使用C#和Free Spire.Doc组件读取Word文档中的文本内容.Free Spire.Doc提供了两种方法来读取Word文档中的内容,一种 ...

  2. Java 读取Word文档中的文本内容

    这篇文章将介绍如何使用Free Spire.Doc for Java组件在Java应用程序中读取Word文档的文本内容.Free Spire.Doc for Java提供了两种方法来读取Word文档中 ...

  3. php 提取文字,如何使用PHP从word文档中提取文本内容?

    我想用PHP从word文档中提取文本内容. 我在Microsoft Word for Mac 2011中创建了一个新的单词文档. 编辑:也通过在Windows 7中的Microsoft Word中创建 ...

  4. python读取word文档中的表格内容

    1. 使用到的库 :docx(python_docx‑0.8.10‑py2.py3‑none‑any.whl) 下载地址:https://download.lfd.uci.edu/pythonlibs ...

  5. Python读取\修改word文档中的文本框内容

    本文所指的 word文档,都是docx结尾的,如果是doc结尾的,请参考上篇:点我 我们绝大多数的需求都是 利用python-docx 来读取word文档中的内容,进而再对内容进行其他处理,如下代码, ...

  6. python合并word表格单元格_Python实战009:读取Word文档中的表格数据及表格合并问题解决...

    同事最近被安排整理资料,主要工作室将文档中的表格数据提取出来并整理层Excel表格供我们FII刀具商城进行资料维护.由于刀具的种类繁多且规格无数,所以要处理的数据量相当的庞大.人工核对整理既费时又费力 ...

  7. 【Python】导出docx格式Word文档中的文本、图片和附件等

    [Python]导出docx格式Word文档中的文本.图片和附件等 零.需求 为批量批改学生在机房提交的实验报告,我需要对所有的实验文档内容进行处理.需要批量提取Word文档中的图片和附件以便进一步检 ...

  8. Word处理控件Aspose.Words功能演示:用Java从Word文档中提取文本

    Aspose.Words For .NET是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsof ...

  9. Java版Word开发工具Aspose.Words功能解析:查找和替换Word文档中的文本

    MS Word提供了一种简单的方法来查找和替换文档中的文本.查找和替换文本的一种流行用例之一可能是在文档之间的敏感信息在各个实体之间共享之前,对其进行删除或替换.但是,手动过程可能需要您安装MS Wo ...

最新文章

  1. Linux 下Oracle Client JAVA JDBC 集成点滴
  2. layui多个file与提交同时进行_如何“不累”地完成多个同时进行的工作?
  3. 网管光纤收发器产品硬件功能及网管收发器优点介绍
  4. [算法]-排序算法之希尔排序
  5. aix linux运维,运维老司机分享的八个AIX日常运维经验及案例
  6. 用Eclipse创建第一个JSP项目
  7. 一个故事讲完CPU的工作原理 侵删
  8. android中listview刷新数据,Android动态刷新listview中的数据?
  9. openwrt路由器打印机服务器设置_openwrt 路由器下HP 打印机的安装
  10. c语言char储存字符串,在c语言中char型数据在内存中的储存形式为什么
  11. java加载so包,undefined symbol处理方法
  12. 登录服务器xp系统,xp系统登入云服务器
  13. window中的DLL和linux中的os文件是什么东西
  14. 【观察】并购魔方安全,联软科技再启新征程
  15. 重识Nginx - 15 使用信号管理Nginx的父子进程
  16. BUUCTF Crypto RSA what writeup
  17. Java实现火车购票系统功能
  18. 和尚挑水 java_java编程:山上有一口缸可以装50升水,现在有15升。老和尚叫小和尚下山挑水,每次挑5升,要挑几次...
  19. 推荐一个下载神器(官网资料下载必备)
  20. [AI 笔记] BP反向传播算法

热门文章

  1. 计算机管理中少了一个H盘符,提示驱动器H中没有磁盘 请插入一张磁盘
  2. 漏洞分析丨cve-2012-0003
  3. 大数据Spark “蘑菇云”行动第103课:Hive源码大师之路第一步:Hive源码思考和解析初体验
  4. 学校劳动教育不能总是纸上谈兵
  5. html5 纵向分割线,html5和css3制作不规则的网页背景分割线
  6. 教你三分钟免费搭建自己的博客网站
  7. 12V转5V10A大电流同步降压IC
  8. 企业微信 通讯录展示组件 canvas 支持方案 importKey‘ of undefined
  9. threejs 计算机硬件配置要求
  10. Overture乐理调式音阶小课堂