使用Solid Framework可以很方便的已编程方式将PDF转换成Word文件格式

  1. 首先准备一套Solid Framework
  2. 在Visual Studio中建立一个项目并引用SolidFramework.dll
  3. 添加命名空间 SolidFramework
using SolidFramework;
using SolidFramework.Configuration;
using SolidFramework.Converters;
using SolidFramework.Converters.Plumbing;
  1. 前期准备, 设置路径个许可证
string directoryName = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
char directorySeparatorChar = Path.DirectorySeparatorChar;
string str = string.Concat(directoryName, directorySeparatorChar.ToString(), "SolidFramework");Installer.NativePlatformDirectory = str;
Installer.ForceUnpack = false;
License.Import("Solid Framework", "xxxx", "xxx", "xxxxxxxxxxxxxxx", "NOCALL");
  1. 初始化SolidFrame Pdf Converter
//Add the PDF file to convert
pdfToWordConverter.AddSourceFile(path);
//Settings
pdfToWordConverter.ReconstructionMode = option.C_ReconstructionMode;
pdfToWordConverter.DetectTables = option.Table_Detection;
pdfToWordConverter.OutputType = WordDocumentType.DocX;
pdfToWordConverter.HeaderAndFooterMode = option.C_HeaderAndFooterMode;
pdfToWordConverter.ImageAnchoringMode=option.C_ImageAnchoringMode;
pdfToWordConverter.OverwriteMode = SolidFramework.Plumbing.OverwriteMode.ForceOverwrite;
pdfToWordConverter.KeepCharacterSpacing = false;
FileInfo fileInfo = new FileInfo(path);
pdfToWordConverter.TextRecoveryType = option.Recognize_Text;
pdfToWordConverter.OutputDirectory= fileInfo.DirectoryName;
pdfToWordConverter.SupportRightToLeftWritingDirection = true;
pdfToWordConverter.DetectLists = true;
pdfToWordConverter.DetectStyles = true;
pdfToWordConverter.DetectToc = true;
pdfToWordConverter.MarkupAnnotConversionType = MarkupAnnotConversionType.Never;
pdfToWordConverter.TextRecoveryNseType = TextRecoveryNSE.Never;
  1. OCR识别引擎, 这里使用内置引擎
pdfToWordConverter.TextRecoveryEngine = TextRecoveryEngine.SolidOCR;
  1. 一切就绪开始转换
pdfToWordConverter.Convert();
ConversionStatus status = pdfToWordConverter.Results[0].Status;
  1. 关于ConversionStatus
    ConversionStatus 定义了多种转换状态IO错误密码错误等
 public enum ConversionStatus{Success = 0,Canceled = 1,InternalError = 2,Unknown = 200,Fail = 3,BadData = 5,IOError = 6,IOFileLocked = 7,NotEnoughMemory = 9,FileHasCopyProtection = 10,InvalidPagesRange = 8,UnsupportedEncryptionHandler = 11,MissingCertificate = 12,OCRCanceled = 13,NoTablesToExtract = 0xF,NoImagesToExtract = 0x10,NoBppConversion = 150,NoGrayscale = 151,PSDUnsupportedMode = 152,PdfAError = 20,PdfAFatalError = 21,CanceledExists = 14,WrongPassword = 0x1F,NoUserNoOwner = 0x20,NoUserOwner = 33,UserNoOwner = 34,UserOwner = 35,InvalidLicense = 36,AlreadyLoaded = 30,UnavailableAction = 4}

关于输出格式
pdfToWordConverter.OutputType = WordDocumentType.DocX;
可以是Doc或Docx

执行后
就可以将PDF转换成Word了

使用.NET 将PDF转成Word相关推荐

  1. 怎样把pdf转换成word

    PDF格式良好的视觉阅读性和通用性使得PDF文件的使用越来越广泛了,网络上的PDF资料也越来越多,但是我们往往想要提出某些资料里面的部分文字内容进行二次编辑,那么我们这里就是讲比较通用的PDF转为WO ...

  2. 如何将加密PDF转换成Word文档

    PDF最强大的一个加密保护功能就是必须输入密码才能阅读,或者任意的复制打印,这是优点,但是对我们来说更多的时候是麻烦.因为不能复制就不方便.有了密码就不好转换,比较头疼.给大家介绍将PDF解密,然后把 ...

  3. 处理中文乱码_为什么PDF转换成Word后是乱码?这种PDF要怎么转换?

    你是否也遇到过将PDF转换成Word后,却只是一堆乱码?为什么会出现这种情况呢?要如何解决PDF转Word却是乱码的这个问题呢? 首先我们来分析下PDF转换Word后为什么会出现乱码,其实归根究底都是 ...

  4. 怎么将pdf转换成word

    大家想要保存一份文件的时候,往往首选PDF文件,这是一种保存性能比较高的文件,可是当我们要编辑文件的时候,往往都是把PDF文件转换成大家最为了解的Word文档来进行编辑.下面小编就将总结出来的怎么将P ...

  5. wps xml转换表格_这功能WPS卖近百元?教你免费将PDF转成Word

    [PConline 应用]PDF文件如何转换成为Word?很多朋友研究这个问题已经很久了,PDF更利于统一格式传播,Word更便于编辑,因此收到PDF文件后.想要修改时要如何将PDF转换成Word可谓 ...

  6. python批量将pdf转成word_如何用Python把pdf转换成word

    很多时候,我们需要把文件的形式来回转换.那么学了编程的小伙伴,我们该如何用Python把pdf转换成word呢? 一.下载所需要的库 1.pdfminer 安装库命令pip install pdfmi ...

  7. pdf转换成word教程

    pdf如何转换成word?这是很多网友都在咨询的一个问题,大家在工作生活中经常需要将无法编辑的PDF文件转换成可以编辑的word文件,这样就可以 对PDF文件中的内容进行修改,而大家都知道,PDF文件 ...

  8. blob js 下载word乱码_这几个相见恨晚的PDF转换成Word技巧,请收好

    生活学习中,免不了上网查找一些专业资料或者学术论文等,下载下来发现几乎都是PDF格式,若想对PDF文档进行编辑,实属不易,如何有效地对PDF文档进行图片,文字等复制,粘帖使用呢? 答案很简单,直接将P ...

  9. word转txt_将PDF转换成Word,一个APP就能轻松搞定!

    工作后会越来越多的接触并使用各种格式的文档,如PDF.Word.PPT.Excel等等. 由于这些文档使用环境的不同,有时需要将它们进行相互转换,比如将PDF转换成Word.将Excel转换成PDF等 ...

  10. 将PDF转换成Word文档后,为什么字体全变了?

    Word作为目前最常用的办公软件之一,对于一些上班要经常使用需要修改各种文档的人来说,虽然PDF格式更文档,但编辑却比较复杂,所以一般都是将PDF转成Word,但有时转出来的Word字体却与PDF不一 ...

最新文章

  1. 【云栖直播】精彩推荐第2期:首届阿里巴巴研发效能嘉年华
  2. 20145209 2016-2017-2 《Java程序设计》第8周学习总结
  3. linux-squirrel
  4. 【机器学习基础】浅析机器学习集成学习与模型融合
  5. CPU : Intel CPU命名规则
  6. div设置overflow-scroll滚动之后,jq获取其子元素的offset.top出现问题。
  7. Bug调试(lldb)
  8. python编程高手教程_写给编程高手的Python教程(01) 数据结构
  9. 【51nod 1331】狭窄的通道
  10. Nodejs windows的安装
  11. python mvc框架_MVC其实很简单(Django框架)
  12. C++《STL和泛型编程》算法accumulate、for_each、sort简单使用例子
  13. 对比会声会影与剪映哪个制作转场效果更专业
  14. nginx+uwsgi+django
  15. AGM FPGA选型手册
  16. Python期末考试-中心点问题
  17. php 机器人的运动范围,ABB机器人高级技巧,区域监控,多任务,限定单轴运动范围,奇异点的管理...
  18. Head first jQuery读书笔记
  19. 灰度图片及彩色图片像素点统计及显示
  20. linux中使用crontab出现crontab: installing new crontab

热门文章

  1. JavaSE06-集合
  2. 想剑网三妹子最多服务器,每当谈论起哪款端游女生玩家多,为什么我们总是会想起剑网3?...
  3. Python从Bing壁纸的API接口保存图片
  4. 手机电视入网难题将不了了之
  5. 坑人无数的俩货:半包和粘包
  6. 威联通建php邮件服务器_威联通TS-563虚拟机安装LEDE+单网口NUC+VLAN配置(网件GS105V2)...
  7. 读书笔记《进化的力量:刘润年度演讲1》
  8. ipadpro如何分屏_不再泡面!大学生如何用iPad高效学习
  9. SAP所有模块用户出口(User Exits) 二
  10. 测试人员的工作周报或工作总结怎么编写?