使用.NET 将PDF转成Word
使用Solid Framework可以很方便的已编程方式将PDF转换成Word文件格式
- 首先准备一套Solid Framework
- 在Visual Studio中建立一个项目并引用SolidFramework.dll
- 添加命名空间 SolidFramework
using SolidFramework;
using SolidFramework.Configuration;
using SolidFramework.Converters;
using SolidFramework.Converters.Plumbing;
- 前期准备, 设置路径个许可证
string directoryName = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
char directorySeparatorChar = Path.DirectorySeparatorChar;
string str = string.Concat(directoryName, directorySeparatorChar.ToString(), "SolidFramework");Installer.NativePlatformDirectory = str;
Installer.ForceUnpack = false;
License.Import("Solid Framework", "xxxx", "xxx", "xxxxxxxxxxxxxxx", "NOCALL");
- 初始化SolidFrame Pdf Converter
//Add the PDF file to convert
pdfToWordConverter.AddSourceFile(path);
//Settings
pdfToWordConverter.ReconstructionMode = option.C_ReconstructionMode;
pdfToWordConverter.DetectTables = option.Table_Detection;
pdfToWordConverter.OutputType = WordDocumentType.DocX;
pdfToWordConverter.HeaderAndFooterMode = option.C_HeaderAndFooterMode;
pdfToWordConverter.ImageAnchoringMode=option.C_ImageAnchoringMode;
pdfToWordConverter.OverwriteMode = SolidFramework.Plumbing.OverwriteMode.ForceOverwrite;
pdfToWordConverter.KeepCharacterSpacing = false;
FileInfo fileInfo = new FileInfo(path);
pdfToWordConverter.TextRecoveryType = option.Recognize_Text;
pdfToWordConverter.OutputDirectory= fileInfo.DirectoryName;
pdfToWordConverter.SupportRightToLeftWritingDirection = true;
pdfToWordConverter.DetectLists = true;
pdfToWordConverter.DetectStyles = true;
pdfToWordConverter.DetectToc = true;
pdfToWordConverter.MarkupAnnotConversionType = MarkupAnnotConversionType.Never;
pdfToWordConverter.TextRecoveryNseType = TextRecoveryNSE.Never;
- OCR识别引擎, 这里使用内置引擎
pdfToWordConverter.TextRecoveryEngine = TextRecoveryEngine.SolidOCR;
- 一切就绪开始转换
pdfToWordConverter.Convert();
ConversionStatus status = pdfToWordConverter.Results[0].Status;
- 关于ConversionStatus
ConversionStatus 定义了多种转换状态IO错误密码错误等
public enum ConversionStatus{Success = 0,Canceled = 1,InternalError = 2,Unknown = 200,Fail = 3,BadData = 5,IOError = 6,IOFileLocked = 7,NotEnoughMemory = 9,FileHasCopyProtection = 10,InvalidPagesRange = 8,UnsupportedEncryptionHandler = 11,MissingCertificate = 12,OCRCanceled = 13,NoTablesToExtract = 0xF,NoImagesToExtract = 0x10,NoBppConversion = 150,NoGrayscale = 151,PSDUnsupportedMode = 152,PdfAError = 20,PdfAFatalError = 21,CanceledExists = 14,WrongPassword = 0x1F,NoUserNoOwner = 0x20,NoUserOwner = 33,UserNoOwner = 34,UserOwner = 35,InvalidLicense = 36,AlreadyLoaded = 30,UnavailableAction = 4}
关于输出格式
pdfToWordConverter.OutputType = WordDocumentType.DocX;
可以是Doc或Docx
执行后
就可以将PDF转换成Word了
使用.NET 将PDF转成Word相关推荐
- 怎样把pdf转换成word
PDF格式良好的视觉阅读性和通用性使得PDF文件的使用越来越广泛了,网络上的PDF资料也越来越多,但是我们往往想要提出某些资料里面的部分文字内容进行二次编辑,那么我们这里就是讲比较通用的PDF转为WO ...
- 如何将加密PDF转换成Word文档
PDF最强大的一个加密保护功能就是必须输入密码才能阅读,或者任意的复制打印,这是优点,但是对我们来说更多的时候是麻烦.因为不能复制就不方便.有了密码就不好转换,比较头疼.给大家介绍将PDF解密,然后把 ...
- 处理中文乱码_为什么PDF转换成Word后是乱码?这种PDF要怎么转换?
你是否也遇到过将PDF转换成Word后,却只是一堆乱码?为什么会出现这种情况呢?要如何解决PDF转Word却是乱码的这个问题呢? 首先我们来分析下PDF转换Word后为什么会出现乱码,其实归根究底都是 ...
- 怎么将pdf转换成word
大家想要保存一份文件的时候,往往首选PDF文件,这是一种保存性能比较高的文件,可是当我们要编辑文件的时候,往往都是把PDF文件转换成大家最为了解的Word文档来进行编辑.下面小编就将总结出来的怎么将P ...
- wps xml转换表格_这功能WPS卖近百元?教你免费将PDF转成Word
[PConline 应用]PDF文件如何转换成为Word?很多朋友研究这个问题已经很久了,PDF更利于统一格式传播,Word更便于编辑,因此收到PDF文件后.想要修改时要如何将PDF转换成Word可谓 ...
- python批量将pdf转成word_如何用Python把pdf转换成word
很多时候,我们需要把文件的形式来回转换.那么学了编程的小伙伴,我们该如何用Python把pdf转换成word呢? 一.下载所需要的库 1.pdfminer 安装库命令pip install pdfmi ...
- pdf转换成word教程
pdf如何转换成word?这是很多网友都在咨询的一个问题,大家在工作生活中经常需要将无法编辑的PDF文件转换成可以编辑的word文件,这样就可以 对PDF文件中的内容进行修改,而大家都知道,PDF文件 ...
- blob js 下载word乱码_这几个相见恨晚的PDF转换成Word技巧,请收好
生活学习中,免不了上网查找一些专业资料或者学术论文等,下载下来发现几乎都是PDF格式,若想对PDF文档进行编辑,实属不易,如何有效地对PDF文档进行图片,文字等复制,粘帖使用呢? 答案很简单,直接将P ...
- word转txt_将PDF转换成Word,一个APP就能轻松搞定!
工作后会越来越多的接触并使用各种格式的文档,如PDF.Word.PPT.Excel等等. 由于这些文档使用环境的不同,有时需要将它们进行相互转换,比如将PDF转换成Word.将Excel转换成PDF等 ...
- 将PDF转换成Word文档后,为什么字体全变了?
Word作为目前最常用的办公软件之一,对于一些上班要经常使用需要修改各种文档的人来说,虽然PDF格式更文档,但编辑却比较复杂,所以一般都是将PDF转成Word,但有时转出来的Word字体却与PDF不一 ...
最新文章
- 【云栖直播】精彩推荐第2期:首届阿里巴巴研发效能嘉年华
- 20145209 2016-2017-2 《Java程序设计》第8周学习总结
- linux-squirrel
- 【机器学习基础】浅析机器学习集成学习与模型融合
- CPU : Intel CPU命名规则
- div设置overflow-scroll滚动之后,jq获取其子元素的offset.top出现问题。
- Bug调试(lldb)
- python编程高手教程_写给编程高手的Python教程(01) 数据结构
- 【51nod 1331】狭窄的通道
- Nodejs windows的安装
- python mvc框架_MVC其实很简单(Django框架)
- C++《STL和泛型编程》算法accumulate、for_each、sort简单使用例子
- 对比会声会影与剪映哪个制作转场效果更专业
- nginx+uwsgi+django
- AGM FPGA选型手册
- Python期末考试-中心点问题
- php 机器人的运动范围,ABB机器人高级技巧,区域监控,多任务,限定单轴运动范围,奇异点的管理...
- Head first jQuery读书笔记
- 灰度图片及彩色图片像素点统计及显示
- linux中使用crontab出现crontab: installing new crontab
热门文章
- JavaSE06-集合
- 想剑网三妹子最多服务器,每当谈论起哪款端游女生玩家多,为什么我们总是会想起剑网3?...
- Python从Bing壁纸的API接口保存图片
- 手机电视入网难题将不了了之
- 坑人无数的俩货:半包和粘包
- 威联通建php邮件服务器_威联通TS-563虚拟机安装LEDE+单网口NUC+VLAN配置(网件GS105V2)...
- 读书笔记《进化的力量:刘润年度演讲1》
- ipadpro如何分屏_不再泡面!大学生如何用iPad高效学习
- SAP所有模块用户出口(User Exits) 二
- 测试人员的工作周报或工作总结怎么编写?