本文针对各种情况下文字识别进行总结,电脑技巧帮助大家掌握正确方法,节省时间,本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案:

1、PDF文件的识别:

1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 5 专业版,注意不是acrobat reader,直接另存为rtf文件(识别整个文件),或者选择工具栏上的文字选择按钮,然后选择文字区域,然后复制到word等中。

2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003,并装上office工具Microsoft Office Document Imaging(完全安装此工具),然后在打印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用Microsoft Office Document Image打开此文件,然后选择“工具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文本发送到word”,最后将把整个PDF文件识别输出到word文件中。

电脑技巧提醒你注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit软件将图形打开,然后复制到word中。(所有的识别软件都不能很好的处理图形的识别问题,Microsoft Office Document Image的这种处理方法已经是非常好的解决这个问题了。)

3)加密的Pdf文件:先下载解密软件,解密后在参看1),2)
4)繁体pdf文件:用2)的方法识别到word后,用word中的“工具”--“语言”---“中文繁简转换”
2、让JPG上的文字转换到WORD中在日常工作中,我们可能会遇到需要把扫描后的表格或文章再重新修改或排版,然而大家都知道,扫描后的文件格式是图片格式.一般情况下只有高档点的扫描仪可以直接选择扫描成PDF后者WORD格式.但是如果我们只有普通的扫描仪,而又要做到修改扫描后的文档,现在我就来教大家怎么在条件限制下,达到我们的目的.
首先我们要准备好OFFICE 2003,然后打开OFFCIE工具中的Micosoft Office Document Scanning工具,设置完后,我们就可以在需要修改的图片上右击,选择打印,然后一直下一步,知道选择打印机时,选择Micosoft Office Document Image Writer,然后将图片打印到文件扩展名为mdi格式的图片格式.打开后选择菜单工具中的"将文本发送到WORD".就是这么简单方便

3、caj文件的识别:

1)局部文字识别:直接使用caj浏览器的ocr
2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样
3)博硕论文全文下载:在线阅读博硕论文,待可以看到最后一页后,不要关闭caj浏览器,到caj安装目录下cache中找到一个较大的文件,拷贝到其他位置即可。然后使用2)全部转化为word。

4、超星文件的识别:

1)局部文字识别:直接使用超星浏览器的ocr
2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别把目录和正文识别到word中,在合并到一起。打印时要填入打印页码从1到最后一页,不要选择打印全部。此外在打印选项中,还要将页面比例设成真实大小,而不是整宽。注意:识别速度比其他格式要慢很多,请保持耐心,但是最后当你看到轻松的生成全本书的word版本时,你会欣喜若狂的,呵呵。我的试验结果是一本280页的书,识别需要几分钟的时间。

3)超星相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的pdf文件,然后在用1、的方法转成word

5、其他情况下的识别:

使用snagit软件将任何形式的文字可以变成图片,例如使用snagit将屏幕拷贝成图片,然后右键点击图片文件,用microsoft Office Document Image打开图形,其他和2)一样。

注意:其他的各种识别软件请不要在用,因为要么只能识别中文,要么只能识别英文,要么不能识别整个文件,要么不能识别屏幕拷贝图像,要么识别误差很大,要么不能识别表格,要么需要注册,要么识别速度很慢,要么使用不便(和word结合不紧),这些软件包括:紫光ocr,万方pdfocr,尚书,汉王,ScanSoft PDF Converter,pdf2word,以及各种被推荐的软件等等,我都装过,现在都像垃圾一样删除了。只要安装了acrobat 专业版,snagit,office2003,现在你可以完美的做任何事,最重要的是这几个软件很好得到。

针对一些问题的补充:
经过一些试验,发现microsoft Office Document Image 存在一些不稳定的问题,例如在用caj打印到Microsoft Office Document Image Writer打印机时,发现用caj5.5版本比较快,(caj5.5不能加升级补丁),而caj5.0有时出现假死机。
另外页面显示大时,转化的识别率较高。
如果页数多的文件,包括超星,如果有问题,可以分多次转化。

电脑技巧再次补充:
1、由于虚拟打印到Microsoft Office Document Image Writer 比较慢,并且形成的虚拟文件很大,1本200多页的书大约是60M,因此会严重影响机器的运行速度和C盘空间以及内存空间,建议配置好的机器一次转化不要超过200页,配置差的不要超过100页,同时打印时在右下角系统栏中会出现打印机图,你可以双击,看到打印任务的进度,以免以为死机了。另外转化完成后请删除c:windowstemp目录下的虚拟打印文件,否则你的c盘很快会被用光。

2、建议如果发生打印到Microsoft Office Document Image Writer很慢或者假死的情况,可以先打印到snagit虚拟打印机,会自动生成tiff文件,速度比Microsoft Office Document Image Writer快,然后在snagit中,选择打印机为Microsoft Office Document Image Writer打印机,(相当于再打印到Microsoft Office Document Image Writer打印机),然后选择snagit---outputs下的printer,然后选择snagit----file----finish output,即可生成msi文件,其他一样。

转载于:https://blog.51cto.com/liangruijun/634921

各种格式文件转换成word文件的方法相关推荐

  1. 怎样快速将PPT文件转换成Word

    Microsoft Office Word是一款强大的文档编辑软件,它可以帮助我们将PPT文件转换成Word文档. 利用Microsoft Office Word,将PPT文件转换成word操作过程如 ...

  2. 在线将PDF文件转换成Word新方法

    随着PDF格式文档的盛行,使用它办公的人也越来越多,PDF如何转换成Word文档,如果在Word文档中进行编辑.修改已经成为大家的需要.当你的手头上有少数PDF文档,无需借助PDFF转换工具,在线PD ...

  3. 如何将有打开密码的PDF转换成Word文件

    想要把PDF转换成word文档但是发现PDF文件有打开口令密码该怎么办? 想要将有打开口令密码的PDF文件转换成Word文件,在我认为需要两个步骤,首先将PDF的口令密码找回或者破解,然后再将PDF文 ...

  4. 如何将caj格式文件转换成word文档

    我们在知网下载文件的时候,就有很多文件都是caj格式的,我们想用它里面的素材写一篇文章,就需要将caj文件转成word文档了,如何将caj格式文件转换成word文档呢? 下面小编教大家caj文件转换成 ...

  5. word转pdf图片模糊怎么办_嗨格式PDF转换器如何将PDF文件转换成Word?PDF转Word方法...

    日常办公,我们有时候需要将PDF文件格式进行转换,鉴于PDF文件的特殊性,这就需要借助专业软件,例如嗨格式PDF转换器.嗨格式PDF转换器支持PDF.Word.Excel.PPT.图片等多种文件格式互 ...

  6. 如何使用ABBYY FineReader 12将JPEG文件转换成Word文档

    日常工作中处理JPEG格式的图像文件时,有时需要转换成Word文档进行编辑,市场上应用而生了很多转换工具,相信不少人听说过OCR(光学字符识别)软件,可以用来转换图像文件,而在OCR软件中, ABBY ...

  7. bin文件怎么转换成文本文档_怎么把pdf文件转换成word文档?这样转很简单

    在日常的学习.工作生活中,小伙伴们总少不了要对文件格式进行转换操作,例如把pdf文件转换成word文档.对于职场老手来说,这当然不算一个难度操作,甚至还很简单.但对于职场新人而言,找不对方法,可能操作 ...

  8. 如何将扫描PDF文件转换成word,两个超简单的方法一看就会

    在工作中我们都会经常接触到PDF文件,但是这些都是比较常见的,有时候会因为工作的需要要接触扫描格式的文件,比较难的是需要将扫描PDF文件转换成Word,很多人就很头疼,不知道该从哪里开始下手去做,虽然 ...

  9. 怎么把OFD文件转换成Word?分享轻松转换的方法

    怎么把OFD格式的文件转换成Word文档呢?大家在日常工作中经常会遇见把PDF文件转换成Word,但是如果遇到OFD格式的文件就会不知道怎么转换了,这种格式的文件通常在一些电子发票.电子公文上可以遇到 ...

最新文章

  1. TensorFlow基础10-(误差反向传播算法以及实现多层神经网络)
  2. 是同步方法还是 synchronized 代码?-- 详解多线程同步规则
  3. Instruments--CoreAnimation页面性能调试
  4. LGDT/LIDT - 加载全局/中断描述符表格寄存器
  5. 数据挖掘中的概念描述
  6. 基于 FPGA 的以太网回环测试verilog实现UDP协议
  7. IDL与C#混合编程技术
  8. 第一阶段 XHTML.定位样式
  9. webstorm 运行android,Windows React Native环境搭建:webstorm+android studio 及解决热更新
  10. Python一题多解:水仙花数
  11. UnityShader28:噪声纹理
  12. spring boot: 组合注解与元注解
  13. 小程序开发:python sanic 实现小程序登录注册
  14. HDU 4417 Super Mario 主席树
  15. (四) Session管理 --《springboot与shiro整合》
  16. MA Chapter 3 Presenting information(SRCharlotte)
  17. postgresql 数据库中 like 、ilike、~~、~~*、~、~*的含义
  18. 误发邮件怎么办?发错邮件如何撤回?/
  19. 图像算法---贝塞尔曲线
  20. 机器学习吴恩达课程总结(一)

热门文章

  1. 详解QQDIY名片json代码
  2. laravel5.2 生成缩略图
  3. RFID服装店面管理系统
  4. 【转载】windows 如何一键关闭所有进程程序 --- (博客园 - 木人子韦)
  5. C++ 头插法建立单链表,单链表原地逆置以及尾插法建立单链表
  6. 555定时器构成的多谐振荡器波形_20160102
  7. vue项目PC兼容移动端
  8. Qt 事件机制源码分析 QApplication exec 源码分析 多图超级详细
  9. 适合C语言的代码编辑器(阅读软件)
  10. win10电脑网络中WiFi丢失