EPUB PDF DOCX格式转换及主流格式电子书制作终极攻略

(内含用WORD制作精美EPUB方法)

peter@ifstudios

2012/10/25

绝对原创,博客园首发,转载请说明谢谢!

0.引子

一切源于停电。

吐槽一下:冬天来临,我所在的地方开始频繁停电。多年以来,为了熬过漫长的五个多月严冬,方法用尽。从购买发电机、将台式PC换成笔记本,后面又买了IPOD TOUCH 4, 还为它配了移动电源,后来买了太阳电池板和蓄电池……可是都不能保持24小时有电。对于我这个技术宅控来说,没有电是无法忍受的折磨。

今冬的办法是网购了一台KINDLE 5。目前这台KINDLE还在路上,邮过来要二十来天。

然后趁着这段时间开始研究电子书的格式转换、阅读体验以及制作。

经过数天的搜索、试验、对比,撰文以备忘,同时分享,以解决广大书友们的一些困惑。

PS1. 诸多软件来自网络高手的推荐,如果不是他们,我都不知道有这些软件的存在。

PS2. 我只是一个发现者、收集者、试验者,最终制作电子书的目的是为了满足自己对阅读效果近乎强迫症式的精益求精。不过我相信,每一位尝试制作电子书的网友,都有着追求完美的潜质以及主动创新的心理,也许是源于对简单从网络上下载各种格式的电子书及阅读体验不满足吧。

PS3. 请大家多动手多实验,发现改进的地方,致电IFSTUDIOS@163.COM.

PS4. 本文提供了一种终极的精美EPUB制作方法,极为简单,和大家在网络上搜索到的有极大区别,喜欢EPUB的都欢呼吧!本来还是比较喜欢PDF的(虽然我电脑上EPUB电子书居多,谁让现在EPUB的网络资源多多呢?),但是发现这种EPUB制作方法后,对EPUB也开始喜欢了,毕竟太简单了,效果太赞了!

1.格式简介

相信大家对于电子书的格式相当熟悉了,就不再多言。我个人认为,当今比较流行的电子书格式有三类:

PDF    精确简洁、所见所得、平台无关、支援成熟。

TXT    简洁。

EPUB   开放标准,功能丰富,活力十足。

2.EPUB、PDF制作/编辑/转换攻略大全

此攻略在讲述各源格式生成方法同时,主要介绍EPUB和PDF及相关格式互转方法。转换时要灵活运用,如无法直接转换,可以先转为某种通用中间格式(如TXT,现在绝大部分电子书格式均可通过网络上五花八门的转换工具转为TXT)。

评价一款软件转换效果好坏,主要取决于对源格式的保留程度,最重要的几个指标分别是:标题、目录(书签)、文本、字体、图片、表格,其次是脚注、批注、颜色、图文混排等。

注:在CALIBRE中EPUB和MOBI可以互相转换而几乎没有任何格式损失,所以可将两者看作同一层次转换目标,不再详述。

2.1 PDF

此处所涉及的PDF指文字版PDF。扫描版PDF的生成不作讨论,对其处理稍候详述。

2.1.1 PDF制作/生成

PDF的制作相对简单,特别是在WORD和WPS中加入将文档直接另存为PDF格式的功能后,PDF的制作再也不用像以前一样使用ACROBAT虚拟打印服务了。只需在WORD或WPS中将文本、图片、表格、页面设置等各种复杂格式处理完毕后,直接另存为PDF即可。这种方法处理的PDF,无论源文档多么复杂花哨,转换后的PDF与打印效果几乎完全一致,并且生成的PDF文档可以直接利用原文中的各级标题生成标签,极为方便。此外OPENOFFICE也支持此功能,可惜生成的书签有点乱,不知道怎么调一下。

对应电子阅读的PDF生成,主要是利用模板,比如对应KINDLE的6寸页面模板。

推荐软件:MICROSOFT WORD, KINGSOFT WPS, ADOBE ACROBAT, FOXIT PDF EDITOR等。

2.1.2 PDF的编辑

有消息称MICROSOFT WORD 2013将支持PDF编辑功能,但是目前PDF编辑功能最强大的当属ADOBE ACROBAT,不再多说。

其它如FOXIT PDF EDITOR等可以作为补充,但是功能相对较弱。

推荐软件:ADOBE ACROBAT。

2.1.3 PDF转换

PDF作为一种终端格式,转换回纯文本很方便,但是要转为其它格式就比较麻烦,效果也不尽人意。因此推荐将PDF转为DOCX或TXT后,排版再转为其它格式。

PDF转DOCX或TXT    最佳软件仍然ADOBE ACROBAT,无须多言。CALIBRE和其它网络上可以搜索到的PDF TO XXX转换器几乎一样,效果实在太差。

PDF转EPUB    DONGSOFT PDF TO EPUB CONVERTER,相比一起出品的EPUB TO PDF CONVERTER,转换效果一般。CALIBRE的转换效果,惨不忍睹。其它提供这项功能的软件,不多且效果不好,如ANYBIZSOFT PDF CONVERTER等便捷转换工具的通病就是转换后目录丢失。

附1:扫描版PDF处理方法:BRISS是一款极为优秀的切白边软件,将扫描版用它处理后横屏阅读会稍好,这也是没办法的办法了!

附2:带权限密码的PDF,用SIMPO PDF PASSWORD REMOVER处理即可,速度超快,几乎瞬间完成。

2.2 EPUB

2.2.1 EPUB的制作(超级攻略)

重头戏来了。网络上有关EPUB制作的文章不多,一直以来,我对EPUB的制作都觉得很神秘,现在,奇迹即将出现……

2.2.1.1 罕见的用WORD制作EPUB的方法

想必大家都对多看推出的精美到变态的EPUB电子书叹为观止,同时好奇这是怎么做出来的?为什么我们用EPUBBUILDER、EPUBMAKER、CALIBRE等软件生成的EPUB总是那么丑陋?难道真的需要我们去花时间学习XML、CSS?

答案是否定的!

这一切都是因为有了一款插件,名字叫 ASPOSE.WORD!

大家对它很陌生?嘿嘿,在商业控件领域它可是大名鼎鼎!

不禁要问,这货有什么用?

很有用!

最变态的一个技能,就是大招:

直接可以把WORD文档另存为EPUB!!!

嘿嘿,这还不算最变态的,还有更变态的!

毕竟ASPOSE.WORDS FOR MICROSOFT WORD只支持 OFFICE 2007 SP2,其它版本无法使用!如果你没有安装相应版本,比如你装了OFFICE 2010,难道还要装回老版本?甚至有的人干脆用的是WPS或OPEN OFFICE呢?

不怕!

登录ASPOSE官方网站,点击FREE UTILITIES,天啊,竟然一款叫做Aspose.Words.Express的工具,下载一看,它只有一项功能,就是把各类支持的文档(包括WORD生成的DOC,DOCT,DOCX,DOTX,DOCM,DOTM,XML,WML,RTF格式,OPENOFFICE生成的ODT,OTT,以及各类网页文件。注:OPENOFFICE有一款PINCETTE插件支持这个功能,可惜是收费的)直接转换为EPUB!经测试,转换效果和使用WORD2007插件另存的相同,换速度也同样快得不得了,无论多大的DOCX,瞬间转换完成!

这还不算更变态的,还有更更变态的!用这种方法转换的EPUB,支持目录(前提是你设置了标题样式并生成了自动目录)、图片、表格(边框要设置粗一点在某些EPUB阅读器中才有效果),其它功能还没试。

注意:直接转换完成的EPUB存在一些小问题,比如只有书内跳转链接,却没有自动目录……不急!有一款强大软件,叫做CALIBRE哈哈,用它再转一次EPUB即可解决。

 

2.2.1.2 终极的用ADOBE INDESIGN制作EPUB的方法

怎么样?上面的EPUB制作方法已经够狠了吧?说实话当我发现这个方法的时候,着实激动不已!可是,不要忘了,还有一款软件,它就是大名鼎鼎的ADOBE INDESIGN,DTP领域的优秀工具!

关于ADOBE INDESIGN,专业文章很多,不多说了,用过才知道哈哈!

2.2.1.3 其它制作工具/软件

比如EPUBSTAR(听说有CSSSTAR更高级,估计是和EPUBSTAR一样收费的,LITE版的EPUBSTAR限制多多),比如EPUBBUILDER,比如CALIBRE,比如EPUBMAKER……我相信,所有你能想得到的工具,在ASPOSE.WORDS和直接写源码这两个方法面前,都弱爆了!

此外听说AMAZON还有专门的命令行工具KINDLEGEN,可惜在AMAZON网站上下载时提示你所在的地区无法使用。有机会试验一下。

听说STANZA DESKTOP也能方便转换各种格式至EPUB,可惜下载不到。

2.2.2 EPUB的编辑

鉴于EPUB只是一个ZIP包,可以通过解压后直接编辑源码或素材、或直接在SIGIL、CALIBRE中编辑,不再详述。

2.2.3 EPUB转换

EPUB转DOCX或TXT无非是使用CALIBRE等转换软件,这种工具相当多,效果大同小异,自己慢慢体会。

EPUB转PDF,嘿嘿,因为是为KINDLE准备PDF嘛,还是前面提到的那一款EPUB TO PDF CONVERTER,这种方向的转换软件非常少见,并且这款软件只能试用15次,我只能装在虚拟机中用循环快照的方法使用!但是经实验,转换效果和它宣称的一样,99%准确!直接将EPUB转换为6英寸页面的PDF文档,字体是MINGLIU,经查是繁体中文操作系统中常用的一种字体,比较酷。当然,如果不喜欢,可以将生成的PDF用ACROBAT转为DOCX,修改字体后再转回PDF即可。

3.小结

经过几天的折腾,试验二十款左右的各类转换工具及专业软件,心得很多。最大的心得就是:PDF和EPUB都是终端格式,对其进行修改的最佳方法,就是拿到源文档,可是网络出版物怎么会让读者拿到源呢?所以,追求完美的人,可以在自己的电子书库中,另存一套转换为DOCX格式的源文档,方便随时转换为其它格式。

自己动手,丰衣足食。相信每个读着自己亲手制作的电子书的人,都是快乐而充足的!

转载于:https://www.cnblogs.com/ifstudios/archive/2012/10/25/2739333.html

EPUB PDF DOCX格式转换及主流格式电子书制作终极攻略(内含用WORD制作精美EPUB方法)...相关推荐

  1. Java使用aspose把PDF文件转换成PNG文件,以及把PDF文件水印转换成PNG格式

    Java代码把PDF文件转换成PNG文件 需要引用aspose包,引入操作我写了一个博客,地址如下 https://blog.csdn.net/weixin_46713508/article/deta ...

  2. html文件转换html格式,pdf文件怎么转换成html格式

    PDF文件怎么转换成html格式呢?html格式其实就是网页格式,PDF文件和网页文件一般情况下是两种完全不搭边的格式,但是不可否定的是办公室的多样化总有人会有这样的需求,只要有需求就会有其相应的解决 ...

  3. 如何将PDF格式转换成Excel格式?

    PDF和Excel这两种格式在我们的日常办公中经常需要用到,有时候PDF带有很多表格,但PDF格式的特殊性,不能进行类似Excel的操作,虽然有PDF编辑器可以直接编辑,但局限性还是很明显的,这时就需 ...

  4. 怎么把html文档转换成doc,Word文档如何把docx格式转换成doc格式

    大家在使用office2003Word文档的时候发现打不开docx格式的文档,这个时候就需要把docx格式转换成doc格式再打开了,只要把docx文档另存为doc格式就可以用office2003Wor ...

  5. PDF怎么批量转换成TXT格式?

    现在大部分人都有阅读电子书的习惯,通常电子书的文件格式都是TXT文件形式,TXT文件是微软在操作系统上附带的一种最常见文本格式,它体积小.存储简单方便,所以我们通常会使用这种格式文档.有时候我们在网上 ...

  6. 如何把PDF文档转换成TXT格式文件

    在日常学习和日常工作中,如何将PDF文件转换为TXT文本? 尽管PDF文件的用户数量正在增加,但是TXT文本格式的接受度将会更高. 毕竟,TXT文本格式是任何设备都可以打开的格式.那么如何将PDF文件 ...

  7. 支持导出PDF文件并转换成图片格式的PDF查看控件Spire.PDFViewer

    Spire.PDFViewer for .NET是一款功能强大的PDF查看控件.它是由e-iceblue公司在2012年新推出的一款产品.它允许开发者从本地文件夹(File),stream和byte ...

  8. pdf文件怎么转换成excel格式?

    在办公中文件格式之间的相互转换是很常见的操作方式,就像把不能直接进行编辑的PDF文件转换成excel表格,就可以帮助我们更快更好的做好数据,比起使用传统的编辑方式,显然转换来的效率更高.那pdf文件怎 ...

  9. 什么文件可以保存成html文件格式,PDF文件可以转换成html格式吗

    原标题:PDF文件可以转换成html格式吗 PDF文件怎么转换成html格式呢?html格式其实就是网页格式,PDF文件和网页文件一般情况下是两种完全不搭边的格式,但是不可否定的是办公室的多样化总有人 ...

  10. 如何将PDF文件批量转换成图片格式

    在我们的日常工作中文件转换是一件常见的日常工作,而PDF文件转换是每一个上班族必备的技能之一,比如讲PDF文件转换成图片格式.毫无疑问PDF格式给用户带来更好的阅读体验,PDF文件是一页一页的文件形式 ...

最新文章

  1. 各种 django 静态文件的配置总结【待续】
  2. 聚合中返回source_Java 8 中的 Streams API 详解—— Streams 的背景以及 Java 8 中的使用详解...
  3. 142. Linked List Cycle II 环形链表 II
  4. nginx curl linux,linux nginx 下通过curl url方式,符以后的参数无效
  5. 在eclipse中使用第三方库总结
  6. Gson转Map时,Int会变成double解决方法
  7. Linux磁盘管理详解
  8. 深入研究RocketMQ生产者发送消息的底层原理
  9. 智慧零售怎么做客流统计和客流分析?|图普客流统计系统
  10. RS485接口的EMC设计方案
  11. VSCode项目启动与调试配置
  12. AT89C51中断模板(宏定义)
  13. 关于使用J-Flash直接烧录bin文件的方法
  14. h5调用指纹识别_H5 画布指纹识别
  15. 苹果IOS9为加强个人隐私信息保护强制HTTPS,APP开发者需申请SSL证书
  16. voyage java_Voyage:Java 实现的基于 Netty 的轻量、高性能分布式 RPC 服务框架
  17. win10必须禁用的服务_WIN10优化小技巧
  18. 基于jdk8 LocalDate系列API的全新实用时间工具类
  19. ui标注android ios,IOS+ANDROID的UI切图与标注方法
  20. HTTP Live Streaming 分析

热门文章

  1. win10系统镜像文件iso下载教程
  2. 用友U8软件功能集合
  3. 《InfoGAN: Interpretable Representation Learning》翻译
  4. AllenNLP—笔记—TokenEmbedder
  5. 【孪生网络siamfc代码学习】
  6. layui表单验证,表单提交的若干个方法
  7. java程序开头一般怎么写,附源代码
  8. Android腾讯微博开放平台入门(一)开题与BaseString
  9. python webqq机器人_使用Python的Tornado框架实现一个简单的WebQQ机器人
  10. 模拟退火算法介绍和实例实现