很多pdf文件是直接扫描生成的,于是它的内容都是一张张的图片,当然就更没有目录索引了。

有的时候想找某些内容,只能一点点的移动滚动条,非常不方便。

那么有什么方法能生成目录呢?

方法一:使用福昕pdf编辑器

福昕pdf编辑器使用PRC识别pdf文件,能将pdf文件转换为office文件,更是有目录制作的功能。

但是,亲测后发现:

  1. 也是最关键的问题,他需要money,也就是得升级为会员,才能使用图片识别功能。
  2. 目录制作倒是免费的,但它的目录主要是设置标签,对于目录没有分级功能,且需要一页一页翻的去添加,非常麻烦

总之,最后的制作非常不理想。

方法二:使用FreePic2Pdf

先看一下最终效果图:

我使用的是《同济大学高等数学第六版上册.pdf》,打开pdf的软件是2345看图王,也可以用chrome打开。

怎么样,效果是不是非常良好。

FreePic2Pdf这是一个图片转pdf文件,但主要使用的是它的更改pdf的功能。

至于下载地址就不提供了(因为没找到它的官网),网上一搜一堆,第三方下载地址很多的。

软件打开是这样子的:

这些功能都不需要,主要使用的是右下角的更改pdf,点开之后:

主要使用的就是这一部分的功能。

现在开始目录制作。

先解释一下上述标签的意思:

  1. 往PDF挂书签:就是为pdf文件添加目录。不过需要目录文件,下面会有介绍制作的方式。
  2. 从PDF取书签:就是从有目录的pdf文件中提取出目录文件。
  3. 需要操作的目录文件:就是需要添加目录的PDF文件。
  4. 存放接口的文件夹:就是目录文件,需要制作。

其他的按键一般没什么需要使用的。

制作目录需要一个目录文件,使用的是txt格式。

一、选择一个存放接口的文件夹

这个文件夹可以自己创建。

二,创建配置文件

选定文件夹之后,再点击创建文件夹右边的那个按钮,输入以下模板内容:

[Images][Font]
Language=GBK
FontSize=7
Margin=0.5[Bkmk]
File=FreePic2Pdf_bkmk.txt
AddAsText=0
ShowBkmk=1
ShowAll=1
BasePage=1[Main]
ContentsPage=
TextPage=

保存。之后他就会在选定的文件夹下创建一个名为 FreePic2Pdf.itf 的文件。

三、创建目录文件

在这个文件夹下新建一个 FreePic2Pdf_bkmk.txt 文件。

这个文件就是目录文件,这里的目录需要自定义,它需要按照一定的格式:

一级目录\t页码
\t二级目录\t页码
\t\t三级目录\t页码
。。。

\t表示制表符,也就是TAB键。

例如:

这个文件可以用记事本写,也可以用notepad等等。

那么这些内容具体怎么去写呢?

这个就得看自己的电脑技能了。不过总的来说是以下几步:

1、识别目录文字

  • 可以使用ABBYY软件识别,但是不建议,具体原因请自行入坑。
  • 推荐的:使用网页百度翻译。没错,就是百度翻译,将目录图片粘贴上去,他就自动识别并将中文和英文翻译显示出来了。

  至于目录的图片,你可以截图,也可以使用2345看图王软件,如下图:

直接就复制目录了,这样复制的目录完整一点。

2、目录制作

百度翻译的识别效果如下:

呃,没有换行,内容也有部分缺失,这些都是需要自己去修改。

那么如何将这些内容制作成需要的格式呢,这个。。。要么靠自己手动编辑,如果会正则表达式,可以节省一点时间。

注意:目录的页码是pdf文件的真实页码,而不是书上标志的那些页码,为了方便,可以将接口文件中 BasePage 字段修改为书中第一页对应的pdf页数。

如:BasePage=12

制作成功后,选择相应的文件,如下图:

再点击开始,没问题的话瞬间制作完成。制作前记得先保存副本。

接着再点开pdf文件,就会发现目录有了:

到此,制作完成!!!

转载于:https://www.cnblogs.com/twoice/p/10574668.html

对扫描的pdf文件生成目录相关推荐

  1. 为扫描版PDF一键生成目录

    PDF是图片没目录咋办 1. 前言 最近找了些pdf书籍看,但是没有目录(导航,一点就去对应页码)很是苦恼,怎么才能添加目录呢???以下是我的解决这个问题的过程. 2. 直奔主题 2.1 尝试1:pd ...

  2. 关于导出编辑后的PDF文件中目录带框的情况及解决

    导出编辑后的PDF文件中目录带框的情况及解决 1.情况描述 1.1. 使用软件 1.2. 操作过程 2.解决办法 3.说明 1.情况描述 1.1. 使用软件 1.Word 2016 2.金山PDF专业 ...

  3. 怎么将扫描版pdf文件怎么转换成word文件

    由于PDF是一种复杂多样的文档格式,有的时候我们遇到的PDF文件不是纯文字源的内容的,而是一页页扫描版PDF文件,此时如何想得到文本或Word文档?如何还未找到合适的解决方法,可以使用迅捷PDF转换器 ...

  4. GDCM:扫描包含DICOM文件的目录的测试程序

    GDCM:扫描包含DICOM文件的目录 GDCM:扫描包含DICOM文件的目录 GDCM:扫描包含DICOM文件的目录 #include "gdcmScanner.h" #incl ...

  5. 如何编辑扫描的PDF文件?

    扫描的PDF文档是一些最难处理的文件类型.当您扫描文档并将其直接保存为PDF格式时,所有文本.图表.图形和图像都会合并到一个无法编辑的大图像文件中,如果我们要使扫描的PDF文件转换成可编辑的PDF文件 ...

  6. 扫描版PDF文件,如何弄成可复制的文字版?

    最后在网上下载了几个PDF文件,是扫描版的,相当于是图片,无法复制上面的文字,但是某宝找人处理了一下就可以复制了,是使用的什么软件呢?具体操作过程是怎样的呢? 其实将扫描的PDF处理成可复制的文字版, ...

  7. 制作PDF模板实现PDF文件生成

    制作PDF模板实现PDF文件生成 最近开发的需求的时候,突然发现需要制作PDF,并且需要根据不同的用户制作不同的PDF,所以,为了提高效率,就想到了,制作PDF模板,然后赋值的这种方法,所幸,效果不错 ...

  8. Py自动化办公—Word文档替换、Excel表格读取、Pdf文件生成和Email自动邮件发送实战案例...

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 平阳歌舞新承宠,帘外春寒赐锦袍. ...

  9. 扫描的pdf文件怎么编辑修改

    对pdf文件进行修改等操作远远没有在word等文档格式用修改简单,想要完成pdf文件的二次编辑需要用专业的pdf编辑器,有的甚至需要用到文字识别软件. 一.对于普通的pdf文档我们用pdf编辑器完全能 ...

最新文章

  1. python包 wget_Python数据科学“冷门”库
  2. 查询存储过程所需参数
  3. 你的项目应该如何正确分层?
  4. keras多输出模型
  5. 反汇编学习笔记2 函数的本质
  6. C++Template 模版的本质
  7. 从 SAP WebIDE 里向Github 发起 push 的错误消息 - Git result: REJECTED_NONFASTFORWARD
  8. iframe懒加载_前端常见问题
  9. CSS3中的动画示例
  10. UVM中factory机制的使用
  11. 查看User Profile的名称和显示名称
  12. ajax中res和req,表达式是否为每个请求提供了不同的req和res对象?
  13. SmartSVN使用
  14. 免费的WinCC语音报警控件
  15. 计算机电源检测软件,电脑电源检测工具
  16. Windows exe文件如何提取图标
  17. 链家深圳租房信息爬取练习 附加源码
  18. Codeforces 524C Idempotent functions
  19. 关于【ROM制作工具】的那点事
  20. Python openjudge 018:大象喝水

热门文章

  1. Kaggle教程 机器学习入门3 你的第一个机器学习模型
  2. oracle中删除表的四种基本操作 2021-11-03
  3. 国外问卷调查做题工具
  4. java——》Supplie
  5. qt 计算字符串宽度高度
  6. linux系统密码正则,Linux密钥登录原理和ssh使用密钥实现免密码登陆
  7. jvm 内存模型结构
  8. 防止电脑锁屏html 代码 适合IE下运行
  9. Bitly:构建月处理60亿点击的分布式系统(转载)
  10. realsense D455读取深度图时,深度值不变问题解决方案