对扫描的pdf文件生成目录
很多pdf文件是直接扫描生成的,于是它的内容都是一张张的图片,当然就更没有目录索引了。
有的时候想找某些内容,只能一点点的移动滚动条,非常不方便。
那么有什么方法能生成目录呢?
方法一:使用福昕pdf编辑器
福昕pdf编辑器使用PRC识别pdf文件,能将pdf文件转换为office文件,更是有目录制作的功能。
但是,亲测后发现:
- 也是最关键的问题,他需要money,也就是得升级为会员,才能使用图片识别功能。
- 目录制作倒是免费的,但它的目录主要是设置标签,对于目录没有分级功能,且需要一页一页翻的去添加,非常麻烦
总之,最后的制作非常不理想。
方法二:使用FreePic2Pdf
先看一下最终效果图:
我使用的是《同济大学高等数学第六版上册.pdf》,打开pdf的软件是2345看图王,也可以用chrome打开。
怎么样,效果是不是非常良好。
FreePic2Pdf这是一个图片转pdf文件,但主要使用的是它的更改pdf的功能。
至于下载地址就不提供了(因为没找到它的官网),网上一搜一堆,第三方下载地址很多的。
软件打开是这样子的:
这些功能都不需要,主要使用的是右下角的更改pdf,点开之后:
主要使用的就是这一部分的功能。
现在开始目录制作。
先解释一下上述标签的意思:
- 往PDF挂书签:就是为pdf文件添加目录。不过需要目录文件,下面会有介绍制作的方式。
- 从PDF取书签:就是从有目录的pdf文件中提取出目录文件。
- 需要操作的目录文件:就是需要添加目录的PDF文件。
- 存放接口的文件夹:就是目录文件,需要制作。
其他的按键一般没什么需要使用的。
制作目录需要一个目录文件,使用的是txt格式。
一、选择一个存放接口的文件夹
这个文件夹可以自己创建。
二,创建配置文件
选定文件夹之后,再点击创建文件夹右边的那个按钮,输入以下模板内容:
[Images][Font] Language=GBK FontSize=7 Margin=0.5[Bkmk] File=FreePic2Pdf_bkmk.txt AddAsText=0 ShowBkmk=1 ShowAll=1 BasePage=1[Main] ContentsPage= TextPage=
保存。之后他就会在选定的文件夹下创建一个名为 FreePic2Pdf.itf 的文件。
三、创建目录文件
在这个文件夹下新建一个 FreePic2Pdf_bkmk.txt 文件。
这个文件就是目录文件,这里的目录需要自定义,它需要按照一定的格式:
一级目录\t页码 \t二级目录\t页码 \t\t三级目录\t页码 。。。
\t表示制表符,也就是TAB键。
例如:
这个文件可以用记事本写,也可以用notepad等等。
那么这些内容具体怎么去写呢?
这个就得看自己的电脑技能了。不过总的来说是以下几步:
1、识别目录文字
- 可以使用ABBYY软件识别,但是不建议,具体原因请自行入坑。
- 推荐的:使用网页百度翻译。没错,就是百度翻译,将目录图片粘贴上去,他就自动识别并将中文和英文翻译显示出来了。
至于目录的图片,你可以截图,也可以使用2345看图王软件,如下图:
直接就复制目录了,这样复制的目录完整一点。
2、目录制作
百度翻译的识别效果如下:
呃,没有换行,内容也有部分缺失,这些都是需要自己去修改。
那么如何将这些内容制作成需要的格式呢,这个。。。要么靠自己手动编辑,如果会正则表达式,可以节省一点时间。
注意:目录的页码是pdf文件的真实页码,而不是书上标志的那些页码,为了方便,可以将接口文件中 BasePage 字段修改为书中第一页对应的pdf页数。
如:BasePage=12
制作成功后,选择相应的文件,如下图:
再点击开始,没问题的话瞬间制作完成。制作前记得先保存副本。
接着再点开pdf文件,就会发现目录有了:
到此,制作完成!!!
转载于:https://www.cnblogs.com/twoice/p/10574668.html
对扫描的pdf文件生成目录相关推荐
- 为扫描版PDF一键生成目录
PDF是图片没目录咋办 1. 前言 最近找了些pdf书籍看,但是没有目录(导航,一点就去对应页码)很是苦恼,怎么才能添加目录呢???以下是我的解决这个问题的过程. 2. 直奔主题 2.1 尝试1:pd ...
- 关于导出编辑后的PDF文件中目录带框的情况及解决
导出编辑后的PDF文件中目录带框的情况及解决 1.情况描述 1.1. 使用软件 1.2. 操作过程 2.解决办法 3.说明 1.情况描述 1.1. 使用软件 1.Word 2016 2.金山PDF专业 ...
- 怎么将扫描版pdf文件怎么转换成word文件
由于PDF是一种复杂多样的文档格式,有的时候我们遇到的PDF文件不是纯文字源的内容的,而是一页页扫描版PDF文件,此时如何想得到文本或Word文档?如何还未找到合适的解决方法,可以使用迅捷PDF转换器 ...
- GDCM:扫描包含DICOM文件的目录的测试程序
GDCM:扫描包含DICOM文件的目录 GDCM:扫描包含DICOM文件的目录 GDCM:扫描包含DICOM文件的目录 #include "gdcmScanner.h" #incl ...
- 如何编辑扫描的PDF文件?
扫描的PDF文档是一些最难处理的文件类型.当您扫描文档并将其直接保存为PDF格式时,所有文本.图表.图形和图像都会合并到一个无法编辑的大图像文件中,如果我们要使扫描的PDF文件转换成可编辑的PDF文件 ...
- 扫描版PDF文件,如何弄成可复制的文字版?
最后在网上下载了几个PDF文件,是扫描版的,相当于是图片,无法复制上面的文字,但是某宝找人处理了一下就可以复制了,是使用的什么软件呢?具体操作过程是怎样的呢? 其实将扫描的PDF处理成可复制的文字版, ...
- 制作PDF模板实现PDF文件生成
制作PDF模板实现PDF文件生成 最近开发的需求的时候,突然发现需要制作PDF,并且需要根据不同的用户制作不同的PDF,所以,为了提高效率,就想到了,制作PDF模板,然后赋值的这种方法,所幸,效果不错 ...
- Py自动化办公—Word文档替换、Excel表格读取、Pdf文件生成和Email自动邮件发送实战案例...
点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 平阳歌舞新承宠,帘外春寒赐锦袍. ...
- 扫描的pdf文件怎么编辑修改
对pdf文件进行修改等操作远远没有在word等文档格式用修改简单,想要完成pdf文件的二次编辑需要用专业的pdf编辑器,有的甚至需要用到文字识别软件. 一.对于普通的pdf文档我们用pdf编辑器完全能 ...
最新文章
- python包 wget_Python数据科学“冷门”库
- 查询存储过程所需参数
- 你的项目应该如何正确分层?
- keras多输出模型
- 反汇编学习笔记2 函数的本质
- C++Template 模版的本质
- 从 SAP WebIDE 里向Github 发起 push 的错误消息 - Git result: REJECTED_NONFASTFORWARD
- iframe懒加载_前端常见问题
- CSS3中的动画示例
- UVM中factory机制的使用
- 查看User Profile的名称和显示名称
- ajax中res和req,表达式是否为每个请求提供了不同的req和res对象?
- SmartSVN使用
- 免费的WinCC语音报警控件
- 计算机电源检测软件,电脑电源检测工具
- Windows exe文件如何提取图标
- 链家深圳租房信息爬取练习 附加源码
- Codeforces 524C Idempotent functions
- 关于【ROM制作工具】的那点事
- Python openjudge 018:大象喝水