前言:继之前两篇博客分别实现pdf转图片和图片转文字之后,我们已经向pdf转文字迈出了里程碑性的一大步。接下来就是最后的txt合并成一个txt,这样就将一整个pdf中的文字都合并到一起了。

java实现pdf转图片 - CSDN博客  https://blog.csdn.net/yanjiaxin1996/article/details/80561071

Python3.6实现图片转文字 - CSDN博客  https://blog.csdn.net/yanjiaxin1996/article/details/80457623

摘要:利用简单的文件读写,将多个txt中的内容合并到一个新的txt。

环境:win10+pycharm2018.1

第三方库:无

def main():filePath = input(r"输入文件所在地址 如 C:\代码\计算机网络 :")fileName = input(r"输入文件名称,不要后面的_1 如 计算机网络 :")start=input(r"输入开始合并的页码 如 1 :")end=input(r"输入结束合并的页码 如 5 :")filePath=filePath.replace(" ","")fileName=fileName.replace(" ","")text=""for i in range(eval(start),eval(end)):fr = open(filePath + "\\" + fileName +r"_"+str(i)+r".txt")text=text+fr.read()fr.close()fw=open(filePath + "\\" + fileName +r"_"+start+"-"+end+r".txt", 'a')fw.write(text)fw.close()main()

备注:生成的txt文件在原来分散的txt文件夹中。

由于项目并不需要生成可读性较高的总txt,只需要得到大致的文字进行分词即可,故没有进行太多的优化。

python实现txt内容合并相关推荐

  1. ImageCLEF数据集处理(Python读取txt内容创建文件夹;将图片拷贝至指定文件夹)

    1. 问题描述 做迁移时候用到公共数据集ImageCLEF, 但是给的结构如图: 有b,c,i, p四种图像数据,和list数据,对应每一条数据的名称及其标签,记录举例如下: b/252.car-si ...

  2. python读取txt文件并写入excel-Python读取txt内容写入xls格式excel中的方法

    由于xlwt目前只支持xls格式,至于xlsx格式,后面会继续更新 import xlwt import codecs def Txt_to_Excel(inputTxt,sheetName,star ...

  3. python读取txt文件并输出到表格_Python读取txt内容写入xls格式excel中的方法

    由于xlwt目前只支持xls格式,至于xlsx格式,后面会继续更新 import xlwt import codecs def Txt_to_Excel(inputTxt,sheetName,star ...

  4. python如何将文件内容合并_python如何将两个txt文件内容合并

    本文实例为大家分享了python将两个txt文件内容合并的具体代码,供大家参考,具体内容如下 分析: 先分别将两个文件中的内容读入列表中,再将列表分割 把不同属性的数据放到单独的列表中 分开存储  n ...

  5. 给知网没有书签的pdf文件添加书签(利用python解析txt文件内容并为pdf添加目录)

    今天利用tampermonkey的知网下载助手脚本下载pdf格式论文时,发现论文缺少书签,而脚本可以下载一个txt格式的书签(目录),因此打算利用python将txt格式的目录添加到pdf中. txt ...

  6. Python实现读取多个/批量txt文件合并成一个txt(示例为tcga数据处理)

    本程序功能 将tcga数据的批量txt文件合并成一个txt. 如下: 原始的第一个txt(代表一个病人)的数据内容 合并之后的txt数据,基因名不变,只是把病人的表达量收集到一起 操作详细步骤 本人测 ...

  7. python正则表达式处理txt,python 正则表达式参数替换实例详解 python使用正则表达式替换txt内容...

    Python正则表达式如何进行字符串替换实例 import res = 'adds23dd56'ss = re.sub(r'\d', '*', s)>>> ss'adds**dd** ...

  8. python删除重复值所在的行数_使用python读取txt文件的内容,并删除重复的行数方法...

    注意,本文代码是使用在txt文档上,同时txt文档中的内容每一行代表的是图片的名字. #coding:utf-8 import shutil readDir = "原文件绝对路经" ...

  9. python读取txt文件内容-python如何获取txt文本文件中的内容

    file='C:/Users/Administrator/Desktop/python/file.txt'#一次性获取所有内容withopen(file,encoding='utf-8')asfile ...

  10. 用python修改文件内容修改txt内容的3种方法

    用python修改文件内容修改txt内容的3种方法 方法一.修改原文件方式 def updateFile(file,old_str,new_str):"""替换文件中的字 ...

最新文章

  1. wpf popup 最前面_【第1988期】NutUI 组件 popup 源码分析
  2. Angular 7 版本
  3. 怎么用python爬取整个网站_5分钟学会Python爬取整个网站
  4. QQ,MSN,SKYPE等在线状态代码
  5. python发邮件主机找不到_Python 使用QQ邮箱发邮件
  6. Perl 第二章 簡單變量
  7. XML Schema基本数据类型及数据限定
  8. 中英文搜索引擎收录口整理
  9. 信用体系,生态之魂!——保险科技生态建设
  10. Siamese-RPN论文阅读
  11. CleanMyMac最新发布的版本是4.10.0
  12. 超有趣的Python实战:将图片转成像素风!
  13. uni-app 180查看好友朋友圈完善(一)
  14. 项目01城市餐饮店铺选址分析
  15. 5G NR协议学习--TS38.211主要参数解读
  16. 2019 CCPC 河南省赛A:最大下降矩阵(dp)
  17. 人生不同年龄阶段该怎么买保险?
  18. Jquary全屏滚动插件fullpage.js的使用
  19. 汽车零部件行业SRM供应商协同系统:提升汽车零部件企业采购质量,驱动供应商快速响应
  20. 从一个页面跳转到另一个页面的任何位置处

热门文章

  1. Linux下 cmatrix的安装和使用(黑客屏保)
  2. 周志华与「深度森林」
  3. Sketch 67.2 简体中文版 最佳Mac产品原型设计工具
  4. 什么是激励函数?(代码+详细注释)
  5. FasterRCNN调试笔记
  6. <Java设计模式>(二)UML类图 | 设计模式概述和分类
  7. 自动控制原理知识点整合归纳(韩敏版)
  8. macOS 使用软件(外加装逼特效)
  9. hbase的协处理器
  10. pythonmt4通讯swot矩阵_SWOT矩阵分析法