在一些场景会碰到需要从 TXT 文本文件提取需要的表格,TXT 文本并没有固定的格式,所以基本上每一个不同的 TXT 文本都需要单独写程序,下面是一些我在项目中用到的 TXT 文本处理技巧。

有用到的 Python 处理 TXT 代码:

# 打开 TXT 文本
with open("*.txt","r") as f:# 逐行读取 TXT 文本内容info=f.readlines()
# 按空格逐行分解每一行数据
for ls in info:info_list = ls.strip()

由于 TXT 文本并没有固定的格式,所以基本上不可能碰到可以重复复用的 TXT 公式,灵活运用上面的公式,或者也可以使用一些 Python 的第三方库来辅助。每当我们拿到一个 TXT 文本数据时,首先要做的事和客户沟通确定该文本的样式和瞄点,总结规律,比如通过定位 TXT 文本中的唯一值来定位所需求的数据,或者为什么我们要逐行读取 TXT 文本,因为大部分 TXT 文本都是有固定的行和列,举个例子:

CITIC INDUSTRIAL BANK
外卡收单 M/C 资金清算报表
报表号码: 报表日期 2018-08-15 货币 840
交易类型 笔数 交易金额 手续费收入 手续费支出 结算金额 其他金额 清算日期
ATM 59 12237.53 97.63 12335.16 0.00 2018-08-14
合计: 59 12237.53 97.63 0.00 12335.16 0.00
* * * 报表结束 * * *

如上的 TXT 文档,我们需要读取合计一栏的结算金额,我先逐行读取 TXT 表格,然后瞄定‘合计‘(此值唯一),然后用 split 函数分割数据,取分割后得到的列表的倒数第 3 个数据就是结算金额了。

处理 TXT 文本技巧相关推荐

  1. Mac-使用技巧之快速新建txt文本

    最近在使用mac系统进行web网页开发,由于没有使用开发环境,因此出现大量的新建文本文件操作.mac上没有像windows一样右键新建文本文件的功能还是挺别扭的,几经搜索学习,总结以下两种个人认为最为 ...

  2. matlab导入txt数据_如何正确的将txt文本数据导入到Word中使用?

    在日常办公中,有许多软件保存的文件格式往往都是txt文本格式,那我们应该如何将这些内容导入到Word中并排序好呢? 直接复制?如果你是一些文本内容,直接复制肯定没问题.但如果是数据类型的,那直接复制到 ...

  3. android 文件流转换为zip文件_PDF文件如何转换为TXT文本?教您一招高效转换的方法...

    我们见过很多的文件格式,如果说最常见的文件格式想必要属于TXT文本格式了. 大多数人都用过TXT文本格式临时记录几件事或者临时记录几句话,毕竟TXT文件是微软在操作系统中附带的一种文本格式. 如果说T ...

  4. 通过shell将*.txt文本内容批量录入mysql

    想将某*.txt文本内容全部录入到mysql的某个数据表中,通过使用load data local infile into table table_name ....但感觉用的不够溜.导致经常格式有问 ...

  5. VC++中从txt文本中读取数据并且存到二维数组中

    这几天因为在做作业,所以不仅会想到这一类有关的问题.现在我需要实现的是讲txt文件的数据读取出来并且存储到一个二维数组中.,首先为了对待什么样的矩阵我们都可以读取,我们就要设置一个动态的矩阵,这样当我 ...

  6. python 利用jieba读取txt文本进行分词后存入新txt

    python 利用jieba读取txt文本进行分词后存入新txt import jieba txt = open("news.txt",encoding='UTF-8').read ...

  7. python在当前目录创建txt文件-python根据txt文本批量创建文件夹

    前言 前言:想写这个代码的原因是因为实习的时候需要根据表格名创建对应的文件夹,如果只是很少个数文件夹的话,ctrl+shift+n还可以接受吧,可是一次就要创建几百个文件夹,这就有点方方了.所以我写了 ...

  8. python读取中文txt文本-python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  9. unity 实现文本选中_Unity中如何读取TXT文本内容

    在游戏开发过程中,我们是离不开需求的,而需求的事情是由策划来做的,那么我们和策划也是需要沟通交流的,那么是怎么交流的呢?策划不需要写代码,只需要思考一些游戏的内容,数据,玩法的实现,然后让我们按照策划 ...

  10. 关于如何在matlab中导入并翻译Hypemesh导出的大型刚度矩阵txt文本

    刚度矩阵是有限元计算中最重要的矩阵,它是一个典型的对称稀疏矩阵,并且非零元素全部集中 前言 在对角线附近,稀疏矩阵就是零元素远大于非零元素的数目,所谓大型刚度矩阵.这里指稀疏矩阵中非零元素的数目有50 ...

最新文章

  1. Struts-Logic 标签库
  2. Entity Framework技术系列之2:三种开发模式实现数据访问
  3. 二维数组转稀疏数组,写入文件后再读取文件,将内容转回二维数组
  4. Node.js 安装及配置
  5. Windows Phone 7实现图片数据绑定
  6. UVa 11998 破碎的键盘(数组实现链表)
  7. MySQL性能优化(二)
  8. ×××与字符串的相互转换
  9. art.dialog重设弹窗大小和刷新位置
  10. matlab切割肿瘤算法,ML之RF:基于Matlab利用RF算法实现根据乳腺肿瘤特征向量高精度(better)预测肿瘤的是恶性还是良性...
  11. XStream 初探,很给力
  12. 概率论-随机变量的数字特征思维导图
  13. 【游戏开发实战】教你在Unity中实现笼中窥梦的效果(RenderTexture | 视觉差| 多相机 | 渲染 | shader | 多场景)
  14. Windows API——SHFileOperation——文件操作
  15. win10计算机怎么打开方式,Win10如何还原打开方式?还原打开方式的方法
  16. 深入理解操作系统实验——bomb lab(phase_5)
  17. 一篇關於Android layout研究的文章[轉 from:http://blog.csdn.net/archimedes_zht/article/details/5333120]...
  18. SWUST#954: 单链表的链接
  19. (转载)解决FileOutputStream中文乱码问题
  20. 从毛衣到西装 - 硅谷CEO穿衣进化史

热门文章

  1. 03环信好友管理 - 删除好友
  2. TX2平台cmake安装
  3. qrcode生成带logo的二维码(插件,示例代码)
  4. teighax是什么_cut up,cut in,cut off,cut down有什么区别?
  5. psasp 问题记录
  6. DSP 基于 TMS320F2803x 的 I2C 上的 PMBus 的软件应用
  7. 英文学术论文写作有哪些经验心得?
  8. cad2019字体_这些是2019年最有效的简历字体
  9. 微博java版_新浪微博JAVA通用版
  10. Java项目的开发流程