在实际工作中,有些场景下,因为产品既有功能限制,不支持特大文件的直接处理,需要把大文件进行切割处理。

当然可以通过UltraEdit编辑工具,或者从网上下载一些文件切割器之类的。但这些要么手工操作太麻烦,要么不能满足自定义需求。

而且,对程序员来说,DIY一个轮子还是有必要的。

Python作为快速开发工具,其代码表达力强,开发效率高,因此用Python快速写一个,还是可行的。

需求描述:

输入:给定一个带列头的csv文件,或者txt文件,或者其他文本文件。

输出:指定单文件内部行数的一系列可区分小文件。

开发环境:Python 3.6

代码如下:

# -*- coding: cp936 -*-

import os

import time

def mkSubFile(lines,head,srcName,sub):

[des_filename, extname] = os.path.splitext(srcName)

filename = des_filename + '_' + str(sub) + extname

print( 'make file: %s' %filename)

fout = open(filename,'w')

try:

fout.writelines([head])

fout.writelines(lines)

return sub + 1

finally:

fout.close()

def splitByLineCount(filename,count):

fin = open(filename,'r')

try:

head = fin.readline()

buf = []

sub = 1

for line in fin:

buf.append(line)

if len(buf) == count:

sub = mkSubFile(buf,head,filename,sub)

buf = []

if len(buf) != 0:

sub = mkSubFile(buf,head,filename,sub)

finally:

fin.close()

if __name__ == '__main__':

begin = time.time()

splitByLineCount('盂县.csv',600000)

end = time.time()

print('time is %d seconds ' % (end - begin))

测试结果:

1.4GB的csv文件,13列数据,切分成23个小文件,耗时55秒。

以上这篇用Python实现大文本文件切割的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

python切割txt文件_用Python实现大文本文件切割的方法相关推荐

  1. python删除重复值所在的行数_使用python读取txt文件的内容,并删除重复的行数方法...

    注意,本文代码是使用在txt文档上,同时txt文档中的内容每一行代表的是图片的名字. #coding:utf-8 import shutil readDir = "原文件绝对路经" ...

  2. python读取txt文件为dataframe,python批量读取txt文件为DataFrame

    我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...

  3. python读取txt文件并求和,Python读取txt文件数据的方法(用于接口自动化参数化数据)...

    小试牛刀: 1.需要python如何读取文件 2.需要python操作list 3.需要使用split()对字符串进行分割 代码运行截图 : 代码(copy) #encoding=utf-8 #1.r ...

  4. python生成wps文件_使用Python操作XLS文件(wps中叫et)

    一旦TE需要* *信息的列表,我导出一个txt文件与python和扔给他们,但是他们很不开心,哈哈,因为他们想要将数以百计的数据放到xls文件列表输出,工作数量太大,所以我问我出口成xls文件然后给他 ...

  5. python导入txt文件并绘图-Python实现读取txt文件中的数据并绘制出图形操作示例

    本文实例讲述了Python实现读取txt文件中的数据并绘制出图形操作.分享给大家供大家参考,具体如下: 下面的是某一文本文件中的数据. 6.1101,17.592 5.5277,9.1302 8.51 ...

  6. python导入txt文件并绘图-Python实现读取txt文件并画三维图简单代码示例

    记忆力差的孩子得勤做笔记! 刚接触python,最近又需要画一个三维图,然后就找了一大堆资料,看的人头昏脑胀的,今天终于解决了!好了,废话不多说,直接上代码! #由三个一维坐标画三维散点 #codin ...

  7. python导入txt文件并绘图-Python读取txt某几列绘图的方法

    晚上帮同学用Python脚本绘图,大概需求是读取一个txt文件的两列分别作为x和y的值,绘图即可,代码如下: #coding:utf-8 import numpy as np import matpl ...

  8. python解压文件_使用Python实现文件压缩和解压

    大家可能都熟悉.zip格式的文件.它可以把多个文件,压缩成一个文件.这在网络上传输时很有用,而且节省硬盘空间. 接下来,我们使用Python实现压缩和解压. 读取ZIP文件信息 要读取ZIP文件的内容 ...

  9. python创建txt文件并写入-python如何将数据写入本地txt文本文件

    一.读写txt文件 1.打开txt文件file_handle=open('1.txt',mode='w') 上述函数参数有(1.文件名,mode模式) mode模式有以下几种:#w 只能操作写入 r ...

最新文章

  1. java压缩文件出现中文乱码问题
  2. Cookie 和 Session的区别 1
  3. 三维重建:SLAM的粒度和工程化问题
  4. oracle修改filesystem,(转):oracle、filesystem、backup日常巡检脚本
  5. Java版单链表讲解
  6. Java 统计字母个数
  7. 寻找点赞所需的URL
  8. 劝雷军别造车?王传福:别浪费钱和时间;华为面向全球招募天才少年:不限学历/学校;腾讯光子工作室强制不加班双休|极客头条...
  9. 因文件包含病毒或潜在的垃圾软件导致被防火墙拦截的解决方法
  10. 掌阅 兼容性测试 结果
  11. cocos creator3.3.0休闲游戏(云浮消消乐)源码H5+安卓+IOS三端源码
  12. MFP450 基础飞行平台问世,支持室内室外无GPS环境飞行
  13. openstack块存储服务基础:Linux LVM硬盘管理及LVM扩容
  14. cmd 查看端口占用并且结束进程【建议收藏】
  15. 鸿蒙坐骑九彩祥云,封神演义五大神兽坐骑排名,第一名太出人意料了!
  16. xshell常用命令和快捷键----(备忘、随时更新)
  17. OPENWRT MT7628 驱动移植WIFI折腾记
  18. 计算机考研考的是英语作文,2007年考研英语作文真题及范文
  19. html中测试心理测试的代码,趣味心理测试源码、心理测试_心理测评微信小程序版...
  20. 【随记】没Windows咋办?看看国产桌面操作系统Deepin

热门文章

  1. 消除卡顿 mac MATLAB2022b m1/m2原生下载安装 教程
  2. 20230116测试
  3. 单片机基础入门:什么是上电复位,复位电路怎么设计
  4. 【pytorch】WinError126解决方案
  5. Windows下程序向Linux下移植实践
  6. Python Selenium + PhantomJS爬取考拉海购商品数据
  7. 华为云计算IE面试笔记-华为云计算解决方案业务迁移支持哪些迁移?有哪些特点?请描述基本的业务交付流程、业务迁移流程和原则。
  8. 使用kolla-ansible部署多节点OpenStack(T版)及对接Ceph
  9. 松勤软件测试试题,如果让你测试一个完全不熟悉的系统,你会怎么办?
  10. C语言——占位符【标志字符】