python拆分大文件

  • 前言
  • 实现过程
  • 实验结果

前言

在工作中常常会遇见一些大文件,由于内容太多,使用比如记事本、notePad++等软件也打不开,无法查看内容,最好是将整个文件进行拆分,分开处理,现在处理的文件原本是5个G的大文件,最后拆分成了28个小文件。

实现过程

# -*- coding:utf-8 -*-
def Main_split():source = 'C:\\Users\\Desktop\\proc_create_20210228\\proc_create_20210228.json'# 此处一定要建上target文件夹,不然会报路径错误target = 'C:\\Users\\Desktop\\proc_create_20210228\\target\\'# 文件的行数的计数器num = 0# 文件序号name_num = 1# 用于存放数据dataStore = []# 设置为UTF-8编码with open(source, 'r', encoding='UTF-8') as file_content:for line in file_content:num += 1dataStore.append(line)# 设定每个文件为20万行if num == 200000:with open(target + "target_list_" + str(name_num) + ".json", 'w+') as file_target:for data in dataStore:file_target.write(data)name_num += 1num = 0dataStore = []# 处理最后一个文件,如果最后一个文件行数少于20万行,进行如下处理with open(target + "target_list_" + str(name_num) + ".json", 'w+') as file_target:for data in dataStore:file_target.write(data)if __name__ == "__main__":Main_split()

实验结果

python拆分大文件(大文件分割)相关推荐

  1. python拆分大文本(.txt)文件

    系列文章目录 文章目录 系列文章目录 前言 一.python拆分大文本文件 1.源码 二.可能遇到的问题 1.原因排查 2.问题解决 三.拆分源码二 总结 前言 提示:以下是本篇文章正文内容,以拆分密 ...

  2. python拆分合并文件_python实现文件的分割与合并

    使用Python来进行文件的分割与合并是非常简单的. python代码如下: splitFile--将文件分割成大小为chunksize的块: mergeFile--将众多文件块合并成原来的文件: # ...

  3. 《Python和HDF 5大数据应用》——2.4 你的第一个HDF5文件

    本节书摘来自异步社区<Python和HDF 5大数据应用>一书中的第2章,第2.4节,作者[美]Andrew Collette(科莱特),胡世杰 译,更多章节内容可以访问云栖社区" ...

  4. python从入门到大神---4、python3文件操作最最最最简单实例

    python从入门到大神---4.python3文件操作最最最最简单实例 一.总结 一句话总结: python文件操作真的很简单,直接在代码中调用文件操作的函数比如open().read(),无需引包 ...

  5. python图形分析_使用Python图形化分析大Log文件

    最近因为项目需要经常分析数据量很大的Log文件,以往靠手工目测的分析方法已不太可能快速分析和定位问题. 由于和我一起做这个项目的同事,会使用Python,编写的Python脚本能够将Log中的相关数据 ...

  6. 【Python】原来处理大文件也可以这么简单?

    文章目录 前言 一.开始 二.处理文本 三.串行处理 五多进程处理 六输出 七并行处理 总结 前言 为了进行并行处理,我们将任务划分为子单元.它增加了程序处理的作业数量,减少了整体处理时间. 例如,如 ...

  7. Python使用pyinstaller打包成exe文件,并支持传入外部参(已解决打包后文件大的情况)

    目录 一.为什么要打包 二.打包后文件大的问题 三.外部传参 3.1.sys库 3.2.argparse库 四.pyinstaller打包 4.1.安装包 4.2.打包命令 4.3.新环境打包 五.运 ...

  8. python 文件操作大总结 对文件的增删改查,备份, 批量修改,创建和删除 文件的备份

    python 的文件操作 文件的作用 永久的保存数据 文件中的内存保存在硬盘中 硬盘中的数据都是 0 和 1, 软件将 0 和 1的组合转换成我们认识的汉字 绝对路径和相对路径 绝对路径:是从目录开始 ...

  9. Python 打包项目生成exe文件大启动慢解决办法

    目录 一 使用pyinstaller打包exe 1 首先安装pyinstaller 包 2 win+R,cmd 进度dos界面 3 进度代码目录内,然后使用pyinstaller -F main.py ...

  10. python requests上传大文件_pythonrequestspost大文件和获取进度条

    问题: python requests post 大文件和获取进度条 描述: 准备用HTTP 在局域网内 上传一些文件,文件一般都在1G左右r = requests.post('****', data ...

最新文章

  1. 中国python之父是谁-Python之父:我们能为中国的“996”程序员做什么?
  2. 融云php sdk下载安装,LICENSE · 融云 RongCloud/server-sdk-php-composer - Gitee.com
  3. [记录]-Cortex-A76仅EL0支持aarch32
  4. Java EE中的配置管理
  5. 以VMware workstation15.5.2pro为例如何新建虚拟机,安装镜像文件(最新)
  6. 种一棵树最好的时间是十年前,其次是现在。
  7. python大数据和java大数据的区别-做大数据工程师,语言选Java还是Python?
  8. 计算机VB中清除按钮,计算机vb程序设计时计算器清除的代码怎么写
  9. RT-Thread : IEEE1588/PTP 协议的实现
  10. 云计算概念及发展历程
  11. 臻图信息构建数字孪生港口船舶停靠管理系统,赋能港口创新发展
  12. intellij idea 工具栏的隐藏和显示
  13. STM32中断中调用OLED显示出现OLED花屏
  14. idea gwt 怎么编译_带Spring Boot的GWT
  15. 服务器微信服务号响应变慢,微信卡顿和响应慢,教大家轻松搞定:简单操作,赶快收藏分享吧...
  16. 云原生尝试——Docker部署node项目
  17. 新手安装R以及Rstudio软件
  18. android elevation 白色,使用android:elevation在LinearLayout上投射阴影
  19. 2022年流动式起重机司机考试题及在线模拟考试
  20. java 反射 getter,java – 通过反射调用getter的最佳方式

热门文章

  1. python中count什么意思_python中函数COUNT()的功能是什么
  2. limits在c语言,limits.h – C语言标准库
  3. 快狗打车CTO沈剑:怕什么技术无穷尽?进一寸有一寸的欢喜
  4. 苏超 计算机系 南京大学,Ni-Ti基合金薄膜相变行为及其力学特性研究
  5. 新手常见(五国)(-v图)错误解决(原版,破解kernel,补丁kext下载)
  6. 新的抗VEGF药物——阿柏西普ELISA 试剂盒相关研究
  7. Markdown部分语法使用
  8. 乒乓球侧旋球MATLAB,【动图】看动图让你了解乒乓球的侧旋转
  9. 内网渗透-内网穿透猕猴桃抓密码提权烂土豆提权
  10. Win10任务栏卡死解决方法