python拆分大文件(大文件分割)
python拆分大文件
- 前言
- 实现过程
- 实验结果
前言
在工作中常常会遇见一些大文件,由于内容太多,使用比如记事本、notePad++等软件也打不开,无法查看内容,最好是将整个文件进行拆分,分开处理,现在处理的文件原本是5个G的大文件,最后拆分成了28个小文件。
实现过程
# -*- coding:utf-8 -*-
def Main_split():source = 'C:\\Users\\Desktop\\proc_create_20210228\\proc_create_20210228.json'# 此处一定要建上target文件夹,不然会报路径错误target = 'C:\\Users\\Desktop\\proc_create_20210228\\target\\'# 文件的行数的计数器num = 0# 文件序号name_num = 1# 用于存放数据dataStore = []# 设置为UTF-8编码with open(source, 'r', encoding='UTF-8') as file_content:for line in file_content:num += 1dataStore.append(line)# 设定每个文件为20万行if num == 200000:with open(target + "target_list_" + str(name_num) + ".json", 'w+') as file_target:for data in dataStore:file_target.write(data)name_num += 1num = 0dataStore = []# 处理最后一个文件,如果最后一个文件行数少于20万行,进行如下处理with open(target + "target_list_" + str(name_num) + ".json", 'w+') as file_target:for data in dataStore:file_target.write(data)if __name__ == "__main__":Main_split()
实验结果
python拆分大文件(大文件分割)相关推荐
- python拆分大文本(.txt)文件
系列文章目录 文章目录 系列文章目录 前言 一.python拆分大文本文件 1.源码 二.可能遇到的问题 1.原因排查 2.问题解决 三.拆分源码二 总结 前言 提示:以下是本篇文章正文内容,以拆分密 ...
- python拆分合并文件_python实现文件的分割与合并
使用Python来进行文件的分割与合并是非常简单的. python代码如下: splitFile--将文件分割成大小为chunksize的块: mergeFile--将众多文件块合并成原来的文件: # ...
- 《Python和HDF 5大数据应用》——2.4 你的第一个HDF5文件
本节书摘来自异步社区<Python和HDF 5大数据应用>一书中的第2章,第2.4节,作者[美]Andrew Collette(科莱特),胡世杰 译,更多章节内容可以访问云栖社区" ...
- python从入门到大神---4、python3文件操作最最最最简单实例
python从入门到大神---4.python3文件操作最最最最简单实例 一.总结 一句话总结: python文件操作真的很简单,直接在代码中调用文件操作的函数比如open().read(),无需引包 ...
- python图形分析_使用Python图形化分析大Log文件
最近因为项目需要经常分析数据量很大的Log文件,以往靠手工目测的分析方法已不太可能快速分析和定位问题. 由于和我一起做这个项目的同事,会使用Python,编写的Python脚本能够将Log中的相关数据 ...
- 【Python】原来处理大文件也可以这么简单?
文章目录 前言 一.开始 二.处理文本 三.串行处理 五多进程处理 六输出 七并行处理 总结 前言 为了进行并行处理,我们将任务划分为子单元.它增加了程序处理的作业数量,减少了整体处理时间. 例如,如 ...
- Python使用pyinstaller打包成exe文件,并支持传入外部参(已解决打包后文件大的情况)
目录 一.为什么要打包 二.打包后文件大的问题 三.外部传参 3.1.sys库 3.2.argparse库 四.pyinstaller打包 4.1.安装包 4.2.打包命令 4.3.新环境打包 五.运 ...
- python 文件操作大总结 对文件的增删改查,备份, 批量修改,创建和删除 文件的备份
python 的文件操作 文件的作用 永久的保存数据 文件中的内存保存在硬盘中 硬盘中的数据都是 0 和 1, 软件将 0 和 1的组合转换成我们认识的汉字 绝对路径和相对路径 绝对路径:是从目录开始 ...
- Python 打包项目生成exe文件大启动慢解决办法
目录 一 使用pyinstaller打包exe 1 首先安装pyinstaller 包 2 win+R,cmd 进度dos界面 3 进度代码目录内,然后使用pyinstaller -F main.py ...
- python requests上传大文件_pythonrequestspost大文件和获取进度条
问题: python requests post 大文件和获取进度条 描述: 准备用HTTP 在局域网内 上传一些文件,文件一般都在1G左右r = requests.post('****', data ...
最新文章
- 中国python之父是谁-Python之父:我们能为中国的“996”程序员做什么?
- 融云php sdk下载安装,LICENSE · 融云 RongCloud/server-sdk-php-composer - Gitee.com
- [记录]-Cortex-A76仅EL0支持aarch32
- Java EE中的配置管理
- 以VMware workstation15.5.2pro为例如何新建虚拟机,安装镜像文件(最新)
- 种一棵树最好的时间是十年前,其次是现在。
- python大数据和java大数据的区别-做大数据工程师,语言选Java还是Python?
- 计算机VB中清除按钮,计算机vb程序设计时计算器清除的代码怎么写
- RT-Thread : IEEE1588/PTP 协议的实现
- 云计算概念及发展历程
- 臻图信息构建数字孪生港口船舶停靠管理系统,赋能港口创新发展
- intellij idea 工具栏的隐藏和显示
- STM32中断中调用OLED显示出现OLED花屏
- idea gwt 怎么编译_带Spring Boot的GWT
- 服务器微信服务号响应变慢,微信卡顿和响应慢,教大家轻松搞定:简单操作,赶快收藏分享吧...
- 云原生尝试——Docker部署node项目
- 新手安装R以及Rstudio软件
- android elevation 白色,使用android:elevation在LinearLayout上投射阴影
- 2022年流动式起重机司机考试题及在线模拟考试
- java 反射 getter,java – 通过反射调用getter的最佳方式
热门文章
- python中count什么意思_python中函数COUNT()的功能是什么
- limits在c语言,limits.h – C语言标准库
- 快狗打车CTO沈剑:怕什么技术无穷尽?进一寸有一寸的欢喜
- 苏超 计算机系 南京大学,Ni-Ti基合金薄膜相变行为及其力学特性研究
- 新手常见(五国)(-v图)错误解决(原版,破解kernel,补丁kext下载)
- 新的抗VEGF药物——阿柏西普ELISA 试剂盒相关研究
- Markdown部分语法使用
- 乒乓球侧旋球MATLAB,【动图】看动图让你了解乒乓球的侧旋转
- 内网渗透-内网穿透猕猴桃抓密码提权烂土豆提权
- Win10任务栏卡死解决方法