本文实例为大家分享了python实现大文本文件分割的具体代码,供大家参考,具体内容如下

开发环境

Python 2

实现效果

通过文件拖拽或文件路径输入,实现自定义大文本文件分割。

代码实现

#coding:gbk

import os,sys,shutil

is_file_exits=False

while not is_file_exits:

files_list=[]

if(len(sys.argv)==1):

print('请输入要切割的文件完整路径:')

files_path=raw_input().strip()

for str_file_path in files_path.split(' '):

if(str_file_path.strip()==''):

continue

if(not os.path.exists(str_file_path.strip())):

print(str_file_path.strip()+'文件路径不存在,请重新输入!')

is_file_exits=False

break

else:

files_list.append(str_file_path.strip());

is_file_exits=True

else:

for str_file_path in sys.argv[1:len(sys.argv)]:

if(str_file_path.strip()==''):

continue

if(not os.path.exists(str_file_path.strip())):

print(str_file_path.strip()+'文件路径不存在,请重新输入!')

is_file_exits=False

break

else:

files_list.append(str_file_path.strip());

is_file_exits=True

print('待切割文件:'+str(files_list))

is_continue=False

while not is_continue:

print('请输入要切割的文件个数:')

str_files_count=raw_input()

if str_files_count.isdigit():

is_continue=True

else:

print('请输入正确的数字!')

for file_path in files_list:

split_file_path=''

total_lines_count=0

lines_count=0

files_count=int(str_files_count)

print('正在统计文本行数.....')

total_lines_count = len(open(file_path,'rU').readlines())

print('文本总行数:'+str(total_lines_count))

if files_count>total_lines_count:

print('文本太小,不值得分割!')

sys.exit()

(filepath,filename) = os.path.split(file_path);

(filepathname,extension) = os.path.splitext(file_path)

if os.path.exists(filepathname):

shutil.rmtree(filepathname)

os.mkdir(filepathname)

lines_count=int(total_lines_count/files_count)

mod_count=total_lines_count%files_count

print('正在进行文件分割.....')

line_num=0

file_num=0

temp=-1

for line in open(file_path,'rU').readlines():

if file_num

源码地址

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

python文本分割_python实现大文本文件分割相关推荐

  1. python 文本向量化_Python文本特征抽取与向量化算法学习

    本文为大家共享了Python文本特征抽取与向量化的详细代码,供大家参考,详细内容如下 假设我们刚看完诺兰的大片<星际穿越>,设想怎么让机器来自动分析各位观众对电影的评价到底是"赞 ...

  2. python文本编辑器_python最好的ide和文本编辑器

    python文本编辑器 I cannot stress enough how important the right IDE (Integrated Development Environment) ...

  3. python文本发音_Python文本转化语音模块大比拼,看看青铜与王者的差别!

    自从开始公众号写作,作息问题就成了一件让人很头大的事情,相对平时学习时间的基础上,每天需要再多抽出来至少两个小时进行公众号写作,这些时间只能从睡眠中挤出来.别人研究怎么碎片化学习,我现在每天盘算的是怎 ...

  4. python实现图像分割_Python实现投影法分割图像示例(一)

    投影法多用于图像的阈值分割.闲话不多说,现用Python实现. 上代码. import cv2 import numpy img = cv2.imread('D:/0.jpg', cv2.COLOR_ ...

  5. python分割_Python文件合并与分割操作方法工具

    玩蛇网Python之家,之前的文章中有为大家介绍过如何使用python对文件进行分割或是合并的操作方法,今天再次为大家示例了同样功能,但操作方法却不相同.利用Python对PDF文件进行分割也是可以的 ...

  6. python字符串按长度分割_python 按照固定长度分割字符串的方法小结

    有如下的一堆mac地址,需要更改成一定格式,如mac='902B345FB021'改为mac='90-2B-34-5F-B0-21'. 借助python脚本,可以轻松实现,原理就是:字符串的按照固定长 ...

  7. python长度分割文本_python 按照固定长度分割字符串的方法小结

    有如下的一堆mac地址,需要更改成一定格式,如mac='902B345FB021'改为mac='90-2B-34-5F-B0-21'. 借助python脚本,可以轻松实现,原理就是:字符串的按照固定长 ...

  8. python按字符分割_Python:按字符位置分割字符串 - python

    如何按单词的位置分割字符串? 我的数据如下所示: test = 'annamarypeterson, Guest Relations Manager, responded to this review ...

  9. python视频分段_Python 视频文件的分割和合并

    import os; import time; os.system('start "wmplayer.exe", "F:\\abc.mp4"'); --分割代码 ...

  10. python文本格式_python处理文本文件并生成指定格式的文件

    import os import sys import string #以指定模式打开指定文件,获取文件句柄 def getFileIns(filePath,model): print("打 ...

最新文章

  1. android 事件拦截 (Viewpager不可以左右滑动)
  2. nginx配置解决vue单页面打包文件大,首次加载慢的问题
  3. Python的嵌套函数使用和闭包
  4. java m4a文件拼接_面试官:为啥不提倡字符串拼接?看阿里java开发手册怎么说
  5. 我是一个*** (十四) 完
  6. linux+tar+man,Linux常用命令
  7. spring 注解重复(防重复请求)
  8. delphi dbgrid 焦点 行号_徐睿知真人版娜美?!2020釜日电影奖铅笔腿、超凶双峰,惊人身材抢下所有焦点...
  9. 盘点国外名企的管理奇招
  10. 优先级Priority
  11. amd显卡怎么设置风扇?
  12. 上海浮生记——溜达出来的美食
  13. android 7.0 漏洞利用,谷歌 Android 移动操作系统中的零日漏洞被攻击者利用
  14. 执行celery -A tasks worker --loglevel=info报错
  15. Fiat-Shamir heuristic(含实现)和Random oracle
  16. 视频聊天ViscomSoft SDK ActiveX 4.0
  17. 【Java】Java零基础学习笔记
  18. glibc2.29+的off by null利用
  19. 部署dashboard
  20. Apache dbutils工具

热门文章

  1. 单主机多git账户多rsa密钥+根据私钥生成公钥+knownhosts+.git/config相关配置
  2. Openbox自定义键盘(lxde-rc)
  3. CC攻击原理及防范新思路
  4. c++使用递归来进行阶乘
  5. 普中科技51单片机_【笔记】-普中科技-51单片机-按键
  6. Html数组下标访问帧,javaScript array(数组)使用字符串作为数组下标的方法
  7. java实现,连接数据库的账号密码库,实现登录案例
  8. 安卓rom制作教程_【ROM】 MIUI10.3.2.0稳定版 通刷包 安卓9 全面屏手势|小爱同学|游戏模式...
  9. python和vb编程哪个好_自学编程是从python还是从vb好
  10. Dynamics AX2012 Excel导入AX