如果在一个4G的大文件test.log中提取里面有error的log:

  1. 大家第一想法就是通过打开文件然后每一行的查找,耗时19s

    import  timestart_time = time.time()
    with open('/Users/test/Downloads/test.log') as f:for line in f.readlines():if 'error' in line:print line
    end_time = time.time()
    print "cost time is: ", end_time-start_time#cost time is:  19.1660439968
  2. 列表解析:大多数工作在python解释器内部完成,比等价的语句要快很多,特别是大文件,我们可以看见在相同的大文件中使用列表解析时间为4s,大大提高了效率
    import  timestart_time = time.time()
    lines = [line for line in open('/Users/test/Downloads/test.log') if 'error' in line]
    for line in lines:print line
    end_time = time.time()
    print "cost time is: ", end_time-start_time# cost time is:  4.45141601562

Python 列表解析 大文件相关推荐

  1. python 列表操作详解,Python列表解析操作实例总结

    本文实例讲述了Python列表解析操作.分享给大家供大家参考,具体如下: 列表解析 Python 的强大特性之一是其对 list 的解析,它提供一种紧凑的方法,可以通过对 list 中的每个元素应用一 ...

  2. Python ElementTree 解析 xml文件

    文章目录 一.xml文件结构 二.基础解析 1.加载文档 2.获取根元素 3.根元素的属性 4.遍历其直接子元素 5.通过索引值来访问特定的子元素 查找需要的元素 三.支持通过XPath查找元素 四. ...

  3. Python语言解析xml文件

    python语言解析xml文件的常用的有两种方式: 通过MiniDom库解析xml文件 通过ElementTree库解析xml文件 MiniDom方式解析xml xml文件以data.xml为例,具体 ...

  4. python列表解析的新方法

    python 列表解析我感觉是python非常灵活的一个地方,一开始接触它的时候,特别是之前学过其它的语言, 你会感觉很不习惯,怎么看怎么不对劲,老是觉的哪个地方怪怪的,这就是列表解析的魔力所在. p ...

  5. 如何在Python中解析YAML文件

    如何在Python中解析YAML文件? #1楼 不依赖C标头的最简单,最纯净的方法是PyYaml( 文档 ): #!/usr/bin/env pythonimport yamlwith open(&q ...

  6. 【Android 逆向】使用 Python 代码解析 ELF 文件 ( PyCharm 中进行断点调试 | ELFFile 实例对象分析 )

    文章目录 一.PyCharm 中进行断点调试 二.ELFFile 实例对象分析 一.PyCharm 中进行断点调试 在上一篇博客 [Android 逆向]使用 Python 代码解析 ELF 文件 ( ...

  7. 列表解析python_基于Python列表解析(列表推导式)

    列表解析--用来动态地创建列表 [expr for iter_var in iterable if cond_expr] 例子一: map(lambda x: x**2, range(6)) [0, ...

  8. 用 Python 高效处理大文件

    前言 为了进行并行处理,我们将任务划分为子单元.它增加了程序处理的作业数量,减少了整体处理时间. 例如,如果你正在处理一个大的CSV文件,你想修改一个单列.我们将把数据以数组的形式输入函数,它将根据可 ...

  9. python如何解析PDF文件

    python如何解析PDF文件 python中读取pdf的方法:使用python第三方库pdfminerk3k 1.使用pdfminer库 pdfminer是一个主流的分析pdf的库.如果是pytho ...

最新文章

  1. JS语法字典---网友总结
  2. date设置时间_解决 IDEA 无法找到 java.util.Date 的问题
  3. 计算机硬件外围设备介绍,天津2012年自考“计算机外围设备使用与维护”课程考试大纲...
  4. fmt—fmt:formatDate的输出格式
  5. 【Caffe代码解析】convert_imageset
  6. Centos使用Cacti监控你的网络
  7. 利用IDA Pro修改51单片机bin文件
  8. IXM317CQC回收IMX377CQT回收IMX307LQR-CIMX185LQJ-C回收IMX283CQT
  9. PLSQL导入.txt文件
  10. java udp socket编程_JavaSocket编程UDP
  11. 雪花算法生成主键id
  12. 蛋糕究竟是怎样做大的
  13. 离谱的bug564v*/92ray
  14. 超级电容容量、耐压值、电容值计算方法
  15. 原创干货 | 史上最全的大数据学习资源(Awesome Big Data)
  16. 两种方法教你在postman设置请求里带动态token
  17. Mysql数据库远程连接的两种方式
  18. 【自动驾驶】自动驾驶涉及的知识概览
  19. 3D max免费下载
  20. python笔记:类

热门文章

  1. 自律训练法 John Sehorz
  2. 如何对人脸识别进行法律规制
  3. 用c语言做RFID读卡程序,2.STM32读卡号读写数据代码示例3.0(C语言)
  4. 搜狗浏览器如何清除浏览器缓存--小白
  5. 安卓设置keychain_简单实现KeyChain实例
  6. STM32学习笔记--DAC
  7. 共识协议(7)aura
  8. 首届STAC科创联合大会在成都召开 “开悟” AI平台将成为行业生态基建
  9. 作为一名Sem优化师,平台怎么选?甲方or乙方?
  10. React Native性能优化总结