我有几个fastq文件,平均有500.000.000行(125000.000个序列)。有没有一种快速读取这些fastq文件的方法。

我想做的是,读取每个序列并使用前16个序列作为条形码。然后统计每个文件中的条形码数量。

以下是我的脚本,耗时数小时:import os, errno

from Bio import SeqIO

import gzip

files = os.listdir(".")

for file in files[:]:

if not file.endswith(".fastq.gz"):

files.remove(file)

maps = {}

for file in files:

print "Now Parsing file %s"%file

maps[file] = {}

with gzip.open(file,"r") as handle:

recs = SeqIO.parse(handle,"fastq")

for rec in recs:

tag = str(rec.seq)[0:16]

if tag not in map[file]:

maps[file][tag] = 1

else:

maps[file][tag] += 1

我有250 GB内存和20个CPU,可以用于多线程。。。

谢谢。

python向服务器上传fq文件,用python-fas读取大型fastq文件相关推荐

  1. 28. 如何使用 SAP OData 服务向 ABAP 服务器上传文本格式和 Excel,PDF 等格式的文件

    文章目录 1. 创建对应的自定义数据库表和 ABAP DDIC 结构 2. 完成 SEGW 事物码里模型的增强 3. 完成必要的 ABAP 编码 2023 年 5 月 12 日更新 本教程到目前为止开 ...

  2. python qq空间 上传_QQ空间的Python接口

    QQ空间说说接口 这是一个可以用来访问QQ空间说说详细信息的Python模块,能够为用户解析出有用的信息. 用法 首先要通过传入cookies创建一个Qzone对象,其次调用它的emotion_lis ...

  3. python运维实战--跨堡垒机连接二级服务器上传文件

    python运维实战--跨堡垒机连接二级服务器上传文件 paramiko的有关概念和操作 Welcome to Paramiko! - Paramiko documentation 这个python脚 ...

  4. python向windows服务器上传文件(夹)

    python向windows服务器上传文件(夹) 本人需求分析: 需要从本地将某个指定目录下的文件夹上传至服务器的某个指定目录下. 这次思路是采用python的 paramiko 库.paramiko ...

  5. Python使用FTP上传文件

    Python使用FTP上传文件 本文主要介绍如何使用Python通过FTP上传文件. FTP简介 FTP即文件传输协议(File Transfer Protocol),是用于在网络上进行文件传输的一种 ...

  6. Python Request POST 上传文件 Multipart/form-data

    项目场景: 我的第一个博客:使用python request模块向服务器接口上传图片 问题描述 某app上传图片接口的包 原因分析: 问题的关键词:请求头 Content-Type:multipart ...

  7. ASP.NET跨服务器上传文件的相关解决方案

    ASP.NET跨服务器上传文件的相关解决方案 参考文章: (1)ASP.NET跨服务器上传文件的相关解决方案 (2)https://www.cnblogs.com/zuowj/p/3999798.ht ...

  8. windows主机用scp命令向Linux服务器上传和下载文件

    windows主机用scp命令向Linux服务器上传和下载文件 文章目录: 一.scp介绍 二.scp上传和下载 1.上传 2.下载 三.scp的更多参数 一.scp介绍 scp是secure cop ...

  9. 华为云服务器 大文件,云服务器上传大文件

    云服务器上传大文件 内容精选 换一换 本节操作介绍本地MacOS系统主机通过安装"Microsoft Remote Desktop for Mac"工具向Windows云服务器传输 ...

最新文章

  1. R语言ggplot2可视化条形图(bar plot)、配置因子变量的全局填充色方案、这样不同数据集相同因子的填充色具有一致性(Fix colors to factor levels)
  2. github md文件里显示markdown公式的解决办法
  3. 编程之美2.17 数组循环移位
  4. linkedhashmap 顺序_LinkedHashMap 源码详细分析(JDK1.8)
  5. MySQL启动出现The server quit without updating PID file错误解决办法
  6. open_basedir restriction in effect,解决php引入文件权限问题
  7. 区块链零知识证明:Zcash 基础知识普及帖,Zcash 技术分析
  8. win10系统的电脑如何录屏?QVE录屏大师使用教程?
  9. 运维面试题(1024水篇)
  10. 数据分析【实践】——AB测试的应用、案例及关键点
  11. 深度学习整理:detection 学习(2)——detection细节知识入门
  12. linux bond双活跟主备的区别,“双活中心”比“主备”方式更可靠
  13. Raspberry Pi 4和 Raspberry Pi 4B的区别_用树莓派搭建私人简易网盘 2/5 树莓派4B初始设置...
  14. Python vs Go!
  15. 【youcans 的 OpenCV 例程200篇】129. 形态算法之骨架 (重建开运算)
  16. java 接口文档的格式化_Java Word API - 读写转换处理DOC DOCX HTML PDF HTML格式
  17. 网易云信IM小程序上线?我们是这么做的!
  18. Linux中的Tab键
  19. 英雄联盟电竞bway公开S12宣传片 IG夺冠镜头置结尾 这是有寓意
  20. 2022-2027年中国公共图书馆资源行业发展监测及投资战略研究报告

热门文章

  1. Simple-BEV: 多传感器BEV感知真正重要的是什么?(斯坦福大学最新)
  2. 怎样用cmd创建Windows计划任务
  3. dp线长什么样子_显示器上的DP接口是什么接口?
  4. VHDL硬件描述语言学习笔记(三)
  5. vsCode插件-------Beautify(格式化代码)
  6. 横向对比和纵向对比分别是什么意思?(横空纵时)
  7. 零基础学商业插画难吗?新手画插画必备技巧指南
  8. 数据库技术产品生态图
  9. “猝死”,我离你有多远
  10. 计算机毕业设计ssm家猪智能饲养管理系统wt2ah系统+程序+源码+lw+远程部署