使用Python计算fasta文件的序列长度

在这里插入代码片使用Python计算fasta文件的序列长度

#!/usr/bin/python
#-- coding:utf-8 --

import sys

f = open(sys.argv[1],‘r’)
out = open(sys.argv[2],‘w’)

def chr_length(infile,outfile):
f = open(sys.argv[1],‘r’)
out = open(sys.argv[2],‘w’)
dic = {}
name = ‘’
seq = []
for line in f:
if line.startswith(’>’):
name = line.strip(’\n’).strip(’>’)
seq = []
dic[name] = seq
else :
line = line.strip(’\n’)
seq.append(line)
dic[name] = seq
#print “%s sequences in total” % len(dic)
out.write(“Chromosome\tstart\tend\n”)
for (name ,seq) in dic.items():
out.write("%s\t1\t%s\n" % (name,sum(map(len,seq))))
f.close()
out.close()
chr_length(sys.argv[1],sys.argv[2])

使用Python计算fasta文件的序列长度相关推荐

  1. 利用python计算fasta文件中ATGC的含量

    1 #!/usr/bin/python3 2 #-*- coding:utf-8 -*- 3 "计算fatsa文件中的不同类型的碱基含量" 4 f=open('./test.txt ...

  2. python处理fasta文件_Python脚本:fasta文件单序列信息提取

    使用Python对fasta格式的序列进行基本信息统计 预期设计输出文件中包括fasta文件名,序列长度,GC含量以及ATCG各自的含量. Python脚本编辑 使用的文件 test.fasta st ...

  3. [笔记]python对FASTA文件的处理

    这学期选了生信的选修课-perl/python在生物信息学中的应用 把结课作业的代码整理出来主要是python对FASTA文件的读取和数据处理 FASTA文件数据处理 FASTA文件读取: 只含一个基 ...

  4. 利用Python读取fasta文件并进行一系列操作(上)

    利用Python读取fasta文件并进行一系列操作(上) 概述 语言:python3.8 模块:pysam collections 可选:jupyter 整体思路:将fasta格式的基因原始数据处理为 ...

  5. Python制作 .fasta文件的解析器

    FASTA文件是整个生物信息学,基因组学和进化生物学中使用的最常见的序列格式之一.主要用于存储核酸序列,但是FASTA文件的扩展名差异很大,有时可能是.fasta,有时也可能是.fas或.fna. 在 ...

  6. fasta文件中序列的排序

    同样的名为read_1.fa 的fasta文件,里面有若干序列,如: >@r1 TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAA ...

  7. python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例

    功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...

  8. python计算召回率_序列标注的准确率和召回率计算

    最近在用BiLSTM+CRF做命名实体识别问题.关于模型效果评估,很多提到用conlleval.pl来实现,conlleval.pl是perl语言写的,原谅我没看懂.最后还是决定自己写个程序算一算准确 ...

  9. Python计算大文件行数方法及性能比较

    如何使用Python快速高效地统计出大文件的总行数, 下面是一些实现方法和性能的比较. 1.readline读所有行 使用readlines方法读取所有行: def readline_count(fi ...

最新文章

  1. 算法设计与分析第4章 动态规划(二)【DP序列问题】
  2. .NET 使用 MySql.Data.dll 动态库操作MySql的帮助类--MySqlHelper
  3. 解决“cannot open git-receive-pack”错误
  4. oracle表空间最大30G?如果一张表超过30G怎么办
  5. C++ Opengl图形颜色源码
  6. 用70行代码实现日志分析程序​
  7. java jdbc 连接mysql数据库,Java 通过JDBC连接Mysql数据库
  8. c1语言考试内容,c1证科目三考试内容
  9. HTTP权威指南记录 ---- HTTP报文
  10. Nginx基本数据结构之ngx_queue_t
  11. android gridview滚动监听,检测GridView滚动速度 – Android
  12. VBA中让程序休眠 SLeep的方法
  13. mybatis问题。foreach循环遍历数组报错情况,及其解决方法
  14. win10前置耳机插孔没声音_新买的电脑,为什么插入耳机没有声音?一招教你快速解决...
  15. 计算机字节与位的换算,计算机字节换算(计算机字节换算器)
  16. KVM虚拟机扩容硬盘
  17. 千叶加密php,哪位大侠可以透漏一下千叶素是什么?
  18. Qt 编程使用Sapera LT API 实现盖革雪崩焦平面相机数据采集
  19. Word文件怎么在方框里面打对勾
  20. class07:Express框架、中间件

热门文章

  1. 口水战,实在是费心费力,浪费时间,以后坚持8020法则,决不手软!
  2. 13.Struts2_动态方法调用(了解)
  3. 高等代数 线性映射(第9章)5 有理标准形
  4. 单片机c语言里 10和%10的区别,10个单片机C语言实例.doc
  5. PySimpleGUI图形界面绘制及办公自动化小软件的制作
  6. Unity接入Google广告(AdMob)
  7. 集合竞价如何买入_集合竞价买入法 如何在集合竞价中买入股票?
  8. RabbitMq模式
  9. python批量读取excel表格数据_Python读取Excel数据并生成图表过程解析
  10. 2020年程序员节杂记:老骥明知桑榆晚,不用扬鞭自奋蹄