使用Python计算fasta文件的序列长度
使用Python计算fasta文件的序列长度
在这里插入代码片
使用Python计算fasta文件的序列长度
#!/usr/bin/python
#-- coding:utf-8 --
import sys
f = open(sys.argv[1],‘r’)
out = open(sys.argv[2],‘w’)
def chr_length(infile,outfile):
f = open(sys.argv[1],‘r’)
out = open(sys.argv[2],‘w’)
dic = {}
name = ‘’
seq = []
for line in f:
if line.startswith(’>’):
name = line.strip(’\n’).strip(’>’)
seq = []
dic[name] = seq
else :
line = line.strip(’\n’)
seq.append(line)
dic[name] = seq
#print “%s sequences in total” % len(dic)
out.write(“Chromosome\tstart\tend\n”)
for (name ,seq) in dic.items():
out.write("%s\t1\t%s\n" % (name,sum(map(len,seq))))
f.close()
out.close()
chr_length(sys.argv[1],sys.argv[2])
使用Python计算fasta文件的序列长度相关推荐
- 利用python计算fasta文件中ATGC的含量
1 #!/usr/bin/python3 2 #-*- coding:utf-8 -*- 3 "计算fatsa文件中的不同类型的碱基含量" 4 f=open('./test.txt ...
- python处理fasta文件_Python脚本:fasta文件单序列信息提取
使用Python对fasta格式的序列进行基本信息统计 预期设计输出文件中包括fasta文件名,序列长度,GC含量以及ATCG各自的含量. Python脚本编辑 使用的文件 test.fasta st ...
- [笔记]python对FASTA文件的处理
这学期选了生信的选修课-perl/python在生物信息学中的应用 把结课作业的代码整理出来主要是python对FASTA文件的读取和数据处理 FASTA文件数据处理 FASTA文件读取: 只含一个基 ...
- 利用Python读取fasta文件并进行一系列操作(上)
利用Python读取fasta文件并进行一系列操作(上) 概述 语言:python3.8 模块:pysam collections 可选:jupyter 整体思路:将fasta格式的基因原始数据处理为 ...
- Python制作 .fasta文件的解析器
FASTA文件是整个生物信息学,基因组学和进化生物学中使用的最常见的序列格式之一.主要用于存储核酸序列,但是FASTA文件的扩展名差异很大,有时可能是.fasta,有时也可能是.fas或.fna. 在 ...
- fasta文件中序列的排序
同样的名为read_1.fa 的fasta文件,里面有若干序列,如: >@r1 TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAA ...
- python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例
功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...
- python计算召回率_序列标注的准确率和召回率计算
最近在用BiLSTM+CRF做命名实体识别问题.关于模型效果评估,很多提到用conlleval.pl来实现,conlleval.pl是perl语言写的,原谅我没看懂.最后还是决定自己写个程序算一算准确 ...
- Python计算大文件行数方法及性能比较
如何使用Python快速高效地统计出大文件的总行数, 下面是一些实现方法和性能的比较. 1.readline读所有行 使用readlines方法读取所有行: def readline_count(fi ...
最新文章
- 算法设计与分析第4章 动态规划(二)【DP序列问题】
- .NET 使用 MySql.Data.dll 动态库操作MySql的帮助类--MySqlHelper
- 解决“cannot open git-receive-pack”错误
- oracle表空间最大30G?如果一张表超过30G怎么办
- C++ Opengl图形颜色源码
- 用70行代码实现日志分析程序​
- java jdbc 连接mysql数据库,Java 通过JDBC连接Mysql数据库
- c1语言考试内容,c1证科目三考试内容
- HTTP权威指南记录 ---- HTTP报文
- Nginx基本数据结构之ngx_queue_t
- android gridview滚动监听,检测GridView滚动速度 – Android
- VBA中让程序休眠 SLeep的方法
- mybatis问题。foreach循环遍历数组报错情况,及其解决方法
- win10前置耳机插孔没声音_新买的电脑,为什么插入耳机没有声音?一招教你快速解决...
- 计算机字节与位的换算,计算机字节换算(计算机字节换算器)
- KVM虚拟机扩容硬盘
- 千叶加密php,哪位大侠可以透漏一下千叶素是什么?
- Qt 编程使用Sapera LT API 实现盖革雪崩焦平面相机数据采集
- Word文件怎么在方框里面打对勾
- class07:Express框架、中间件
热门文章
- 口水战,实在是费心费力,浪费时间,以后坚持8020法则,决不手软!
- 13.Struts2_动态方法调用(了解)
- 高等代数 线性映射(第9章)5 有理标准形
- 单片机c语言里 10和%10的区别,10个单片机C语言实例.doc
- PySimpleGUI图形界面绘制及办公自动化小软件的制作
- Unity接入Google广告(AdMob)
- 集合竞价如何买入_集合竞价买入法 如何在集合竞价中买入股票?
- RabbitMq模式
- python批量读取excel表格数据_Python读取Excel数据并生成图表过程解析
- 2020年程序员节杂记:老骥明知桑榆晚,不用扬鞭自奋蹄