如何提取fasta文件的部分信息
需要将下面的文件整理成三列
即整理成三列,第一列为蛋白ID,第二列为整个一行,第三列是gene ID,中间用制表符分割
#打开文件
f1 = open(‘X101SC19051138-Z01-bos_taurus-Customer.fasta’,‘r’)
f2 = open(‘pname.list’,‘w’)
#遍历
for i in f1:
#判断开头是否以>
if i.startswith(’>’):
#是,去掉换行符
i=i.strip("\n")
#按照空格将其分割成两列,存入数组n
n = i.split(’ ‘,1)
#按照空格分割,存入数组m
m = i.split(’ ‘)
#取数组n的第一列从第二个元素开始存入pro_id
pro_id = n[0][1:]
#判断m数据的列数是否有4列
if len(m) >= 4:
#如果有则取第四列元素为gene
gene = m[3]
#写入文件
f2.write(pro_id+’\t’+n[1]+’\t’+gene+’\n’)
else:
#否则将gene的这一列用-代替
f2.write(pro_id+’\t’+n[1]+’\t’+’-’+’\n’)
f2.close()
如何提取fasta文件的部分信息相关推荐
- linux提取fasta文件的id,从大的fasta文件中提取特定的fasta序列
我想使用以下脚本从大的fasta文件中提取特定的fasta序列,但输出为空.从大的fasta文件中提取特定的fasta序列 transcripts.txt文件包含我想从assembly.fasta到s ...
- perl实现根据序列ID从提取fasta文件序列
usage: perl thisScript.pl query.fa gene.lst outfile ------------------------------------------------ ...
- linux提取fasta文件的id,FASTA序列文件处理一网打尽
推荐两个地方: 地方一都是小脚本,但实用,大伙也可以自己练习写. 地方二成熟软件SeqKit,也很实用. 一.小脚本 大家可以在这里下载以下脚本: https://github.com/jorvis/ ...
- 根据ID从FASTA文件中批量提取序列【Python】
根据ID从FASTA文件中批量提取序列[Python] 生信问题记录 我的需求 input: FASTA文件,含六千余个蛋白序列.命名为FA.fasta txt文件,经过interpro注释后,筛选出 ...
- 从FASTA文件中批量提取指定序列【Python脚本】
文章目录 前言 一:读取含特定字符的序列并输出 演示 二:读到某一个字符之前的全部输出 使用方法 三:输出前n条序列 使用方法 总结 前言 背景:学测序流程的时候,做到mapping的时牛的基因组有两 ...
- python文本提取序列信息_从fasta文件中通过头中的ID号提取序列
accessionids.txt是否只包含四位数代码?在 如果是,请将accessorID更改为:accessorID = accessorIDWithArrow[1:5] 一些方法可以让这更像Pyt ...
- 使用Python脚本读取fasta文件
读取FASTA文件 使用pip下载biopython pip.exe install biopython import sys from Bio import SeqIO sys.path #检查模块 ...
- [Python|生信]从Fasta文件出发获取序列的基本信息
背景 最近参加了个生信的面试,记录一下有意思的面试题. 题目描述 要求从提供的*.fasta文件出发: 获得序列的反向互补序列,并统计信息:序列条数,碱基总数,N50,N90,GC 含量. 提取每条序 ...
- Python制作 .fasta文件的解析器
FASTA文件是整个生物信息学,基因组学和进化生物学中使用的最常见的序列格式之一.主要用于存储核酸序列,但是FASTA文件的扩展名差异很大,有时可能是.fasta,有时也可能是.fas或.fna. 在 ...
最新文章
- 零基础可以学python吗-对于几乎是零基础的人,直接学 Python 编程合适吗?
- ylb:表的结构的修改和基本约束
- 《深入浅出数据分析》为读者送上了章回小说的精彩
- 透明地持久保存并从数据库中检索加密的数据
- 关于屏幕分辨率的一些操作
- Druid 简介,架构,部署,python连接,hue链接druid
- java字符串转字符串数组_Java字符串数组
- 开源纯净版u盘安装工具rufus
- 易中天品汉代风云人物06:韩信身世之谜
- 并网逆变器的clark、park变换的C语言实现技巧
- PPP over Ethernet(PPPoE)协议
- 微信小程序 | 借ChatGPT之手重构社交聊天小程序
- 国外主机注册域名有什么需要注意的吗?
- 程序员疯传「编程语言鄙视链」,究竟谁能逃过一劫?
- PHP+MYSQL基于ThinkPHP在线影院网站的设计与实现
- 面试官:Zookeeper怎么解决读写、双写并发不一致问题,以及共享锁的实现原理?
- Java数组编程实例(一) 统计输入字符串中每个字母出现的次数
- 什么是WDAGUtilityAccount账户?
- S7700交换机组网部分终端上不了网故障排查
- 什么是双线机房??双线是怎么实现的!!!