需要将下面的文件整理成三列

即整理成三列,第一列为蛋白ID,第二列为整个一行,第三列是gene ID,中间用制表符分割

#打开文件
f1 = open(‘X101SC19051138-Z01-bos_taurus-Customer.fasta’,‘r’)
f2 = open(‘pname.list’,‘w’)
#遍历
for i in f1:
#判断开头是否以>
if i.startswith(’>’):
#是,去掉换行符
i=i.strip("\n")
#按照空格将其分割成两列,存入数组n
n = i.split(’ ‘,1)
#按照空格分割,存入数组m
m = i.split(’ ‘)
#取数组n的第一列从第二个元素开始存入pro_id
pro_id = n[0][1:]
#判断m数据的列数是否有4列
if len(m) >= 4:
#如果有则取第四列元素为gene
gene = m[3]
#写入文件
f2.write(pro_id+’\t’+n[1]+’\t’+gene+’\n’)
else:
#否则将gene的这一列用-代替
f2.write(pro_id+’\t’+n[1]+’\t’+’-’+’\n’)
f2.close()

如何提取fasta文件的部分信息相关推荐

  1. linux提取fasta文件的id,从大的fasta文件中提取特定的fasta序列

    我想使用以下脚本从大的fasta文件中提取特定的fasta序列,但输出为空.从大的fasta文件中提取特定的fasta序列 transcripts.txt文件包含我想从assembly.fasta到s ...

  2. perl实现根据序列ID从提取fasta文件序列

    usage: perl thisScript.pl query.fa gene.lst outfile ------------------------------------------------ ...

  3. linux提取fasta文件的id,FASTA序列文件处理一网打尽

    推荐两个地方: 地方一都是小脚本,但实用,大伙也可以自己练习写. 地方二成熟软件SeqKit,也很实用. 一.小脚本 大家可以在这里下载以下脚本: https://github.com/jorvis/ ...

  4. 根据ID从FASTA文件中批量提取序列【Python】

    根据ID从FASTA文件中批量提取序列[Python] 生信问题记录 我的需求 input: FASTA文件,含六千余个蛋白序列.命名为FA.fasta txt文件,经过interpro注释后,筛选出 ...

  5. 从FASTA文件中批量提取指定序列【Python脚本】

    文章目录 前言 一:读取含特定字符的序列并输出 演示 二:读到某一个字符之前的全部输出 使用方法 三:输出前n条序列 使用方法 总结 前言 背景:学测序流程的时候,做到mapping的时牛的基因组有两 ...

  6. python文本提取序列信息_从fasta文件中通过头中的ID号提取序列

    accessionids.txt是否只包含四位数代码?在 如果是,请将accessorID更改为:accessorID = accessorIDWithArrow[1:5] 一些方法可以让这更像Pyt ...

  7. 使用Python脚本读取fasta文件

    读取FASTA文件 使用pip下载biopython pip.exe install biopython import sys from Bio import SeqIO sys.path #检查模块 ...

  8. [Python|生信]从Fasta文件出发获取序列的基本信息

    背景 最近参加了个生信的面试,记录一下有意思的面试题. 题目描述 要求从提供的*.fasta文件出发: 获得序列的反向互补序列,并统计信息:序列条数,碱基总数,N50,N90,GC 含量. 提取每条序 ...

  9. Python制作 .fasta文件的解析器

    FASTA文件是整个生物信息学,基因组学和进化生物学中使用的最常见的序列格式之一.主要用于存储核酸序列,但是FASTA文件的扩展名差异很大,有时可能是.fasta,有时也可能是.fas或.fna. 在 ...

最新文章

  1. 零基础可以学python吗-对于几乎是零基础的人,直接学 Python 编程合适吗?
  2. ylb:表的结构的修改和基本约束
  3. 《深入浅出数据分析》为读者送上了章回小说的精彩
  4. 透明地持久保存并从数据库中检索加密的数据
  5. 关于屏幕分辨率的一些操作
  6. Druid 简介,架构,部署,python连接,hue链接druid
  7. java字符串转字符串数组_Java字符串数组
  8. 开源纯净版u盘安装工具rufus
  9. 易中天品汉代风云人物06:韩信身世之谜
  10. 并网逆变器的clark、park变换的C语言实现技巧
  11. PPP over Ethernet(PPPoE)协议
  12. 微信小程序 | 借ChatGPT之手重构社交聊天小程序
  13. 国外主机注册域名有什么需要注意的吗?
  14. 程序员疯传「编程语言鄙视链」,究竟谁能逃过一劫?
  15. PHP+MYSQL基于ThinkPHP在线影院网站的设计与实现
  16. 面试官:Zookeeper怎么解决读写、双写并发不一致问题,以及共享锁的实现原理?
  17. Java数组编程实例(一) 统计输入字符串中每个字母出现的次数
  18. 什么是WDAGUtilityAccount账户?
  19. S7700交换机组网部分终端上不了网故障排查
  20. 什么是双线机房??双线是怎么实现的!!!

热门文章

  1. 一次 QPS 翻倍的 Java 服务性能优化
  2. Java日常开发的21个坑,你踩过几个?
  3. 一堆让人惊喜的实用工具,也许你还不知道
  4. 美团分布式服务治理框架OCTO之一:服务治理
  5. 控制~线性系统~的能控性和能观性
  6. vscode 开发lua搭建
  7. Python的控制语句4
  8. 详细谈电脑ip、域名、内网、外网、localhost、127.0.0.1、网关等通讯基础知识(易懂)
  9. shell脚本编程之更多结构化命令
  10. 04JavaScript中的运算符