我有一个fasta文件(第一个序列在下面提到)与长描述。我需要选择特定的描述字段。当我使用下面的代码时;整个描述进入字符串。

from Bio import SeqIO

for record in SeqIO.parse("geneTemp.fasta", "fasta") :

id=record.id

desc=record.description

print desc有没有简单的方法来获取描述字段(使用biopython库)到数组中,并挑选特定的字段,而无需将描述转换为字符串并吐出字符串?

代码输出

Python 2.7 (r27:82500, Sep 16 2010, 18:03:06)

[GCC 4.5.1 20100907 (Red Hat 4.5.1-3)] on localhost.localdomain, Standard

>>> FBgn0197520 type=gene; loc=scaffold_12855:complement(6241650..6242111); ID=FBgn0197520; name=Dvir\GJ10233; dbxref=FlyBase_Annotation_IDs:GJ10233,FlyBase:FBgn0197520,GLEANR:dvir_GLEANR_10171,EntrezGene:6632532,GB_protein:EDW59542,FlyMine:FBgn0197520,OrthoDB4.Arthropods:FBgn0242841,OrthoDB4.Arthropods:FBgn0213090,OrthoDB4.Arthropods:FBgn0190974,OrthoDB4.Arthropods:FBgn0165423,OrthoDB4.Arthropods:FBgn0247590,OrthoDB4.Arthropods:FBgn0149779,OrthoDB4.Arthropods:FBgn0146205,OrthoDB4.Arthropods:FBgn0017456,OrthoDB4.Arthropods:FBgn0126736,OrthoDB4.Arthropods:FBgn0117264,OrthoDB4.Arthropods:FBgn0094317; MD5=0b7e859d2a6eca028ffd16b964835705; length=462; release=r1.2; species=Dvir;

loc=scaffold_12855:complement(6241650..6242111)其中一个来自fasta文件的序列。

>FBgn0207418 type=gene; loc=scaffold_12875:complement(14361770..14363857); ID=FBgn0207418; name=Dvir\GJ20278; dbxref=FlyBase_Annotation_IDs:GJ20278,FlyBase:FBgn0207418,GLEANR:dvir_GLEANR_5721,EntrezGene:6625684,GB_protein:EDW61510,FlyMine:FBgn0207418,OrthoDB4.Arthropods:NV16422,OrthoDB4.Arthropods:LH16819,OrthoDB4.Arthropods:ISCW000548,OrthoDB4.Arthropods:FBgn0239668,OrthoDB4.Arthropods:FBgn0219970,OrthoDB4.Arthropods:FBgn0181866,OrthoDB4.Arthropods:FBgn0175499,OrthoDB4.Arthropods:FBgn0080765,OrthoDB4.Arthropods:FBgn0155230,OrthoDB4.Arthropods:FBgn0141947,OrthoDB4.Arthropods:FBgn0033392,OrthoDB4.Arthropods:FBgn0127494,OrthoDB4.Arthropods:FBgn0102879,OrthoDB4.Arthropods:FBgn0090125,OrthoDB4.Arthropods:CPIJ005729,OrthoDB4.Arthropods:GB15324,OrthoDB4.Arthropods:AGAP012336,OrthoDB4.Arthropods:AAEL007395,OrthoDB4.Arthropods:PB24927,OrthoDB4.Arthropods:PHUM365660,OrthoDB4.Arthropods:GLEAN_06039; MD5=4c62b751ec045ac93306ce7c08d254f9; length=2088; release=r1.2; species=Dvir;

ATGCGTCTGCGACGCCGCTGGCATCGGCGGATGCGGCGTACAATTGAGAA

AATCTATCGCCTTAAAATGCAATCGCGCCGCAAGTTGGTTTACTTAGCCG

TATTTGGAGCACTATGCGTAATATTCTGGCTGGCTGGACAGCAGTTGCTG

ACGACTTCGAATGGTCACTACAGTAGCTACTACGGCGAAACGCATTGTGC

GCCCATTGATGCCGTATACACCTGGGTAAATGGTTCGGATCCGGATTTTA

TTGAGTCCATTAGACGCTACGATGCCAGCTACGATCCGTCGCGCTTCGAC

怎么使用biopython_使用biopython解析Fasta文件描述相关推荐

  1. BioPython读取FASTA文件保留header中空格的方法

    问题 最近开始学习使用Biopython这个工具包,非常方便地可以处理一些序列文件.最近用Bio.SeqIO模块进行读取fasta文件到字典中的时候发现一个问题,如果你的fasta文件>开头的那 ...

  2. Python制作 .fasta文件的解析器

    FASTA文件是整个生物信息学,基因组学和进化生物学中使用的最常见的序列格式之一.主要用于存储核酸序列,但是FASTA文件的扩展名差异很大,有时可能是.fasta,有时也可能是.fas或.fna. 在 ...

  3. python文本提取序列信息_从fasta文件中通过头中的ID号提取序列

    accessionids.txt是否只包含四位数代码?在 如果是,请将accessorID更改为:accessorID = accessorIDWithArrow[1:5] 一些方法可以让这更像Pyt ...

  4. 使用Python脚本读取fasta文件

    读取FASTA文件 使用pip下载biopython pip.exe install biopython import sys from Bio import SeqIO sys.path #检查模块 ...

  5. 根据ID从FASTA文件中批量提取序列【Python】

    根据ID从FASTA文件中批量提取序列[Python] 生信问题记录 我的需求 input: FASTA文件,含六千余个蛋白序列.命名为FA.fasta txt文件,经过interpro注释后,筛选出 ...

  6. 生物信息中的Python 02 | 用biopython解析序列

    上一篇文章生物信息中的Python 01 | 从零开始处理基因序列自己造轮子实现了序列的基础操作,但是在Python的世界里,一项工作只要重复的次数多了,那么一定就会有大神来开发相应的包来解决,这个包 ...

  7. python中序列和列表区别细菌真菌病毒_生物信息中的Python 02 | 用biopython解析序列...

    上一篇文章生物信息中的Python 01 | 从零开始处理基因序列自己造轮子实现了序列的基础操作,但是在Python的世界里,一项工作只要重复的次数多了,那么一定就会有大神来开发相应的包来解决,这个包 ...

  8. python中利用lxml模块解析xml文件报错XMLSyntaxError: Opening and ending tag mismatch

    今天在代码中第一次使用lxml解析xml文件时出错了, XMLSyntaxError: Opening and ending tag mismatch: keyEffectiveDate line 2 ...

  9. java代码使用http请求解压zip包并解析xml_Javascript 是如何解析 Excel 文件的?

    最近要做一个导入导出 Excel 的功能,上一次做这个功能的时候,还是用的 Java Apache POI,这是一个用 Java 编写的免费开源的跨平台的 Java API,能够对 Microsoft ...

  10. java xml中的冒号_Java jdom解析xml文件带冒号的属性

    Java jdom解析xml文件带冒号的属性 如果xml文件解析带了冒号的属性,一般都是要特别处理,这里是命名空间,N年前遇到过一次忘记记录,后来也忘了,这次再记录下. 解决了,记录下,分享给大家,百 ...

最新文章

  1. 这51个大数据术语,你懂的有几个?
  2. SpringBoot简单使用
  3. C++中.lib静态库、.dll动态库的生成及调用2
  4. 皮一皮:精致的人生,哪怕拔火罐也要搭配衣服出门...
  5. 我是如何拿到蚂蚁金服 offer ?
  6. jca oracle官方文档,Oracle 官方文档说明
  7. 安卓WebView加载网页不显示或者乱跳问题
  8. C#多线程学习(五) 多线程的自动管理(定时器) (转载系列)——继续搜索引擎研究...
  9. jemter在linux上怎么安装_办公便签软件怎么下载?怎么在电脑桌面上下载安装一款办公便签软件...
  10. 7-6 列出连通集 (25 分)(C语言实现)
  11. 闲鱼如何利用端计算提升推荐场景的ctr
  12. 尚学堂-马士兵-专题-正则表达式
  13. 大道至简第四章读后感
  14. 以太坊虚拟机 EVM(4)分布式存储架构设计(FISCO BCOS为例)
  15. 怎么给服务器部署php探针,phpStudy学习之php探针
  16. Linux高可用集群搭建
  17. zk-ui 安装部署
  18. 动态规划——(很特别的一个动态规划入门教程)#觉得原作者写的很有意思
  19. Python绘制气泡图
  20. Python迎来30岁生日,先驱Pablo Galindo:没想到Python这么流行

热门文章

  1. 三维计算机学校,什么是三维虚拟校园系统?
  2. 输入数学函数c语言,C语言基本输入输出及数学函数.ppt
  3. 《信号与系统》(吴京)部分课后习题答案与解析——第四章(PART2)
  4. 各类经纬度转换工具类
  5. 开心网倒闭变卖,创始人程炳皓反思的亲笔信全文
  6. psp3000 java_psp上的python
  7. 开源 ASP.NET CMS
  8. multisim常用d触发器_怎么在multisim找D触发器
  9. office怎么像wps一样多栏_WPS文档分栏设置,让排版更完美 Word2010如何分两栏、三栏、多栏技巧...
  10. Opengl ES系列学习--点亮世界