accessionids.txt是否只包含四位数代码?在

如果是,请将accessorID更改为:accessorID = accessorIDWithArrow[1:5]

一些方法可以让这更像Python:

使用集合而不是字典,使用strip()而不是切片来删除换行符,并使用生成器表达式来构建集合

^{pr2}$

使用True和{},而不是skip的0和1。在

我将重做主循环:in_accession_ids = False

for line in f1:

if line[0] == '>':

_splitline = line.split('|')

accessorIDWithArrow = _splitline[0]

accessorID = accessorIDWithArrow[1:5]

# print accessorID

in_accession_ids = accessorID in AI_SET

if in_accession_ids:

f3.write(line)

我觉得这样的逻辑就更明显了。另外,从原始的skip = 0开始,或者在我的中以in_accession_ids=True开始,这意味着您将在找到第一个序列头之前打印所有内容。这可能是你想要的,也可能不是——我在重写本中假设没有。在

你可能最终会想看看Biopython的收集-对于这个特定的任务来说,它有点过分了,但总体来说还是相当不错的。很多工具可以用来读取FASTA文件和相关格式,等等。在

python文本提取序列信息_从fasta文件中通过头中的ID号提取序列相关推荐

  1. python文本结构化处理_在Python中标记非结构化文本数据

    python文本结构化处理 Labelled data has been a crucial demand for supervised machine learning leading to a n ...

  2. python文本相似度分析_文本相似度分析(基于jieba和gensim)

    ##基础概念 本文在进行文本相似度分析过程分为以下几个部分进行, 文本分词 语料库制作 算法训练 结果预测 分析过程主要用两个包来实现jieba,gensim jieba:主要实现分词过程 gensi ...

  3. python爬取路况信息_北京市交通管理局实时路况爬虫 | 学步园

    最近无人车项目需要用到交通管理局的实时路况信息,导师要求将实时路况信息爬下来. 我的想法是,因为路况信息是实时更新的,有最新的路况他们会更新,因此需要让程序隔一段时间运行一次,检查这次爬下的内容与上一 ...

  4. python文本自动伪原创_新手一天30篇伪原创,快速在线生成原创文章

    新手一天30篇伪原创,快速在线生成原创文章 现如今新媒体行业的竞争可谓越来越大,在这个内容为王的时代,优质的内容等于一切.写不出令人满意的内容,自我感觉到失落只是一方面,另一方面则是面临着失业的风险. ...

  5. python解析pdf中文乱码_解析PDF文件以及解决编码问题

    1.解析pdf文件 最近需要将pdf中文本提取出来,于是就了解了一下pdfminer 首先安装:pip3 install pdfminer3k 之后就是用pdfminer解析,不多说,直接上代码,这些 ...

  6. Java去除PDF换行符_删除FASTA文件中的换行符

    我有一个fasta文件,用换行符分解序列 . 我想删除换行符 . 这是我的文件的一个例子: >accession1 ATGGCCCATG GGATCCTAGC >accession2 GA ...

  7. python 基因序列提取_科学网—简单的Python脚本提取对应位置基因序列(fasta文件) - 王彬忠的博文...

    最近,用Python脚本提取,在基因号已知,位置已知条件下,相对应位置的基因序列时发现,这样很简单但是很实用的脚本,在网上却比较难找.而且,能被找到的脚本,相对于具有初级编程能力的人而言,有点难.本人 ...

  8. 下面哪个python库不能用于提取网页信息_利用python的webscraping库采集抓取爱帮网电话号码...

    利用python的webscraping模块抓取爱帮网电话号码,本文采集该页面的标题和2个电话号码, 具体的python代码: # -*- coding: UTF-8 -*- ''' Created ...

  9. python中提取几列_自己录制的公开课视频中提取字幕(python+opencv+Tesseract-OCR)

    最近在mooc上看了一个公开课:职场英语,用来学习在找工作时或者工作中用到的英语交流技巧,非常不错.由于自己听力不是很好,有的字幕中的单词不认识,并且想记下来便于以后学习.所以想把公开课中的字幕都记录 ...

最新文章

  1. 2018 Multi-University Training Contest 7
  2. 蓝光模式引爆欧洲杯 神马搜索陪你度过激情夏日
  3. MyBatisPlus插件扩展_OptimisticLockerInterceptor乐观锁插件的使用
  4. 开发者建站免费.或者.收费空间
  5. Mac下Nginx、PHP、MySQL 和 PHP-fpm安装配置
  6. php GD库文字居中,PHP GD ttftext居中对齐
  7. Android Spinnert的使用
  8. 使用Adobe Acrobat DC时PDF“文档无法保存。文件可能是只读文件”解决方法
  9. 第十五章,读取txt文件(C++)
  10. 毕业设计选题管理系统
  11. mysql 视频教程下载_最全138节Mysql数据库+PHP零基础到精通视频教程【云盘下载】...
  12. 矩阵微分常用公式整理
  13. 澤天夬 (易經大意 韓長庚)
  14. 全景视频预测头部移动-Predicting Head Movement in Panoramic Video: A Deep Reinforcement Learning Approach
  15. 道家修真分哪几个境界?
  16. algorithm java_Java KeyPairGenerator getAlgorithm()用法及代码示例
  17. 无盘疑难杂症的处理和网络的设置(转)
  18. 数据库设计-SQL Server开发实现学习
  19. 学计算机投影仪定义,一种计算机教学用投影仪射头的制作方法
  20. 流媒体服务新手入门教程01--什么是流媒体服务及m7s介绍

热门文章

  1. 基于JAVA+SpringBoot+Mybatis+MYSQL的在线点餐系统
  2. php小论坛开发总结,PHP开发 小型论坛教程之添加论坛-2
  3. java getconstructors,java 反射 constructors的问题,真心需要解决
  4. html界面左侧没有顶格,求解,html页面顶部有空白??
  5. android java 调用栈_Android开发中打印方法调用栈
  6. 第三方库pod错误:ld: library not found for -lXXX
  7. Windows Azure VM Role (2) 创建VHDVHD
  8. 第13章 使用ADO.NET访问数据库
  9. 初识EntityFramework6【转】
  10. 冲刺阶段(二) 第六天