python文本提取序列信息_从fasta文件中通过头中的ID号提取序列
accessionids.txt是否只包含四位数代码?在
如果是,请将accessorID更改为:accessorID = accessorIDWithArrow[1:5]
一些方法可以让这更像Python:
使用集合而不是字典,使用strip()而不是切片来删除换行符,并使用生成器表达式来构建集合
^{pr2}$
使用True和{},而不是skip的0和1。在
我将重做主循环:in_accession_ids = False
for line in f1:
if line[0] == '>':
_splitline = line.split('|')
accessorIDWithArrow = _splitline[0]
accessorID = accessorIDWithArrow[1:5]
# print accessorID
in_accession_ids = accessorID in AI_SET
if in_accession_ids:
f3.write(line)
我觉得这样的逻辑就更明显了。另外,从原始的skip = 0开始,或者在我的中以in_accession_ids=True开始,这意味着您将在找到第一个序列头之前打印所有内容。这可能是你想要的,也可能不是——我在重写本中假设没有。在
你可能最终会想看看Biopython的收集-对于这个特定的任务来说,它有点过分了,但总体来说还是相当不错的。很多工具可以用来读取FASTA文件和相关格式,等等。在
python文本提取序列信息_从fasta文件中通过头中的ID号提取序列相关推荐
- python文本结构化处理_在Python中标记非结构化文本数据
python文本结构化处理 Labelled data has been a crucial demand for supervised machine learning leading to a n ...
- python文本相似度分析_文本相似度分析(基于jieba和gensim)
##基础概念 本文在进行文本相似度分析过程分为以下几个部分进行, 文本分词 语料库制作 算法训练 结果预测 分析过程主要用两个包来实现jieba,gensim jieba:主要实现分词过程 gensi ...
- python爬取路况信息_北京市交通管理局实时路况爬虫 | 学步园
最近无人车项目需要用到交通管理局的实时路况信息,导师要求将实时路况信息爬下来. 我的想法是,因为路况信息是实时更新的,有最新的路况他们会更新,因此需要让程序隔一段时间运行一次,检查这次爬下的内容与上一 ...
- python文本自动伪原创_新手一天30篇伪原创,快速在线生成原创文章
新手一天30篇伪原创,快速在线生成原创文章 现如今新媒体行业的竞争可谓越来越大,在这个内容为王的时代,优质的内容等于一切.写不出令人满意的内容,自我感觉到失落只是一方面,另一方面则是面临着失业的风险. ...
- python解析pdf中文乱码_解析PDF文件以及解决编码问题
1.解析pdf文件 最近需要将pdf中文本提取出来,于是就了解了一下pdfminer 首先安装:pip3 install pdfminer3k 之后就是用pdfminer解析,不多说,直接上代码,这些 ...
- Java去除PDF换行符_删除FASTA文件中的换行符
我有一个fasta文件,用换行符分解序列 . 我想删除换行符 . 这是我的文件的一个例子: >accession1 ATGGCCCATG GGATCCTAGC >accession2 GA ...
- python 基因序列提取_科学网—简单的Python脚本提取对应位置基因序列(fasta文件) - 王彬忠的博文...
最近,用Python脚本提取,在基因号已知,位置已知条件下,相对应位置的基因序列时发现,这样很简单但是很实用的脚本,在网上却比较难找.而且,能被找到的脚本,相对于具有初级编程能力的人而言,有点难.本人 ...
- 下面哪个python库不能用于提取网页信息_利用python的webscraping库采集抓取爱帮网电话号码...
利用python的webscraping模块抓取爱帮网电话号码,本文采集该页面的标题和2个电话号码, 具体的python代码: # -*- coding: UTF-8 -*- ''' Created ...
- python中提取几列_自己录制的公开课视频中提取字幕(python+opencv+Tesseract-OCR)
最近在mooc上看了一个公开课:职场英语,用来学习在找工作时或者工作中用到的英语交流技巧,非常不错.由于自己听力不是很好,有的字幕中的单词不认识,并且想记下来便于以后学习.所以想把公开课中的字幕都记录 ...
最新文章
- 2018 Multi-University Training Contest 7
- 蓝光模式引爆欧洲杯 神马搜索陪你度过激情夏日
- MyBatisPlus插件扩展_OptimisticLockerInterceptor乐观锁插件的使用
- 开发者建站免费.或者.收费空间
- Mac下Nginx、PHP、MySQL 和 PHP-fpm安装配置
- php GD库文字居中,PHP GD ttftext居中对齐
- Android Spinnert的使用
- 使用Adobe Acrobat DC时PDF“文档无法保存。文件可能是只读文件”解决方法
- 第十五章,读取txt文件(C++)
- 毕业设计选题管理系统
- mysql 视频教程下载_最全138节Mysql数据库+PHP零基础到精通视频教程【云盘下载】...
- 矩阵微分常用公式整理
- 澤天夬 (易經大意 韓長庚)
- 全景视频预测头部移动-Predicting Head Movement in Panoramic Video: A Deep Reinforcement Learning Approach
- 道家修真分哪几个境界?
- algorithm java_Java KeyPairGenerator getAlgorithm()用法及代码示例
- 无盘疑难杂症的处理和网络的设置(转)
- 数据库设计-SQL Server开发实现学习
- 学计算机投影仪定义,一种计算机教学用投影仪射头的制作方法
- 流媒体服务新手入门教程01--什么是流媒体服务及m7s介绍
热门文章
- 基于JAVA+SpringBoot+Mybatis+MYSQL的在线点餐系统
- php小论坛开发总结,PHP开发 小型论坛教程之添加论坛-2
- java getconstructors,java 反射 constructors的问题,真心需要解决
- html界面左侧没有顶格,求解,html页面顶部有空白??
- android java 调用栈_Android开发中打印方法调用栈
- 第三方库pod错误:ld: library not found for -lXXX
- Windows Azure VM Role (2) 创建VHDVHD
- 第13章 使用ADO.NET访问数据库
- 初识EntityFramework6【转】
- 冲刺阶段(二) 第六天