FASTA Format
FASTA格式又称Pearson的格式,该种序列格式要求序列的标题行以大于号">"开头,下一行起为具体的序列。一般建议每行的字符数不超过60个,以方便程序处理。多条核苷酸序列格式即将该格式连续列出即可.
- This format contains a single header line providing the sequence name, and optionally a description, followed by lines of sequence data.
- Sequences in FASTA formatted files are preceded by a line starting with a " >" symbol.
- The first word on this line is the name of the sequence. The rest of the line is a description of the sequence.
Term Entry Name Molecule Type Gene Name Sequence Length |
e.g. FOSB_MOUSE Protein fosB 338 bp |
- The remaining lines contain the sequence itself, usually formated to 60 characters per line.
- Depending on the application blank lines in a FASTA file are ignored or treated as terminating the sequence
- Depending on the application spaces or other non-sequence symbols (dashes, underscores, periods) in a sequence are either ignored or treated as gaps.
- FASTA files containing multiple sequences are just the same, with one sequence listed right after another. This format is accepted for many multiple sequence alignment programs.
FASTA Format相关推荐
- C#,生信软件实践(03)——DNA数据库GenBank格式详解及转为FASTA序列格式的源代码
1 GenBank 1.1 NCBI--美国国家生物技术信息中心(美国国立生物技术信息中心) NCBI(美国国立生物技术信息中心)是在NIH的国立医学图书馆(NLM)的一个分支.它的使命包括四项任务: ...
- linux提取fasta文件的id,FASTA序列文件处理一网打尽
推荐两个地方: 地方一都是小脚本,但实用,大伙也可以自己练习写. 地方二成熟软件SeqKit,也很实用. 一.小脚本 大家可以在这里下载以下脚本: https://github.com/jorvis/ ...
- 为什么 Biopython 的在线 BLAST 这么慢?
用过网页版本 BLAST 的童鞋都会发现,提交的序列比对往往在几分钟,甚至几十秒就可以得到比对的结果:而通过调用 API 却要花费几十分钟或者更长的时间!这到底是为什么呢? NCBIWWW 基本用法 ...
- drep:微生物基因组快速去冗余-文章解读+帮助文档+实战教程
在微生物分离培养.分箱中获得的大量的基因组.宏基因组拼接的基因组(MAG),如何确定到底有多少种非冗余的细菌基因组呢? 来自加州大学伯克利分校Jillian F Banfield组开发的dRep可以帮 ...
- vsearch2.8.1使用和命令简介——中文帮助文档(免费64位版usearch)
简介 主要功能和命令行格式 嵌合体检测 聚类 去冗余 序列操作 屏蔽序列 两两比对 搜索 重排与排序 抽样 物种分类 处理UDB数据库索引 描述 输入 参数 通用参数 嵌合体检测参数 聚类参数 序列去 ...
- LoRDEC的使用(LoRDEC-0.6.tar.gz)
参考 Laurent Bouri, Dominique Lavenier. Evaluation of long read error correction software. [Research R ...
- biopython有什么用_BioPython学习笔记
序列和序列对象 Seq 类 Seq类是Biopython最基础的一类, 储存序列信息. from Bio.Seq import Seq. 该类基本格式是Seq(self, data, alphabet ...
- samtools常用命令详解
samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以 ...
- 基于RNA-seq的基因表达分析
我的青春 最近在做一些小麦基因的表达分析,想到使用RNA-seq的数据进行生物信息学分析,并且比我做实验用的组织还要多. 序列预处理 下载数据之后,首先要对数据进行低质量序列和载体序列等污染序 ...
最新文章
- 领克汽车是用鸿蒙系统吗,领克全新旗舰SUV将在上海车展首发亮相
- 生成Yolox检测负样本-对应空文件夹txt、批量文件重命名、批量转化三通道去除小图
- textarea 固定大小,滚动条,限制拖动,文字对齐
- tomcat:there is no resources that can be added or removed from server
- 测试点错的来:1024 科学计数法 (20分)
- 互联网java常用框架_来,带你鸟瞰 Java 中4款常用的并发框架!
- Android之All children of ConstraintLayout must have ids to use ConstraintSet
- 历史上的今天:让我们一起缅怀菲尔兹
- react同步请求_React中setState同步更新策略
- [示例] 使用 TStopwatch 计时
- Problem C: 默认参数:求圆面积
- 深度学习2.0-27.动量与学习率衰减
- 9月第1周文学类网站/频道:新浪文学超起点居首
- C# 获取硬盘序列号
- 微信公众号迁移保持OPENID不变新老账户粉丝迁移问题
- 云电脑服务:技术与商业模式双重创新
- 中级微观经济学:Chap 32 交换
- 为什么Hashtab的大小通常取远离2^n 的素数
- 前端应该知晓的PWA
- CentOs 7切换图形界面