FASTA格式又称Pearson的格式,该种序列格式要求序列的标题行以大于号">"开头,下一行起为具体的序列。一般建议每行的字符数不超过60个,以方便程序处理。多条核苷酸序列格式即将该格式连续列出即可.

    • This format contains a single header line providing the sequence name, and optionally a description, followed by lines of sequence data.
    • Sequences in FASTA formatted files are preceded by a line starting with a " >" symbol.
    • The first word on this line is the name of the sequence. The rest of the line is a description of the sequence.
Term     Entry Name        Molecule Type     Gene Name     Sequence Length
e.g.       FOSB_MOUSE     Protein                fosB                 338 bp
  • The remaining lines contain the sequence itself, usually formated to 60 characters per line.
  • Depending on the application blank lines in a FASTA file are ignored or treated as terminating the sequence
  • Depending on the application spaces or other non-sequence symbols (dashes, underscores, periods) in a sequence are either ignored or treated as gaps.
  • FASTA files containing multiple sequences are just the same, with one sequence listed right after another. This format is accepted for many multiple sequence alignment programs.

FASTA Format相关推荐

  1. C#,生信软件实践(03)——DNA数据库GenBank格式详解及转为FASTA序列格式的源代码

    1 GenBank 1.1 NCBI--美国国家生物技术信息中心(美国国立生物技术信息中心) NCBI(美国国立生物技术信息中心)是在NIH的国立医学图书馆(NLM)的一个分支.它的使命包括四项任务: ...

  2. linux提取fasta文件的id,FASTA序列文件处理一网打尽

    推荐两个地方: 地方一都是小脚本,但实用,大伙也可以自己练习写. 地方二成熟软件SeqKit,也很实用. 一.小脚本 大家可以在这里下载以下脚本: https://github.com/jorvis/ ...

  3. 为什么 Biopython 的在线 BLAST 这么慢?

    用过网页版本 BLAST 的童鞋都会发现,提交的序列比对往往在几分钟,甚至几十秒就可以得到比对的结果:而通过调用 API 却要花费几十分钟或者更长的时间!这到底是为什么呢? NCBIWWW 基本用法 ...

  4. drep:微生物基因组快速去冗余-文章解读+帮助文档+实战教程

    在微生物分离培养.分箱中获得的大量的基因组.宏基因组拼接的基因组(MAG),如何确定到底有多少种非冗余的细菌基因组呢? 来自加州大学伯克利分校Jillian F Banfield组开发的dRep可以帮 ...

  5. vsearch2.8.1使用和命令简介——中文帮助文档(免费64位版usearch)

    简介 主要功能和命令行格式 嵌合体检测 聚类 去冗余 序列操作 屏蔽序列 两两比对 搜索 重排与排序 抽样 物种分类 处理UDB数据库索引 描述 输入 参数 通用参数 嵌合体检测参数 聚类参数 序列去 ...

  6. LoRDEC的使用(LoRDEC-0.6.tar.gz)

    参考 Laurent Bouri, Dominique Lavenier. Evaluation of long read error correction software. [Research R ...

  7. biopython有什么用_BioPython学习笔记

    序列和序列对象 Seq 类 Seq类是Biopython最基础的一类, 储存序列信息. from Bio.Seq import Seq. 该类基本格式是Seq(self, data, alphabet ...

  8. samtools常用命令详解

    samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以 ...

  9. 基于RNA-seq的基因表达分析

    我的青春     最近在做一些小麦基因的表达分析,想到使用RNA-seq的数据进行生物信息学分析,并且比我做实验用的组织还要多. 序列预处理 下载数据之后,首先要对数据进行低质量序列和载体序列等污染序 ...

最新文章

  1. 领克汽车是用鸿蒙系统吗,领克全新旗舰SUV将在上海车展首发亮相
  2. 生成Yolox检测负样本-对应空文件夹txt、批量文件重命名、批量转化三通道去除小图
  3. textarea 固定大小,滚动条,限制拖动,文字对齐
  4. tomcat:there is no resources that can be added or removed from server
  5. 测试点错的来:1024 科学计数法 (20分)
  6. 互联网java常用框架_来,带你鸟瞰 Java 中4款常用的并发框架!
  7. Android之All children of ConstraintLayout must have ids to use ConstraintSet
  8. 历史上的今天:让我们一起缅怀菲尔兹
  9. react同步请求_React中setState同步更新策略
  10. [示例] 使用 TStopwatch 计时
  11. Problem C: 默认参数:求圆面积
  12. 深度学习2.0-27.动量与学习率衰减
  13. 9月第1周文学类网站/频道:新浪文学超起点居首
  14. C# 获取硬盘序列号
  15. 微信公众号迁移保持OPENID不变新老账户粉丝迁移问题
  16. 云电脑服务:技术与商业模式双重创新
  17. 中级微观经济学:Chap 32 交换
  18. 为什么Hashtab的大小通常取远离2^n 的素数
  19. 前端应该知晓的PWA
  20. CentOs 7切换图形界面

热门文章

  1. 自学Vue开发Dapp去中心化钱包(三)
  2. 功率放大器模块是什么意思(功率放大模块工作原理)
  3. win7系统一开机就显示用户名和密码错误故障的解决方法
  4. 神都阻止不了阿里巴巴,竟然入股了中国互联网的半壁江山!
  5. 【解决方法】Latex使用eps格式图片报错
  6. DTCC2017| 我有故事,你约吗?
  7. JAVA GC - STW
  8. Java版智慧社区商业级别项目(附源码)
  9. mooplab2021数据建模大赛(桂林银行杯)
  10. 学生认证申请专业版的JetBrains系列产品