在生物信息学中,FASTA格式是一种用于记录核酸序列或肽序列的文本格式,其中的核酸或氨基酸均以单个字母编码呈现。该格式同时还允许在序列之前定义名称和编写注释。这一格式最初由FASTA软件包定义,但现今已是生物信息学领域的一项标准。FASTA格式也是是BLAST组织数据的基本格式,无论是数据库还是查询序列,大多数情况都使用FASTA格式。

FASTA简明的格式降低了序列操纵和分析的难度,令序列可被文本处理工具和诸如Python、Ruby和Perl等脚本语言处理。

例如:
>ADAM_0007
AAFRGCWTKNYSPKPCL

可见,FASTA主要分成2个部分:
1.第一行是由大于号">“或分号”;“打头的任意文字说明(习惯常用”>"作为起始),用于序列标记。
2.从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号。通常核苷酸符号大小写均可,而氨基酸常用大写字母。使用时应注意有些程序对大小写有明确要求。文件每行的字母一般不应超过80个字符。

综上所述,
FASTA格式是一种很简单的文本格式,只要符合上面标准的文本文件都可以称为FASTA格式文件,但是为了和普通的.txt文本文件区分开来,FASTA文件的后缀名一般为.fa 。除此之外还有multi-FASTA格式,是FASTA格式的拓展,道理其实是一样的。

.fasta文件的相关处理相关推荐

  1. python文本提取序列信息_从fasta文件中通过头中的ID号提取序列

    accessionids.txt是否只包含四位数代码?在 如果是,请将accessorID更改为:accessorID = accessorIDWithArrow[1:5] 一些方法可以让这更像Pyt ...

  2. C#,生信软件实践(01)——DNA序列数据库FASTA文件合并工具的源代码

    1 生物信息学简介 生物信息学(BioInformatics)是研究生物信息的采集.处理.存储.传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的 ...

  3. java 加载dll后打包_让Jacob从当前路径读取dll文件及相关打包方法

    让Jacob从当前路径读取dll文件及相关打包方法 独立观察员2013.08.12 Jacob  LibraryLoader.class修改版代码 功能:让jacob可在当前路径下的dll文件夹内读取 ...

  4. linux重命名tar命令,linux常用操作指令4 —— 文件操作相关命令(mkdir、touch、rm、mv、cp、cat 、 find 、tar、chmod)...

    文件操作相关命令 文件操作相关命令 1.创建文件夹mkdir 2.创建文件touch 3.移动文件夹mv(类似于剪切) 4.删除rm 5.重命名mv 6.复制cp 7.查看文件(cat.head.ta ...

  5. ASP.NET跨服务器上传文件的相关解决方案

    ASP.NET跨服务器上传文件的相关解决方案 参考文章: (1)ASP.NET跨服务器上传文件的相关解决方案 (2)https://www.cnblogs.com/zuowj/p/3999798.ht ...

  6. 【Android 安全】DEX 加密 ( Java 工具开发 | 解压 apk 文件 | 加密生成 dex 文件 | 打包未签名 apk 文件 | 文件解压缩相关代码 )

    文章目录 一.解压 apk 文件 二.加密生成 dex 文件 三.打包未签名 apk 文件 四.完整代码示例 五.文件解压缩相关代码 六.执行结果 参考博客 : [Android 安全]DEX 加密 ...

  7. C语言文件读写(5)-文件位置相关

    C语言文件读写(5)-文件位置相关 当打开一个文件以后,无论是读还是写,都有一个指示文件位置的这么一个东西,我们可以称之为文件的位置指示器或者文件位置指针,文件位置指示器指明了当前文件读或者写的位置信 ...

  8. Linux C: 文件操作相关的系统调用

    一.常见的文件操作相关的系统调用 普通权限的系统调用 函数 说明 int access(char *pathname,int mode) 检查对某个文件的权限 int chdir(const char ...

  9. fasta文件中DNA to RNA

    同样的名为read_1.fa 的fasta文件,里面有若干序列,如: >@r1 TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAA ...

最新文章

  1. 损失函数的可视化:浅论模型的参数空间与正则
  2. 第10章 指针(五) 使用地址-------指针的引用
  3. Xamarin XAML语言教程基本页面ContentPage占用面积(二)
  4. php cros跨域处理,php接口设置cors实现ajax跨域
  5. java高并发(十九)死锁、spring线程安全
  6. springmvc配置同时支持html和jspl两种格式的页面
  7. 孙鑫MFC笔记之十四--多线程同步与异步套接字编程
  8. linux之用openssl命令Base64编码解码、md5/sha1摘要、AES/DES3加密解密
  9. unsafehelper java_Java 9中将移除 Sun.misc.Unsafe
  10. 【牛客 - 369C】小A与欧拉路(bfs树的直径)
  11. java 基本类型 引用类型_Java中的基本类型和引用类型变量的区别
  12. IDEA 调试部署 Web-INF/classes下面不生成class文件
  13. NSOperation队列实实现多线程
  14. ASP.NET通过OLE DB操作Excel
  15. STL的Deque介绍
  16. 常用的正则表达式,妈妈再也不用担心我不会写正则表达式了
  17. 计算机网络传输介质中速率最快的是,通常传输速率最快的网络类型是()
  18. 手机摄像头的组成结构和工作原理
  19. 如何找到好书?有什么技巧或建议?
  20. 微信小程序实现智能识别名片

热门文章

  1. Unity 入门教程:贪吃射(1) —— Unity 安装和项目创建
  2. 【转】胡侃学习(理论)计算机
  3. 正在解析主机 失败:未知的名称或服务。 wget: 无法解析主机地址
  4. java对pdf分割_PDFBox分割PDF文档
  5. C++:符合RFC1321规范的MD5计算C++实现
  6. 微信小程序绘制canvas图片
  7. 给你讲个滑稽的故事:
  8. vb里的lbound和ubound的用法
  9. 技嘉服务器准系统epyc,技嘉为AMD霄龙处理器推出ATX主板 针对AMD EPYC
  10. linux网卡连接失败设备无法激活