.fasta文件的相关处理
在生物信息学中,FASTA格式是一种用于记录核酸序列或肽序列的文本格式,其中的核酸或氨基酸均以单个字母编码呈现。该格式同时还允许在序列之前定义名称和编写注释。这一格式最初由FASTA软件包定义,但现今已是生物信息学领域的一项标准。FASTA格式也是是BLAST组织数据的基本格式,无论是数据库还是查询序列,大多数情况都使用FASTA格式。
FASTA简明的格式降低了序列操纵和分析的难度,令序列可被文本处理工具和诸如Python、Ruby和Perl等脚本语言处理。
例如:
>ADAM_0007
AAFRGCWTKNYSPKPCL
可见,FASTA主要分成2个部分:
1.第一行是由大于号">“或分号”;“打头的任意文字说明(习惯常用”>"作为起始),用于序列标记。
2.从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号。通常核苷酸符号大小写均可,而氨基酸常用大写字母。使用时应注意有些程序对大小写有明确要求。文件每行的字母一般不应超过80个字符。
综上所述,
FASTA格式是一种很简单的文本格式,只要符合上面标准的文本文件都可以称为FASTA格式文件,但是为了和普通的.txt文本文件区分开来,FASTA文件的后缀名一般为.fa 。除此之外还有multi-FASTA格式,是FASTA格式的拓展,道理其实是一样的。
.fasta文件的相关处理相关推荐
- python文本提取序列信息_从fasta文件中通过头中的ID号提取序列
accessionids.txt是否只包含四位数代码?在 如果是,请将accessorID更改为:accessorID = accessorIDWithArrow[1:5] 一些方法可以让这更像Pyt ...
- C#,生信软件实践(01)——DNA序列数据库FASTA文件合并工具的源代码
1 生物信息学简介 生物信息学(BioInformatics)是研究生物信息的采集.处理.存储.传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的 ...
- java 加载dll后打包_让Jacob从当前路径读取dll文件及相关打包方法
让Jacob从当前路径读取dll文件及相关打包方法 独立观察员2013.08.12 Jacob LibraryLoader.class修改版代码 功能:让jacob可在当前路径下的dll文件夹内读取 ...
- linux重命名tar命令,linux常用操作指令4 —— 文件操作相关命令(mkdir、touch、rm、mv、cp、cat 、 find 、tar、chmod)...
文件操作相关命令 文件操作相关命令 1.创建文件夹mkdir 2.创建文件touch 3.移动文件夹mv(类似于剪切) 4.删除rm 5.重命名mv 6.复制cp 7.查看文件(cat.head.ta ...
- ASP.NET跨服务器上传文件的相关解决方案
ASP.NET跨服务器上传文件的相关解决方案 参考文章: (1)ASP.NET跨服务器上传文件的相关解决方案 (2)https://www.cnblogs.com/zuowj/p/3999798.ht ...
- 【Android 安全】DEX 加密 ( Java 工具开发 | 解压 apk 文件 | 加密生成 dex 文件 | 打包未签名 apk 文件 | 文件解压缩相关代码 )
文章目录 一.解压 apk 文件 二.加密生成 dex 文件 三.打包未签名 apk 文件 四.完整代码示例 五.文件解压缩相关代码 六.执行结果 参考博客 : [Android 安全]DEX 加密 ...
- C语言文件读写(5)-文件位置相关
C语言文件读写(5)-文件位置相关 当打开一个文件以后,无论是读还是写,都有一个指示文件位置的这么一个东西,我们可以称之为文件的位置指示器或者文件位置指针,文件位置指示器指明了当前文件读或者写的位置信 ...
- Linux C: 文件操作相关的系统调用
一.常见的文件操作相关的系统调用 普通权限的系统调用 函数 说明 int access(char *pathname,int mode) 检查对某个文件的权限 int chdir(const char ...
- fasta文件中DNA to RNA
同样的名为read_1.fa 的fasta文件,里面有若干序列,如: >@r1 TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAA ...
最新文章
- 损失函数的可视化:浅论模型的参数空间与正则
- 第10章 指针(五) 使用地址-------指针的引用
- Xamarin XAML语言教程基本页面ContentPage占用面积(二)
- php cros跨域处理,php接口设置cors实现ajax跨域
- java高并发(十九)死锁、spring线程安全
- springmvc配置同时支持html和jspl两种格式的页面
- 孙鑫MFC笔记之十四--多线程同步与异步套接字编程
- linux之用openssl命令Base64编码解码、md5/sha1摘要、AES/DES3加密解密
- unsafehelper java_Java 9中将移除 Sun.misc.Unsafe
- 【牛客 - 369C】小A与欧拉路(bfs树的直径)
- java 基本类型 引用类型_Java中的基本类型和引用类型变量的区别
- IDEA 调试部署 Web-INF/classes下面不生成class文件
- NSOperation队列实实现多线程
- ASP.NET通过OLE DB操作Excel
- STL的Deque介绍
- 常用的正则表达式,妈妈再也不用担心我不会写正则表达式了
- 计算机网络传输介质中速率最快的是,通常传输速率最快的网络类型是()
- 手机摄像头的组成结构和工作原理
- 如何找到好书?有什么技巧或建议?
- 微信小程序实现智能识别名片
热门文章
- Unity 入门教程:贪吃射(1) —— Unity 安装和项目创建
- 【转】胡侃学习(理论)计算机
- 正在解析主机 失败:未知的名称或服务。 wget: 无法解析主机地址
- java对pdf分割_PDFBox分割PDF文档
- C++:符合RFC1321规范的MD5计算C++实现
- 微信小程序绘制canvas图片
- 给你讲个滑稽的故事:
- vb里的lbound和ubound的用法
- 技嘉服务器准系统epyc,技嘉为AMD霄龙处理器推出ATX主板 针对AMD EPYC
- linux网卡连接失败设备无法激活