FASTQ 格式说明
FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。
目前几乎是高通量测序数据的标准格式。
FASTQ格式每四行描述一条测序序列信息:
第一行由'@'开始,后面跟着序列的ID信息,这点跟FASTA格式是一样的。
第二行是序列。
第三行由'+'开始,后面也可以跟着序列的描述信息。
第四行是第二行测序序列的质量评价,字符数跟第二行的序列是相等的,一一对应。
注:序列的ID信息,是这条序列的唯一标识,包含信息如下:
例1:@HWUSI-EAS100R:6:73:941:1973#0/1
HWUSI-EAS100R | the unique instrument name |
---|---|
6 | flowcell lane |
73 | tile number within the flowcell lane |
941 | 'x'-coordinate of the cluster within the tile |
1973 | 'y'-coordinate of the cluster within the tile |
#0 | index number for a multiplexed sample (0 for no indexing) |
/1 | the member of a pair, /1 or /2 (paired-end or mate-pair reads only) |
例2:@EAS139:136:FC706VJ:2:2104:15343:197393 1:Y:18:ATCACG
EAS139 | the unique instrument name |
---|---|
136 | the run id |
FC706VJ | the flowcell id |
2 | flowcell lane |
2104 | tile number within the flowcell lane |
15343 | 'x'-coordinate of the cluster within the tile |
197393 | 'y'-coordinate of the cluster within the tile |
1 | the member of a pair, 1 or 2 (paired-end or mate-pair reads only) |
Y | Y if the read fails filter (read is bad), N otherwise |
18 | 0 when none of the control bits are on, otherwise it is an even number |
ATCACG | index sequence |
FASTQ 格式说明相关推荐
- fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html
其次完成生物信息学数据格式的习题(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集这些格式的说明书. fasta和fastq格式文件的shell小练习 http ...
- linux怎么查看fastq格式文件,2020-01-11 了解FASTQ格式并处理FASTQ文件
FASTQ文件格式是测序仪展示数据的标准格式,可以看成FASTA文件的变种(FASTA+Q),因为其包含了对序列中每个碱基的Qualify Measurement.(如:碱基A出错的可能性是1/100 ...
- RNA-seq流程学习笔记(4)-使用FastQC软件对fastq格式的数据进行质量控制
今天开始学习使用FastQC软件对范例SRA测序文件的质量进行分析. 主要参考文章: RNA-seq(3):sra到fastq格式转换并进行质量控制 转录组入门(3):了解fastq测序数据 用Fas ...
- linux怎么查看fastq格式文件,fastq格式文件处理大全(一)
从计算机的角度来说,生物的序列属于一种字符串,也是一种文本,因此生物信息分析属于文本处理范畴.文本存储为固定格式文件,生物信息的工作就是各种文本文件之间格式的转换,例如通过序列拼接将fastq转换为f ...
- SRA到fastq格式的批量转换
生物信息分析人员一般会接触到从NCBI等网站下载的SRA数据,之前也介绍了下载SRA数据的几种方式.下面,我就简单介绍一下如何将下载的sra格式数据转换成为常用的fastq等格式. 1.fastq-d ...
- 关于illumina产生的测序源文件bcl转换成fastq格式的问题
由于连接测序仪的服务器不知道哪里抽了风,无法直接的生成fastq格式的文件,好久都无解,经过一段时间仍无法解决,所以采用曲线救国的方法,看能不能利用三方软件将bcl转换成fastq文件 google以 ...
- fq,fa,fna,ffn,faa都是什么鬼,与fasta,fastq格式有什么关系?终于1分钟搞懂了
fasta与fastq的区别: fasta格式(格式缩写为fa)是一种存储核酸或氨基酸序列的文本格式 ,允许在序列前定义名称和编写注释. 已成为生物信息学的标准格式,格式简单,多种文本处理工具和 Py ...
- NGS基础---Fasta/Fastq格式记录
Fasta/Fastq格式记录 时间:2020-10-21 生信中,常用到Fasta和Fastq格式,这两种是比较基础和常见的序列保存文件.通过wiki和网上资料,对这两种格式进行说明和记录. 1. ...
- **生信自学记录1——获取Fastq格式的反向互补序列**
` 生信自学记录1--获取Fastq格式的反向互补序列 总共分为三步 1.读取基因序列的str格式,返回反向互补序列str 2.打开fastq格式的文本提取基因序列,返回互补序列list 3.读取互补 ...
- FASTA 与 FASTQ格式详解
FASTA 1.FASTA存储什么? fasta存储核酸序列(DNA/RNA),也存储蛋白质的核苷酸序列(Animo Acid sequence,简称AA序列) 2.FASTA包含什么内容? 第一行: ...
最新文章
- PHP框架中的日志系统
- OEM/ODM指的是什么?
- python 去除多个换行
- Kaggle债务违约预测冠军经验分享
- Azkaban任务调度(使用带有依赖的任务调度)【mapreduce数据清洗,数据入hive库,kylin预编译、数据分析】
- Centos7 单台服务器搭建Elasticsearch6.0.1集群
- Linux下的进程相关编程
- wingIDE右侧文件列表移动到左侧
- 完整的MIME类型列表
- Spring 3.1,Cloud Foundry和本地开发
- java学到哪里最容易蒙,蒙哥比vs蒙克(目前最好的哪个)
- 【kafka】kafka 查看 topic 详情的 几种 方法
- AI 算法在 FPGA 芯片上还有这种操作?
- 数据可视化(5)--jqplot经典实例
- Go by Example练习
- 免费又稳定的短链接生成工具
- 轻量级的无线抓包(microsoft network monitor)
- UNIX 环境高级编程读书笔记(1)
- linux中cp: omitting directory `XXX' 问题解决
- 【网络安全】IP地址、子网掩码、网关、DNS、DHCP概述(自学,随时补充)