FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。

目前几乎是高通量测序数据的标准格式。

FASTQ格式每四行描述一条测序序列信息:

第一行由'@'开始,后面跟着序列的ID信息,这点跟FASTA格式是一样的。

第二行是序列。

第三行由'+'开始,后面也可以跟着序列的描述信息。

第四行是第二行测序序列的质量评价,字符数跟第二行的序列是相等的,一一对应。

注:序列的ID信息,是这条序列的唯一标识,包含信息如下:

例1:@HWUSI-EAS100R:6:73:941:1973#0/1

HWUSI-EAS100R the unique instrument name
6 flowcell lane
73 tile number within the flowcell lane
941 'x'-coordinate of the cluster within the tile
1973 'y'-coordinate of the cluster within the tile
#0 index number for a multiplexed sample (0 for no indexing)
/1 the member of a pair, /1 or /2 (paired-end or mate-pair reads only)

例2:@EAS139:136:FC706VJ:2:2104:15343:197393 1:Y:18:ATCACG

EAS139 the unique instrument name
136 the run id
FC706VJ the flowcell id
2 flowcell lane
2104 tile number within the flowcell lane
15343 'x'-coordinate of the cluster within the tile
197393 'y'-coordinate of the cluster within the tile
1 the member of a pair, 1 or 2 (paired-end or mate-pair reads only)
Y Y if the read fails filter (read is bad), N otherwise
18 0 when none of the control bits are on, otherwise it is an even number
ATCACG index sequence

FASTQ 格式说明相关推荐

  1. fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html

    其次完成生物信息学数据格式的习题(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集这些格式的说明书. fasta和fastq格式文件的shell小练习 http ...

  2. linux怎么查看fastq格式文件,2020-01-11 了解FASTQ格式并处理FASTQ文件

    FASTQ文件格式是测序仪展示数据的标准格式,可以看成FASTA文件的变种(FASTA+Q),因为其包含了对序列中每个碱基的Qualify Measurement.(如:碱基A出错的可能性是1/100 ...

  3. RNA-seq流程学习笔记(4)-使用FastQC软件对fastq格式的数据进行质量控制

    今天开始学习使用FastQC软件对范例SRA测序文件的质量进行分析. 主要参考文章: RNA-seq(3):sra到fastq格式转换并进行质量控制 转录组入门(3):了解fastq测序数据 用Fas ...

  4. linux怎么查看fastq格式文件,fastq格式文件处理大全(一)

    从计算机的角度来说,生物的序列属于一种字符串,也是一种文本,因此生物信息分析属于文本处理范畴.文本存储为固定格式文件,生物信息的工作就是各种文本文件之间格式的转换,例如通过序列拼接将fastq转换为f ...

  5. SRA到fastq格式的批量转换

    生物信息分析人员一般会接触到从NCBI等网站下载的SRA数据,之前也介绍了下载SRA数据的几种方式.下面,我就简单介绍一下如何将下载的sra格式数据转换成为常用的fastq等格式. 1.fastq-d ...

  6. 关于illumina产生的测序源文件bcl转换成fastq格式的问题

    由于连接测序仪的服务器不知道哪里抽了风,无法直接的生成fastq格式的文件,好久都无解,经过一段时间仍无法解决,所以采用曲线救国的方法,看能不能利用三方软件将bcl转换成fastq文件 google以 ...

  7. fq,fa,fna,ffn,faa都是什么鬼,与fasta,fastq格式有什么关系?终于1分钟搞懂了

    fasta与fastq的区别: fasta格式(格式缩写为fa)是一种存储核酸或氨基酸序列的文本格式 ,允许在序列前定义名称和编写注释. 已成为生物信息学的标准格式,格式简单,多种文本处理工具和 Py ...

  8. NGS基础---Fasta/Fastq格式记录

    Fasta/Fastq格式记录 时间:2020-10-21 生信中,常用到Fasta和Fastq格式,这两种是比较基础和常见的序列保存文件.通过wiki和网上资料,对这两种格式进行说明和记录. 1. ...

  9. **生信自学记录1——获取Fastq格式的反向互补序列**

    ` 生信自学记录1--获取Fastq格式的反向互补序列 总共分为三步 1.读取基因序列的str格式,返回反向互补序列str 2.打开fastq格式的文本提取基因序列,返回互补序列list 3.读取互补 ...

  10. FASTA 与 FASTQ格式详解

    FASTA 1.FASTA存储什么? fasta存储核酸序列(DNA/RNA),也存储蛋白质的核苷酸序列(Animo Acid sequence,简称AA序列) 2.FASTA包含什么内容? 第一行: ...

最新文章

  1. PHP框架中的日志系统
  2. OEM/ODM指的是什么?
  3. python 去除多个换行
  4. Kaggle债务违约预测冠军经验分享
  5. Azkaban任务调度(使用带有依赖的任务调度)【mapreduce数据清洗,数据入hive库,kylin预编译、数据分析】
  6. Centos7 单台服务器搭建Elasticsearch6.0.1集群
  7. Linux下的进程相关编程
  8. wingIDE右侧文件列表移动到左侧
  9. 完整的MIME类型列表
  10. Spring 3.1,Cloud Foundry和本地开发
  11. java学到哪里最容易蒙,蒙哥比vs蒙克(目前最好的哪个)
  12. 【kafka】kafka 查看 topic 详情的 几种 方法
  13. AI 算法在 FPGA 芯片上还有这种操作?
  14. 数据可视化(5)--jqplot经典实例
  15. Go by Example练习
  16. 免费又稳定的短链接生成工具
  17. 轻量级的无线抓包(microsoft network monitor)
  18. UNIX 环境高级编程读书笔记(1)
  19. linux中cp: omitting directory `XXX' 问题解决
  20. 【网络安全】IP地址、子网掩码、网关、DNS、DHCP概述(自学,随时补充)

热门文章

  1. 【云原生|K8s系列第5篇】:实战使用Service暴露应用
  2. Hash算法进行签名验签
  3. Free Launch Bar
  4. 商业智能BI财务分析,如何从财务指标定位到业务问题
  5. 2019阿里巴巴Android实习生面经
  6. ANT 下载,ant的配法 整理
  7. AWE /3GB 内存扩展技术
  8. 如何快速获取设备ip地址
  9. 不同时区时间换算_不同时区时间转换
  10. 如何提高关键词的质量度?