文章目录

  • 格式说明
  • 实例演练
    • 判断fastq序列编码是Phred33(Illumina1.8+) or Phred64(Illumina1.3+)
    • fastq转换fasta格式
    • Linux 操作fastq
      • 获取数据
      • 统计reads_1.fq文件中共有多少条序列信息
      • 输出reads_1.fq文件中的标识符(即以@开头的那一行)
      • 输出reads_1.fq文件中所有序列的信息(即每个序列的第二行)
      • 输出reads_1.fq文件中‘+’及其后面的描述信息(即每个序列的第三行)
      • 输出reads_1.fq文件中质量值信息(即每个序列的第四行)
      • 计算reads_1.fq文件含有N碱基的reads个数
      • 计算reads_1.fq文件里面的序列碱基总数
      • 计算reads_1.fq文件中所有reads的N碱基总数
      • 计算reads_1.fq中测序碱基质量值恰好为Q20的个数
      • 计算reads_1.fq中测序碱基质量值恰好为Q30的个数
      • 计算reads_1.fq中所以序列的第一位碱基的ATCGNactg分布情况
      • 将reads_1.fq转为reads_1.fa文件(即将fastq转化为fasta)
      • 统计上述reads_1.fa文件中共有多少条序列
      • 计算reads_1.fa文件中总的碱基序列的GC数量
      • 删除reads_1.fa文件中每条序列的N碱基
      • 删除reads_1.fa文件中含有N碱基的序列
      • 删除reads_1.fa文件中短于65bp的碱基序列
      • 删除reads_1.fa文件每条序列的前后五个碱基
      • 删除reads_1.fa文件中的长于125bp的序列
      • 查看reads_1.fq中每条序列的第一位碱基的质量值的平均值

格式说明

FASTQ文件中每个序列通常有四行:

1.第一行:必须以“@”开头,后面跟着唯一的序列ID标识符,然后跟着可选的序列描述内容,标识符与描述内容用空格分开;

2.第二行:序列字符(核酸为[AGCTN]+,蛋白为氨基酸字符);

3.第三行:必须以“+”开头,后面跟着可选的ID标识符和可选的描述内容,如果“+”后面有内容,该内容必须与第一行“@”后的内容相同;

4.第四行:碱基质量字符,每个字符对应第二行相应位置碱基或氨基酸的质量,该字符可以按一定规则转换为碱基质量得分,碱基质量得分可以反映该碱基的错误率。这一行的字符数与第二行中的字符数必须相同。

查看fatsq文件

!cat ./data/test1.fq
@HWI-ST1223:80:D1FMTACXX:2:1101:1243:2213 1:N:0:AGTCAA
TCTGTGTAGCCNTGGCTGTCCTGGAACTCACTTTGTAGACCAGGCTGGCATGCACCACCACNNNCGGCTCATTTGTCTTTNNTTTTTGTTTTGTTCTGTA
+
BCCFFFFFFHH#4AFHIJJJJJJJJJJJJJJJJJIJIJJJJJGHIJJJJJJJJJJJJJIIJ###--5ABECFFDDEEEEE##,5=@B8?CDD<AD>C:@>
@HWI-ST1223:80:D1FMTACXX:2:1101:1375:2060 1:N:0:AGTCAA
NTGCTGAGCCACGACAAGGATCCCAGAGGGCCNAGCCCTGCATCTTGTATGGACCAGTTACNCATCAAAAGAGACTACTGTAGGCACCATCAATCAGATC
+
#1:DDDD;?CFFHDFEEIGIIIIIIG;DHFGG#)0?BFBDHBFF<FCFEFD;@DD@A=7?E#,,,;=(>3;=;;C>ACCC@CCCCCBBBCCAACCCCCCC
@HWI-ST1223:80:D1FMTACXX:2:1101:1383:2091 1:N:0:AGTCAA
NGTTCGTGTGGAACCTGGCGCTAAACCATTCGTAGACGACCTGCTTCTGGGTCGGGGTTTCGTACGTAGCAGAGCAGCTCCCTCGCTGCGATCTATTGAA
+
#1=DDFDFHHHHHJGJJJJJJJJJJJJJJJIJIGDHIHIGIJJJJJJJIIIGHHFDD3>BDDBDDDDDDDDDDBDCCBDDDDDDDDDDDBBDDDDEEACD
@HWI-ST1223:80:D1FMTACXX:2:1101:1452:2138 1:N:0:AGTCAA
NTCTAGGAGGTCTAGAAAGCCCAGGCCACCGGTACAAACATCAAGGGTGTTACGGATGTGCCGCTCTGAACCTCCAGGACGACTTTGATTTCAACTACAA
+
#4=DFFEFHHHHHJJJJJIJJJJHIIJGJJJJ@GIIJJJJJJIJJJJFGHIIIJJHHHDFFFFDDDDDDDDDDDDCDDDDDDDDDDDCCCEDEDDDDDDD

每个碱基的质量值与错误率之间的关系:

Q=−10log10PQ = -10 log_{10}P Q=−10log10​P

其中P代表该碱基被测序错误的概率,如果该碱基测序出错的概率为0.001,则Q应该为30,那么30+33=63,那么63对应的ASCii码为“?”,则在第四行中该碱基对应的质量代表值即为“?”

print(ord("?"))
63

一般地,碱基质量从0-40,既ASCii码为从 “!”(0+33)到“I”(40+33)。以上是sanger中心采用记录read测序质量的方法

对于每个碱基的质量编码标示,不同的软件采用不同的方案,目前有5种方案:

  • Sanger,Phred quality score,值的范围从0到92,对应的ASCII码从33到126,但是对于测序数据(raw read data)质量得分通常小于60,序列拼接或者mapping可能用到更大的分数。

  • Solexa/Illumina 1.0, Solexa/Illumina quality score,值的范围从-5到63,对应的ASCII码从59到126,对于测序数据,得分一般在-5到40之间;

  • Illumina 1.3+,Phred quality score,值的范围从0到62对应的ASCII码从64到126,低于测序数据,得分在0到40之间;

  • Illumina 1.5+,Phred quality score,但是0到2作为另外的标示,详见http://solexaqa.sourceforge.net/questions.htm#illumina

  • Illumina 1.8+

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6lozhwm1-1583370774136)()]

ASCII值小于等于58(相应的质量得分小于等于25)对应的字符只有在Phred+33的编码中被使用,所有Phred+64所使用的字符的ASCII值都大于等于59。在通常情况下,ASCII值大于等于74的字符只出现在Phred+64中。利用这些信息即可在程序中进行判断

实例演练

判断fastq序列编码是Phred33(Illumina1.8+) or Phred64(Illumina1.3+)

def fq_phred_check(inputfile): """判断fastq序列编码"""fastq_file = open(inputfile,'r',encoding='utf-8') count = 1 for line in fastq_file: line_strip = line.strip() if count % 4 == 0: for each in line_strip: ASCII_each = ord(each) if ASCII_each > 75: phred_value = 64breakelif ASCII_each < 58:phred_value = 33break      count += 1 fastq_file.close()  return phred_valueinputfile = './data/test1.fq'
phred_value = fq_phred_check(inputfile)
print(phred_value)
33

fastq转换fasta格式

def fastq_fasta(inputfile): """将fastq转换成fasta序列格式""" fastq_file = open(inputfile,'r',encoding='utf-8') out_file_name = inputfile.strip().split('/')[-1].split('.')[0] + '.fasta' output_fasta = open(out_file_name,'w',encoding='utf-8') i = 0 for line in fastq_file: if i % 4 == 0: line_new = line.strip().split('\n')[0].replace('@','>') output_fasta.write(line_new + '\n') elif (i - 1) % 4 == 0: output_fasta.write(line)i = i + 1 print("fastq transform fasta success", out_file_name)fastq_file.close() output_fasta.close() def main(): inputfile = './data/test1.fq' fastq_fasta(inputfile) if __name__ == '__main__': main()
fastq transform fasta success test1.fasta

Linux 操作fastq

获取数据

mkdir -p ~/biosoft
cd ~/biosoft
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3/bowtie2-2.3.4.3-linux-x86_64.zipunzip bowtie2-2.3.4.3-linux-x86_64.zip
cd ~/biosoft/bowtie2-2.3.4.3-linux-x86_64/example/reads

统计reads_1.fq文件中共有多少条序列信息

[sunchengquan 08:07:20 ~/local/app/bowtie2-2.2.4/example/reads]
$ ll
总用量 8.4M
-rwxrwx--- 1 sunchengquan sunchengquan 4.0M 10月 23 2014 longreads.fq
-rwxrwx--- 1 sunchengquan sunchengquan 2.2M 10月 23 2014 reads_1.fq
-rwxrwx--- 1 sunchengquan sunchengquan 2.2M 10月 23 2014 reads_2.fq
-rwxrwx--- 1 sunchengquan sunchengquan 9.1K 10月 23 2014 simulate.pl
[sunchengquan 08:07:27 ~/local/app/bowtie2-2.2.4/example/reads]
$ wc reads_1.fq40000   40000 2285692 reads_1.fq
[sunchengquan 08:07:42 ~/local/app/bowtie2-2.2.4/example/reads]
$ wc -l reads_1.fq
40000 reads_1.fq[sunchengquan 09:06:02 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo $[`wc -l reads_1.fq |cut -d' ' -f1`/4]
10000
[sunchengquan 09:06:52 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo $((`wc -l reads_1.fq |cut -d' ' -f1`/4))
10000
[sunchengquan 09:07:10 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo $(expr `wc -l reads_1.fq |cut -d' ' -f1`/4)
40000/4
[sunchengquan 09:07:35 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo $(expr `wc -l reads_1.fq |cut -d' ' -f1` / 4)
10000
[sunchengquan 09:12:17 ~/local/app/bowtie2-2.2.4/example/reads]
$ let c=`wc -l reads_1.fq |cut -d' ' -f1`/4
[sunchengquan 09:12:36 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo $c
10000
[sunchengquan 09:16:11 ~/local/app/bowtie2-2.2.4/example/reads]
$ a=`wc -l reads_1.fq |cut -d' ' -f1`
[sunchengquan 09:16:23 ~/local/app/bowtie2-2.2.4/example/reads]
$ b=4
[sunchengquan 09:16:27 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo `expr $a / $b`
10000
[sunchengquan 09:18:03 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo `expr $a / 4`
10000

输出reads_1.fq文件中的标识符(即以@开头的那一行)

[sunchengquan 09:18:22 ~/local/app/bowtie2-2.2.4/example/reads]
$ grep '^@' reads_1.fq |head -3
@r1
@r2
@r3[sunchengquan 09:21:59 ~/local/app/bowtie2-2.2.4/example/reads]
$ grep '^@' reads_1.fq |cut -f1 |cut -c1|head -3
@
@
@[sunchengquan 09:22:38 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fq |paste - - - - |wc10000   40000 2285692
[sunchengquan 09:21:51 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fq |paste - - - - |cut -f1|cut -c1|head -3
@
@
@[sunchengquan 09:27:19 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==1) {print $0}}' reads_1.fq|head -3
@r1
@r2
@r3[sunchengquan 09:28:47 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==1) print $0}' reads_1.fq|head -3
@r1
@r2
@r3
[sunchengquan 09:31:38 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==1){print}}' reads_1.fq|head -3
@r1
@r2
@r3
[sunchengquan 09:32:28 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{print NR}' reads_1.fq|head -3
1
2
3

输出reads_1.fq文件中所有序列的信息(即每个序列的第二行)

[sunchengquan 09:34:51 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print $0 }}' reads_1.fq|head -1
TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAAACNGTACGCTGAGGGCAGAAAAAATCGTCGGGGACATTNTAAAGGCGGCGAGCGCGGCTTTTCCG

输出reads_1.fq文件中‘+’及其后面的描述信息(即每个序列的第三行)

[sunchengquan 09:35:06 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==3){print $0 }}' reads_1.fq|head -3
+
+
+

输出reads_1.fq文件中质量值信息(即每个序列的第四行)

[sunchengquan 09:36:24 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==0){print $0 }}' reads_1.fq|head -1
+"@6<:27(F&5)9)"B:%B+A-%5A?2$HCB0B+0=D<7E/<.03#!.F77@6B==?C"7>;))%;,3-$.A06+<-1/@@?,26">=?*@'0;$:;??G+:#+(A?9+10!8!?()?7C>

计算reads_1.fq文件含有N碱基的reads个数

[sunchengquan 09:39:13 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print $0 }}' reads_1.fq|grep N|wc6429    6429  782897[sunchengquan 09:41:03 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print $0 }}' reads_1.fq|grep -c N
6429

计算reads_1.fq文件里面的序列碱基总数

[sunchengquan 12:46:57 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print}}' reads_1.fq |grep -o '[ATGCN]' |wc
1088399 1088399 2176798[sunchengquan 12:47:12 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print length}}' reads_1.fq |head -1
122
[sunchengquan 12:49:36 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print length($0)}}' reads_1.fq |head -1
122
[sunchengquan 12:58:27 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print length($0)}}' reads_1.fq |paste -s -d +|bc
1088399

计算reads_1.fq文件中所有reads的N碱基总数

[sunchengquan 12:58:50 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print}}' reads_1.fq |grep -o '[N]' |wc26001   26001   52002

计算reads_1.fq中测序碱基质量值恰好为Q20的个数

[sunchengquan 17:14:00 ~/local/app/bowtie2-2.2.4/example/reads]
$ python -c 'print (chr(33+20))'
5
[sunchengquan 17:15:32 ~/local/app/bowtie2-2.2.4/example/reads]
$ python -c 'print (chr(33+30))'
?[sunchengquan 17:15:43 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==0){print}}' reads_1.fq |grep -o '[5]'|wc -l
21369
[sunchengquan 17:17:18 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==0){print}}' reads_1.fq |grep -o '5'|wc -l
21369

计算reads_1.fq中测序碱基质量值恰好为Q30的个数

[sunchengquan 17:17:27 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==0){print}}' reads_1.fq |grep -o '?'|wc -l
21574

计算reads_1.fq中所以序列的第一位碱基的ATCGNactg分布情况

[sunchengquan 17:26:36 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==2){print}}' reads_1.fq |cut -c1|sort |uniq -c2184 A2203 C2219 G1141 N2253 T

将reads_1.fq转为reads_1.fa文件(即将fastq转化为fasta)

[sunchengquan 17:33:13 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==1){print ">"$0} else if(NR%4==2){print}}' reads_1.fq |head -2
>@r1
TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAAACNGTACGCTGAGGGCAGAAAAAATCGTCGGGGACATTNTAAAGGCGGCGAGCGCGGCTTTTCCG
[sunchengquan 17:45:57 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==1){print ">"substr($0,2)} else if(NR%4==2){print}}' reads_1.fq |head -2
>r1
TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAAACNGTACGCTGAGGGCAGAAAAAATCGTCGGGGACATTNTAAAGGCGGCGAGCGCGGCTTTTCCG[sunchengquan 17:46:36 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fq |paste - - - - |cut -f1,2|tr '\t' '\n'|head -2
@r1
TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAAACNGTACGCTGAGGGCAGAAAAAATCGTCGGGGACATTNTAAAGGCGGCGAGCGCGGCTTTTCCG
[sunchengquan 17:48:14 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fq |paste - - - - |cut -f1,2|tr '\t' '\n'|tr '@' '>'|head -2
>r1
TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAAACNGTACGCTGAGGGCAGAAAAAATCGTCGGGGACATTNTAAAGGCGGCGAGCGCGGCTTTTCCG

统计上述reads_1.fa文件中共有多少条序列

[sunchengquan 17:50:29 ~/local/app/bowtie2-2.2.4/example/reads]
$ echo $[`wc -l reads_1.fa |cut -d' ' -f1`/2]
10000

计算reads_1.fa文件中总的碱基序列的GC数量

[sunchengquan 18:02:31 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fa |paste - - |cut -f2|grep -o '[GCgc]' |wc -l
529983

删除reads_1.fa文件中每条序列的N碱基

[sunchengquan 18:04:46 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fa |tr -d "N" |grep N

删除reads_1.fa文件中含有N碱基的序列

[sunchengquan 18:09:32 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fa |paste - - |grep -v N|tr '\t' '\n'|less

删除reads_1.fa文件中短于65bp的碱基序列

[sunchengquan 18:18:44 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fa |paste - - |awk '{if(length($2)>=65){print $1"\n"$2}}'|tail -2
>r9999
TATCGCGCTGTGACGATGCTAATCCCAAACCTTACCCAACCCACCTGGTCACGGACTGTTAAGCCGCTGTATGACGCTCTGGTGGTGCAATGCCACAAAGAANAGTCAATC

删除reads_1.fa文件每条序列的前后五个碱基

echo "AGJKLOIUYTKIOFYTFFLHHJWERDFCVBNM" |awk '{print substr($0,6,length($0)-10)}'
OIUYTKIOFYTFFLHHJWERDF[sunchengquan 18:28:20 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%2==0){print substr($0,6,length($0)-10)}}' reads_1.fa|head -1
GCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAAACNGTACGCTGAGGGCAGAAAAAATCGTCGGGGACATTNTAAAGGCGGCGAGCGCGGCTT

删除reads_1.fa文件中的长于125bp的序列

[sunchengquan 18:28:57 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat reads_1.fa |paste - - |awk '{if(length($2)<=125){print $1"\n"$2}}'|tail -2
>r10000
GGTGATGCGCGGCTCCGTGCCGCCAAAGCCGTCCGGCACTGACTNGTCGCAG

查看reads_1.fq中每条序列的第一位碱基的质量值的平均值

[sunchengquan 19:09:46 ~/local/app/bowtie2-2.2.4/example/reads]
$ awk '{if(NR%4==0) print}' reads_1.fq |cut -c1 >tmp[sunchengquan 19:36:19 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat tmp |awk 'BEGIN{for(i=0;i<256;++i) ord[sprintf("%c",i)]=i}BEGIN{count=0}{ count+=ord[$1]-30}END{print count,count/NR}'
193621 19.3621
[sunchengquan 19:36:46 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat tmp |awk 'BEGIN{for(i=0;i<256;++i) ord[sprintf("%c",i)]=i}BEGIN{count=0}{ count+=(ord[$1]-30)}END{print count,count/NR}'
193621 19.3621
[sunchengquan 19:38:57 ~/local/app/bowtie2-2.2.4/example/reads]
$ cat tmp |awk 'BEGIN{for(i=0;i<256;++i) ord[sprintf("%c",i)]=i}BEGIN{count=0}{ count+=(ord[$1])}END{print count,count/NR}'
493621 49.3621

生物信息数据格式:fastq格式相关推荐

  1. fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html

    其次完成生物信息学数据格式的习题(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集这些格式的说明书. fasta和fastq格式文件的shell小练习 http ...

  2. linux怎么查看fastq格式文件,fastq格式文件处理大全(一)

    从计算机的角度来说,生物的序列属于一种字符串,也是一种文本,因此生物信息分析属于文本处理范畴.文本存储为固定格式文件,生物信息的工作就是各种文本文件之间格式的转换,例如通过序列拼接将fastq转换为f ...

  3. SRA到fastq格式的批量转换

    生物信息分析人员一般会接触到从NCBI等网站下载的SRA数据,之前也介绍了下载SRA数据的几种方式.下面,我就简单介绍一下如何将下载的sra格式数据转换成为常用的fastq等格式. 1.fastq-d ...

  4. 关于illumina产生的测序源文件bcl转换成fastq格式的问题

    由于连接测序仪的服务器不知道哪里抽了风,无法直接的生成fastq格式的文件,好久都无解,经过一段时间仍无法解决,所以采用曲线救国的方法,看能不能利用三方软件将bcl转换成fastq文件 google以 ...

  5. linux怎么查看fastq格式文件,2020-01-11 了解FASTQ格式并处理FASTQ文件

    FASTQ文件格式是测序仪展示数据的标准格式,可以看成FASTA文件的变种(FASTA+Q),因为其包含了对序列中每个碱基的Qualify Measurement.(如:碱基A出错的可能性是1/100 ...

  6. RNA-seq流程学习笔记(4)-使用FastQC软件对fastq格式的数据进行质量控制

    今天开始学习使用FastQC软件对范例SRA测序文件的质量进行分析. 主要参考文章: RNA-seq(3):sra到fastq格式转换并进行质量控制 转录组入门(3):了解fastq测序数据 用Fas ...

  7. 医学图像数据格式和格式转换

    医学图像数据格式和格式转换 本文转载自:http://blog.csdn.net/kingmicrosoft/article/details/35798249 由于最近碰到了数据格式的问题,重建不出效 ...

  8. fq,fa,fna,ffn,faa都是什么鬼,与fasta,fastq格式有什么关系?终于1分钟搞懂了

    fasta与fastq的区别: fasta格式(格式缩写为fa)是一种存储核酸或氨基酸序列的文本格式 ,允许在序列前定义名称和编写注释. 已成为生物信息学的标准格式,格式简单,多种文本处理工具和 Py ...

  9. NGS基础---Fasta/Fastq格式记录

    Fasta/Fastq格式记录 时间:2020-10-21 生信中,常用到Fasta和Fastq格式,这两种是比较基础和常见的序列保存文件.通过wiki和网上资料,对这两种格式进行说明和记录. 1. ...

  10. **生信自学记录1——获取Fastq格式的反向互补序列**

    ` 生信自学记录1--获取Fastq格式的反向互补序列 总共分为三步 1.读取基因序列的str格式,返回反向互补序列str 2.打开fastq格式的文本提取基因序列,返回互补序列list 3.读取互补 ...

最新文章

  1. iptables如何开放被动模式的FTP服务
  2. 2016 、12 、11本周
  3. GPU算力免费用?百度AI Studio两周年惊喜活动开启
  4. c语言printout函数,只使用处理I/O的PrintDigit函数,编写一个过程以输出任意实数...
  5. 颠覆:链表在删除和插入的效率一定优于数组吗?
  6. spring中aop事务
  7. java共享租车信息管理系统jsp源码
  8. python使用协程_Python使用协程进行爬虫
  9. 刷屏代码·稳 from林凯
  10. 穷举法 解决用3个水桶等分8升水 python实现
  11. 移动网络怎么修改服务器地址,移动宽带怎么修改wifi密码?
  12. 模块划分-1 功能划分
  13. Nginx重写功能——location/rewrite
  14. CryEngine 渲染流程
  15. JavaScript 移动端点击事件延迟问题
  16. DNS欺骗与钓鱼网站
  17. 2020中科大计算机分数线,2020年中国科学技术大学强基计划入围分数线,录取分数线,中国科大强基计划笔试、面试...
  18. 最新云开秒赞系统公益版网站源码
  19. MySQL必知必会学习历程(一)
  20. API对接网关 code review

热门文章

  1. 阿里云上做二级、三级等保的基础概念、方案以及价格
  2. caxa画图怎么倒角_CAXA怎么画倒角和圆角?
  3. jsmind(Jsmind数据格式)
  4. 攻防世界misc解题(一)
  5. IBM GPFS并行文件系统
  6. Redis过期策略及内存淘汰机制
  7. android vlc m3u8,Exoplayer播放m3u8文件Android
  8. 锐浪报表数据源access_C# 锐浪报表 示例源码
  9. 下载pyboard的flash中的驱动程序_如何安装爱普生打印机驱动程序
  10. PHP开票接口,云增值税发票API详情