转载于:http://ju.outofmemory.cn/entry/193943

前言

  在各个行业都是有行业标准的,这样才能统一规范而方便后面的分析,在生物信息学领域中主要是各种大量序列数据、注释数据等,这些都是有特定的格式去表示,下面列举几种常见的格式。了解这些是进行后续生物信息学分析的必备知识,有些人虽说是在做生物信息学分析,但是到现在可能还不知道什么是GFF3格式等。

fasta

fasta格式是最基本的表示序列信息(核苷酸或者蛋白质)的格式。 http://genetics.bwh.harvard.edu/pph/FASTA.html , https://en.wikipedia.org/wiki/FASTA_format 。
这里简单介绍下,fasta格式的文件通常后缀名为.fasta 或者.fa, 其实这都无所谓,因为都是文本文件。fasta格式文件(可以包含多条序列)中的一条序列的通常表示方法如下:

>gi|129295|sp|P01013|OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED)
QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE
KMKILELPFASGDLSMLVLLPDEVSDLERIEKTINFEKLTEWTNPNTMEKRRVKVYLPQMKIEEKYNLTS
VLMALGMTDLFIPSANLTGISSAESLKISQAVHGAFMELSEDGIEMAGSTGVIEDIKHSPESEQFRADHP
FLFLIKHNPTNTIVYFGRYWSP

其中主要分为两个部分:

  • 第一部分是序列的定义行(单行),该行的开头是>符号,紧跟着后面的就是该条序列的名称(具有唯一性,即不能和其它序列同名称),即>号和后面的名称的第一字符间是没有任何空白的。一般第一个空格后面的内容即为可选的描述信息。如上面, gi|129295|sp|P01013|OVAX_CHICK为序列名称, 而GENE X PROTEIN (OVALBUMIN-RELATED)则为描述信息。注意:有点软件是把一整行当做名称的,所以在出现错误的时候可以查看下格式是否正确。
  • 第二部分就是序列,所有的序列碱基或者氨基酸可以都放在一行存储,也可以多行存储,但是建议大家多行存储且单行长度不超过80个字符,因为这样容易阅读。且序列的多行之间不能有空行,序列信息描述的第一行与序列数据的第一行之间不能有空行。其中序列数据主要是按照密码表来表示的,*表示是蛋白质翻译的结束。

多行序列举例如下:

>SEQUENCE_1
MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG
LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK
IPQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTL
MGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQL
>SEQUENCE_2
SATVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQI
ATIGENLVVRRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH

fastq

fastq( https://en.wikipedia.org/wiki/FASTQ_format )同样是以文本形式来存储序列信息的格式,后缀名通常为.fastq 或者.fq,但是与fasta不相同的是,它除了存储序列本身外还存储了序列中每个单元所对应的质量分数,所以fastq格式通常用于高通量测试数据的存储。早期是有Sanger机构开发的,但是现在已经演变成一个高通量测序的标准了。
fastq格式文件中一个完整的单元分为四行,每行的含义如下:
第一行: 以@开头,内容同fasta的描述行类似
第二行:具体的碱基序列
第三行:以+开头,后面的内容可以和第一行类似,也什么都没有只留+
第四行:以ASCII字符集(分数)编码来表示对应碱基的测序质量
比如下面的这个例子:

@SEQ_ID
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65

下面以Illumina和NCBI SRA两个测序数据来源来讲讲它们之间的区别:
通常我们获取测序数据有两种途径,一种是自己通过仪器测定,一种是在公共数据库中(比如之前说到的NCBI中的SRA数据库)获取,这两种方式主要是在序列名称的命名上和测序质量表示方式上有所不同。
Illumina 序列名称:

@HWUSI-EAS100R:6:73:941:1973#0/1

上述以:隔开的每个字段的含义如下:

HWUSI-EAS100R the unique instrument name
6 flowcell lane
73 tile number within the flowcell lane
941 ‘x’-coordinate of the cluster within the tile
1973 ‘y’-coordinate of the cluster within the tile
0 index number for a multiplexed sample (0 for no indexing)
/1 the member of a pair, /1 or /2 (paired-end or mate-pair reads only)

NCBI SRA数据库:

将测序数据提交到NCBI的SRA数据库时,SRA数据库会为每一个样本提供一个编号,一般是SRRxxxxx,所以从SRA数据库上下载公共的测试数据(原始格式为.sra, 需特定工具转换为fastq),其fastq格式文件中每个单元的名称是以SRA编号接数字加以区分的。比如下面的这个示例:

@SRR001666.1 071112_SLXA-EAS1_s_7:5:1:817:345 length=36
GGGTGATGGCCGCTGCCGATGGCGTCAAATCCCACC
+SRR001666.1 071112_SLXA-EAS1_s_7:5:1:817:345 length=36
IIIIIIIIIIIIIIIIIIIIIIIIIIIIII9IG9IC
  • 需要注意的是:当把测序数据上传到SRA数据库时,它通常会将表示质量的分数 转换为标准的Sanger格式

质量分数表示法:
由于测序仪器的不同等因素所以对碱基测序质量的表示方式也不相同,在Fastq格式文件中,用ASCII码表来表示每个碱基的测序质量,下面介绍几种不同的方案:

其中有五种表示方法,Sanger的码表范围为!至I,其对应的数值为33-73,如果减去33(即Phred+33表示法)这个基数则范围转换为0-40,即如果某一个碱基的测序质量为!则对应的测序质量分数为0,表示测序质量低。其它几种表示法类似(X,I,J,L)。这里介绍测序质量的表示方法是因为后面有的软件是要指定测序数据的质量表示方法。

gff2

http://gmod.org/wiki/GFF2
GFF(General Feature Format)是一种用于描述基因或者其它序列元素的文件格式,GFF有几个版本,早期的第Version 2和现在的Version 3. Version 2 是由Sanger机构所制定的,而Version 3是由Sequence Ontology Project制定。正是由于有统一的格式来表示基因等元素,使得GFF格式的文件被广泛的使用与mapping与基因组数据可视化方面。
GFF2文件格式是由tab隔开的九列值,每一行的九个字段的含义如下:

Chr1  curated  CDS 365647  365963  .  +  1  Transcript "R119.7"

一列: reference sequence, 该列表示的是特征元素所在的染色体(或者scaffold,或者contig),也就是在基因组中的坐标系统,后续一切的注释信息都是基于此列。
第二列:source,该列表示改行注释信息的来源,比如上述的一行表示该行的CDS注释信息来自名为“curated”的注释。
第三列:feature,或者说是method,type, 表示的是该注释的类型,比如上述表示改行注释为CDS信息,可以将source和feature结合起来描述的更加详细。
第四列:start position,在reference sequence上的开始位置(坐标),通常是从1为起点而不是0。
第五列:end position, 在reference sequence上的结束位置(坐标),一般是大于start position的。
第六列:score, 表示该行feature的分数,比如序列相似性等,如果没有对应的分数可以用.代替。
第七列:strand,feature所在链,+表示正链,-表示负链,.表示不确定或者与链无关。
第八列:phase,与蛋白质编码相关,一般是用于CDS,值的范围为0-2,表示编码时阅读框的移动相位。
下面这段描述很详细:
‘0’ indicates that the specified region is in frame, i.e. that its first base corresponds to the first base of a codon. ‘1’ indicates that there is one extra base, i.e. that the second base of the region corresponds to the first base of a codon, and ‘2’ means that the third base of the region is the first base of a codon. If the strand is ‘-‘, then the first base of the region is value of , because the corresponding coding region will run from to on the reverse strand.
第九列:group,或者称为attributes,是用于对改行注释更多的描述,以键值对的形式,比如上面的例子表示该CDS是属于名为R119.7的transcript。该列中可以存在多个属性,属性之间是用;隔开的。
对于GFF格式的理解主要是集中在最后一列,有以下集中情况:
1.对于单个feature

Chr3   giemsa heterochromatin  4500000 6000000 . . .   Band 3q12.1

2.对于属于同一集合的多个feature

IV     curated exon    5506900 5506996 . + .   Transcript B0273.1
IV     curated exon    5506026 5506382 . + .   Transcript B0273.1
IV     curated exon    5506558 5506660 . + .   Transcript B0273.1
IV     curated exon    5506738 5506852 . + .   Transcript B0273.1

比如上面这个例子就表示这四个exon都是属于同一个名为B0273.1的transcript,这是表示一个完整transcript结构的最基本要求。
GFF2还可用于序列比对结果表示等其它方面,这里不做介绍了。

gtf(gff2.5)

http://mblab.wustl.edu/GTF2.html
GTF(Gene Transfer Format)格式是借鉴于GFF2格式,也被称为GFF2.5,大部分字段的定义是和GFF2相同的,只是每行的第九列必须带有如下四个域,具体为gene_id value; transcript_id value; 这样的设计是为了适应一个基因的多个转录本这种情况。比如下面的这个例子:

AB000123    Twinscan     CDS    193817    194022    .    -    2    gene_id "AB000123.1"; transcript_id "AB00123.1.2";
AB000123    Twinscan     CDS    199645    199752    .    -    2    gene_id "AB000123.1"; transcript_id "AB00123.1.2";
AB000123    Twinscan     CDS    200369    200508    .    -    1    gene_id "AB000123.1"; transcript_id "AB00123.1.2";
AB000123    Twinscan     CDS    215991    216028    .    -    0    gene_id "AB000123.1"; transcript_id "AB00123.1.2";
AB000123    Twinscan     start_codon   216026    216028    .    -    .    gene_id    "AB000123.1"; transcript_id "AB00123.1.2";
AB000123    Twinscan     stop_codon    193814    193816    .    -    .    gene_id    "AB000123.1"; transcript_id "AB00123.1.2";

gff3

http://gmod.org/wiki/GFF3 http://www.sequenceontology.org/gff3.shtml
GFF2格式早期用的比较多,但是现在用的多的是GFF3格式,这也是好多软件所支持的,比如Gbrowse, Jbrowse等基因组数据可视化工具。
先看下面这个简单的例子:

##gff-version 3
ctg123  .  exon  1300  1500  .  +  .  ID=exon00001
ctg123  .  exon  1050  1500  .  +  .  ID=exon00002
ctg123  .  exon  3000  3902  .  +  .  ID=exon00003
ctg123  .  exon  5000  5500  .  +  .  ID=exon00004
ctg123  .  exon  7000  9000  .  +  .  ID=exon00005

第一行的##gff-version 3通常是需要的,而且必须是在文件的第一行。
前八列和GFF2、GFF2.5类似,但是有几点是要特别注意的,主要是将GFF3注释数据用于基因组浏览器时,字段中的一些特殊字符比如空格,> %等都需要使用URL编码进行转换才能准确的在web中进行展示。
第九列同样是表示attributes,采用的同样是键值对的形式(tag=value),只是这里有几个特定的键,具体如下:
ID,feature在整个GFF3文件中唯一的标识符;
Name,feature的名字,不同于ID,Name不要求唯一,只是方便用户浏览;
Alias, 相当于feature的别名;
Parent,表明该feature所属的上一级feature 的ID,这种关系可用于exons-transcripts,transcripts-genes,可以看出一个feature可以拥有多个子feature;
Target, 主要是用于序列比对结果的展示,value的格式为target_id start end [strand], 其中如果target_id中含有空格则需转换为%20;
后面还有些其它属性比如Note等,这里不再做详细描述。
下面再来看下典型的例子:

  • 蛋白质编码基因结构
ctg123 example gene            1050 9000 . + . ID=EDEN;Name=EDEN;Note=protein kinasectg123 example mRNA            1050 9000 . + . ID=EDEN.1;Parent=EDEN;Name=EDEN.1;Index=1
ctg123 example five_prime_UTR  1050 1200 . + . Parent=EDEN.1
ctg123 example CDS             1201 1500 . + 0 Parent=EDEN.1
ctg123 example CDS             3000 3902 . + 0 Parent=EDEN.1
ctg123 example CDS             5000 5500 . + 0 Parent=EDEN.1
ctg123 example CDS             7000 7608 . + 0 Parent=EDEN.1
ctg123 example three_prime_UTR 7609 9000 . + . Parent=EDEN.1ctg123 example mRNA            1050 9000 . + . ID=EDEN.2;Parent=EDEN;Name=EDEN.2;Index=1
ctg123 example five_prime_UTR  1050 1200 . + . Parent=EDEN.2
ctg123 example CDS             1201 1500 . + 0 Parent=EDEN.2
ctg123 example CDS             5000 5500 . + 0 Parent=EDEN.2
ctg123 example CDS             7000 7608 . + 0 Parent=EDEN.2
ctg123 example three_prime_UTR 7609 9000 . + . Parent=EDEN.2ctg123 example mRNA            1300 9000 . + . ID=EDEN.3;Parent=EDEN;Name=EDEN.3;Index=1
ctg123 example five_prime_UTR  1300 1500 . + . Parent=EDEN.3
ctg123 example five_prime_UTR  3000 3300 . + . Parent=EDEN.3
ctg123 example CDS             3301 3902 . + 0 Parent=EDEN.3
ctg123 example CDS             5000 5500 . + 1 Parent=EDEN.3
ctg123 example CDS             7000 7600 . + 1 Parent=EDEN.3
ctg123 example three_prime_UTR 7601 9000 . + . Parent=EDEN.3

一个名为EDEN的基因拥有三个转录本,分别名为EDEN.1 EDEN.2 EDEN.3, 每个转录本又有UTR和CDS等信息。

  • 序列比对
ctg123 est EST_match 1050 1500 . + . ID=Match1;Name=agt830.5;Target=agt830.5 1 451
ctg123 est EST_match 3000 3202 . + . ID=Match1;Name=agt830.5;Target=agt830.5 452 654ctg123 est EST_match 5410 5500 . - . ID=Match2;Name=agt830.3;Target=agt830.3 505 595
ctg123 est EST_match 7000 7503 . - . ID=Match2;Name=agt830.3;Target=agt830.3 1 504ctg123 est EST_match 1050 1500 . + . ID=Match3;Name=agt221.5;Target=agt221.5 1 451
ctg123 est EST_match 5000 5500 . + . ID=Match3;Name=agt221.5;Target=agt221.5 452 952
ctg123 est EST_match 7000 7300 . + . ID=Match3;Name=agt221.5;Target=agt221.5 953 1253
  • 定量数据
ctg123 affy microarray_oligo   1 100 281 . . Name=Expt1
ctg123 affy microarray_oligo 101 200 183 . . Name=Expt1
ctg123 affy microarray_oligo 201 300 213 . . Name=Expt1
ctg123 affy microarray_oligo 301 400 191 . . Name=Expt1
ctg123 affy microarray_oligo 401 500 288 . . Name=Expt1
ctg123 affy microarray_oligo 501 600 184 . . Name=Expt1
  • 含Fasta格式的GFF3格式文件
##gff-version 3
ctg123 . exon            1300  1500  .  +  .  ID=exon00001
ctg123 . exon            1050  1500  .  +  .  ID=exon00002
ctg123 . exon            3000  3902  .  +  .  ID=exon00003
ctg123 . exon            5000  5500  .  +  .  ID=exon00004
ctg123 . exon            7000  9000  .  +  .  ID=exon00005
##FASTA
>ctg123
cttctgggcgtacccgattctcggagaacttgccgcaccattccgccttg
tgttcattgctgcctgcatgttcattgtctacctcggctacgtgtggcta
tctttcctcggtgccctcgtgcacggagtcgagaaaccaaagaacaaaaa
aagaaattaaaatatttattttgctgtggtttttgatgtgtgttttttat
aatgatttttgatgtgaccaattgtacttttcctttaaatgaaatgtaat
cttaaatgtatttccgacgaattcgaggcctgaaaagtgtgacgccattc
...

该GFF3文件中含有对应的序列,以##FASTA作为标示。

bed

http://www.genome.ucsc.edu/FAQ/FAQformat.html#format1 , http://bedtools.readthedocs.org/en/latest/content/general-usage.html , http://asia.ensembl.org/info/website/upload/bed.html?redirect=no

bed格式同样是用于展示序列注释信息,有相应的软件来处理这类格式的文件,如bedtools。可以用在类似GBrowse这样的基因组数据可视化工具中。 以tab隔开,它必须的三个字段为 chrom、chromStart、chromEnd,还有9个可选字段。
注意:用于在GBrowse上展示相关注释的bed格式通常第一行有一个关于track的描述信息。
比如下面的例子:

track name=pairedReads description="Clone Paired Reads" useScore=1
chr22 1000 5000 cloneA 960 + 1000 5000 0 2 567,488, 0,3512
chr22 2000 6000 cloneB 900 - 2000 6000 0 2 433,399, 0,3601

sam/bam

http://blog.sina.com.cn/s/blog_670445240101l30k.html ,
http://genome.sph.umich.edu/wiki/SAM ,
https://samtools.github.io/hts-specs/SAMv1.pdf 。
在生物信息学中尤其是高通量测序数据分析中,大部分的操作都是在实现短片段序列与参考序列的比对(mapping),比如bowtie等,这就涉及到如何使用一个统一的格式来表示这种mapping结果呢,sam(Sequence Alignment/Map)格式就是来解决这个问题的。sam文件拥有头部描述和详细比对两部分,其中头部描述是以@开头,后面紧跟两个缩写字母表示相应的含义,SAM分为两部分,注释信息(header section)和比对结果部分(alignment section),注释信息可有可无,都是以@开头,用不同的tag表示不同的信息,主要有@HD,说明符合标准的版本、对比序列的排列顺序;@SQ,参考序列说明;@RG,比对上的序列(read)说明;@PG,使用的程序说明;@CO,任意的说明信息。而详细比对部分是通过11个tab隔开的字段来表示。
下面主要讲解下详细比对部分字段的具体含义:

其中:
1. QNAME 表示的是查询序列的名称即短片段(reads)的名称;
2. FLAG 以整数来表示比对的结果,不同数值有不同的意义,数值也可以是下列数的组合;

比如如果FLAG是4的话则表示该reads没有比对到参考序列上,flag为16表示single-end reads比对到参考序列的反链上,flag为83(64+16+2+1)表示paired-end reads中的第一个reads比对到参考序列上了。
3. RNAME 表示参考序列的名称,比如基因组的染色体编号等,如果没有比对上则显示为*;
4. POS 表示比对的起始位置,以1开始计数,如果没有比对上则显示为0;
5. MAPQ 比对质量;
6. CIGAR CIGAR 字符串,即比对的详细情况,简要比对信息表达式(Compact Idiosyncratic Gapped Alignment Report),其以参考序列为基础,使用数字加字母表示比对结果,比如3S6M1P1I4M,前三个碱基被剪切去除了,然后6个比对上了,然后打开了一 个缺口,有一个碱基插入,最后是4个比对上了,是按照顺序的;
7. RNEXT 双末端测序中下一个reads比对的参考系列的名称,如果没有则用*表示,如果和前一个reads比对到同一个参考序列则用=表示;
8. PNEXT 下一个reads比对到参考序列上的位置,如果没有则用0表示;
9. ISIZE/TLEN query序列的模板长度或者插入长度,Template的长度,最左边得为正,最右边的为负,中间的不用定义正负,不分区段(single-segment)的比对上,或者不可用时,此处为0;
10. reads的序列信息;
11. reads的序列质量信息,同FASTQ。
后面还有些可选字段,比如:
可选字段(optional fields),格式如:TAG:TYPE:VALUE,其中TAG有两个大写字母组成,每个TAG代表一类信息,每一行一个TAG只能出现一次,TYPE表示TAG对应值的类型,可以是字符串、整数、字节、数组等。
示例:

:497:R:-272+13M17D24M   113 1   497 37  37M 15  100338662   0   CGGGTCTGACCTGAGGAGAACTGTGCTCCGCCTTCAG   0;==-==9;>>>>>=>>>>>>>>>>>=>>>>>>>>>>   XT:A:U  NM:i:0  SM:i:37 AM:i:0  X0:i:1  X1:i:0  XM:i:0  XO:i:0  XG:i:0  MD:Z:37
:20389:F:275+18M2D19M   99  1   17644   0   37M =   17919   314 TATGACTGCTAATAATACCTACACATGTTAGAACCAT   >>>>>>>>>>>>>>>>>>>><<>>><<>>4::>>:<9   RG:Z:UM0098:1   XT:A:R  NM:i:0  SM:i:0  AM:i:0  X0:i:4  X1:i:0  XM:i:0  XO:i:0  XG:i:0  MD:Z:37
:20389:F:275+18M2D19M   147 1   17919   0   18M2D19M    =   17644   -314    GTAGTACCAACTGTAAGTCCTTATCTTCATACTTTGT   ;44999;499<8<8<<<8<<><<<<><7<;<<<>><<   XT:A:R  NM:i:2  SM:i:0  AM:i:0  X0:i:4  X1:i:0  XM:i:0  XO:i:1  XG:i:2  MD:Z:18^CA19
:21597+10M2I25M:R:-209  83  1   21678   0   8M2I27M =   21469   -244    CACCACATCACATATACCAAGCCTGGCTGTGTCTTCT   <;9<<5><<<<><<<>><<><>><9>><>>>9>>><>   XT:A:R  NM:i:2  SM:i:0  AM:i:0  X0:i:5  X1:i:0  XM:i:0  XO:i:1  XG:i:2  MD:Z:35

解释:

其中可以看出Aligenment 2 和 Alignment 3是成对的reads,其插入长度为314。
bam格式中的b是binary的意思,是sam格式的二进制表示方式,为什么要用二进制表示呢? 因为sam格式文件大小通常是十分大的,一般是以G为单位,所以为了减少存储量等因素而将sam转换为二进制格式以便于分析。
sam/bam格式是由特定的一些软件(比如samtools)来处理的,包括格式互转、排序、建立索引、搜寻突变等操作,后续分析中会详细讲解samtools工具的使用方法。

vcf

http://samtools.github.io/hts-specs/VCFv4.2.pdf
vcf(Variant Call Format)格式是用于表示突变信息的文本格式,可以用来表示single nucleotide variants, insertions/deletions, copy number variants and structural variants等。VCF格式同样是分为两大部分,一部分是注释描述信息,一部分是具体的突变信息,其中注释信息是以##开头的,我们来看下面这个例子:

我们着重来关注第二部分的每列字段是什么含义:
CHROM 即chromosome, 染色体名称;
POS 即position, 发生突变的参考序列的位置(从1开始计数);
ID 突变的名称;
REF 参考序列POS上的碱基;
ALT 发生突变的碱基,多个的话以,连接, 可选符号为ATCGN*,大小写敏感;
QUAL 基于Phred格式的表示ALT的质量,也可以理解为可靠性;
FILTER 过滤后的状态,即按照可靠性进行筛选;
INFO 额外信息,可结合注释描述信息进行理解

针对vcf格式有如bcftools等软件进行处理。

常用生物信息学格式介绍相关推荐

  1. 常用生物信息学格式介绍(fasta、fastq、gff2、gtf(gff2.5)、gff3、bed、sam、bam、vcf)

    前言 在各个行业都是有行业标准的,这样才能统一规范而方便后面的分析,在生物信息学领域中主要是各种大量序列数据.注释数据等,这些都是有特定的格式去表示,下面列举几种常见的格式.了解这些是进行后续生物信息 ...

  2. 常用图片格式介绍(了解

    常用图片格式 图片是网页制作中很重要的素材,图片有不同的格式,每种格式都有自己的特性,了解这些特效,可以方便我们在制作网页时选取适合的图片格式,图片格式及特性如下: 1.psd photoshop的专 ...

  3. Java新手看招 常用开发工具介绍

    Java新手看招 常用开发工具介绍 Java的应用越来越广泛,学习Java的人也越来越多.学过程序设计的人知道,使用Basic进行程序设计,可以使用QBasic.Visual Basic等开发工具:使 ...

  4. gif透明背景动画_前端基础系列之bmp、jpg、png、gif、svg常用图片格式浅谈(二)...

    IT客栈 作者:大腰子 bmp.jpg.png.gif.svg常用图片格式 之前为大家介绍了几种WEB前端常用的图片格式,对比了它们的特点,参见<前端基础系列之bmp.jpg.png.gif.s ...

  5. HDFS命令行客户端使用,命令行客户端支持的命令参数,常用命令参数介绍

    3.HDFS的shell(命令行客户端)操作 3.1 HDFS命令行客户端使用 HDFS提供shell命令行客户端,使用方法如下: [toto@hadoop hadoop-2.8.0]$ hdfs d ...

  6. Maven实战——常用Maven插件介绍

    http://www.infoq.com/cn/news/2011/04/xxb-maven-7-plugin 我们都知道Maven本质上是一个插件框架,它的核心并不执行任何具体的构建任务,所有这些任 ...

  7. 浅析VS2010反汇编 VS 反汇编方法及常用汇编指令介绍 VS2015使用技巧 调试-反汇编 查看C语言代码对应的汇编代码...

    浅析VS2010反汇编 2015年07月25日 21:53:11 阅读数:4374 第一篇 1. 如何进行反汇编 在调试的环境下,我们可以很方便地通过反汇编窗口查看程序生成的反汇编信息.如下图所示. ...

  8. 常用json框架介绍和Jackson返回结果处理

    常用json框架介绍和Jackson返回结果处理     简介:介绍常用json框架和注解的使用,自定义返回json结构和格式 1.常用框架 阿里 fastjson,谷歌gson等         J ...

  9. CIF、QCIF、HD1、D1格式介绍

    CIF.QCIF.HD1.D1格式介绍 CIF简介 CIF是常用的标准化图像格式(Common Intermediate Format).在H.323协议簇中,规定了视频采集设备的标准采集分辨率.CI ...

  10. Elasticsearch:ingest pipeline 使用示例 - 解析常用日志格式

    在本示例教程中,你将在索引之前使用 ingest pipeline 以通用日志格式解析服务器日志. 在开始之前,请检查摄取管道的先决条件. 你要解析的日志类似于以下内容: 127.0.0.1 user ...

最新文章

  1. 实现Map并保持插入顺序的Java类?
  2. Oracle分区知识
  3. 频繁项集挖掘之Aprior和FPGrowth算法
  4. Java Web之BaseServlet的抽取
  5. Flink on Zeppelin 流计算处理最佳实践
  6. 超大气APP下载页双语多国语言网站源码
  7. 转的:SQL执行提高效率的多种方法
  8. Python实现机房管理软件的文件分发功能
  9. C++-实现日志log功能
  10. 将 varchar 值转换为数据类型为 int 的列时发生语法错误
  11. 在Windows平台使用IIS部署Flask网站
  12. CSS RESET —— 浏览器样式重置
  13. Android应用签名
  14. 绿盟 java 面试_绿盟科技校园招聘面试经验|面试问题(共52条)- 职业圈
  15. 乔布斯在斯坦福大学的演讲
  16. MacBook环境下python连接oracle数据库
  17. 耳朵电一电焦虑失眠就好了?
  18. 【sketchup 2021】草图大师的高级工具使用2【材质贴图应用的基础功能和高级使用与实战演练(给地砖调整尺寸、转贴贴图圆柱为例、投影贴图百叶窗为例】
  19. 2021-10-27 基于电影数据库的简单查询(数据库第二次实验)
  20. FPGA 学习笔记:Vivado 生成的 Bitstream bit 文件 超大的解决方法

热门文章

  1. java调用lingo实例_LINGO使用教程(一)
  2. cad计算机功能键,【答疑】Auto CAD2014计算器快捷键是什么呢?? - 视频教程线上学...
  3. 【TeachNLP】文本数据处理-词表获取
  4. 一个故意不通过图灵测试的人工智能
  5. ASP.NET全局文件Global.asax用法分析
  6. 世界中英文国家及国家代码
  7. Unity 3D 游戏开发学习资料集合(开发必备)
  8. 贪心算法--经典问题(java实现)
  9. 服装商品销售数据分析
  10. 信号与系统——有关卷积的意义