hg19有哪些染色体?

chr1
chr2
chr3
chr4
chr5
chr6
chr7
chr8
chr9
chr10
chr11
chr12
chr13
chr14
chr15
chr16
chr17
chr18
chr19
chr20
chr21
chr22
chrX
chrY
chrM

其实还有其他“染色体”,只是我们的研究一般用不到,所以就没有合并进来。比如做同源分析,找变异什么的,还是要选好基因组。

gene_type有哪些?

cat gencode.v27.annotation.gtf | grep exon | cut -f6 -d\" | grep -v "#" | sort | uniq > gene_type

3prime_overlapping_ncRNA
IG_C_gene
IG_C_pseudogene
IG_D_gene
IG_J_gene
IG_J_pseudogene
IG_V_gene
IG_V_pseudogene
IG_pseudogene
MIAT_exon1
MIAT_exon5_1
MIAT_exon5_2
MIAT_exon5_3
Mt_rRNA
Mt_tRNA
SOX2OT_exon1
SOX2OT_exon3
SOX2OT_exon4
TEC
TR_C_gene
TR_D_gene
TR_J_gene
TR_J_pseudogene
TR_V_gene
TR_V_pseudogene
Xist_exon1
Xist_exon4
antisense_RNA
bidirectional_promoter_lncRNA
lincRNA
macro_lncRNA
miRNA
misc_RNA
non_coding
polymorphic_pseudogene
processed_pseudogene
processed_transcript
protein_coding
pseudogene
rRNA
ribozyme
sRNA
scRNA
scaRNA
sense_intronic
sense_overlapping
snRNA
snoRNA
transcribed_processed_pseudogene
transcribed_unitary_pseudogene
transcribed_unprocessed_pseudogene
translated_processed_pseudogene
unitary_pseudogene
unprocessed_pseudogene
vaultRNA

一共多少个基因?

cat gencode.v27.annotation.gtf | cut -f4 -d\; |  grep -v "#" | grep -v level | sort | uniq > gene

56609  

一共多少个转录本?

cat gencode.v27.annotation.gtf | cut -f2 -d\; |  grep -v "#" | grep -v gene_type | sort | uniq > transcipt

200401  

一共多少个外显子?

cat gencode.v27.annotation.gtf | grep -v "#" | grep exon | cut -f3-5 | sort | uniq > exon

1132357  

有多少条lncRNA

cat gencode.v27.long_noncoding_RNAs.gtf | grep -v "#" | cut -f3 -d\; | grep -v gene_type | sort | uniq > lincRNA

15754

  

转载于:https://www.cnblogs.com/leezx/p/8653072.html

初步了解hg19注释文件的内容 | gtf相关推荐

  1. 用哪个版本的基因组和注释文件好?| 亲测

    What Ensembl genome version should I use for alignments? (e.g. toplevel.fa vs. primary_assembly.fa) ...

  2. gff文件用什么打开_gff文件转换成gtf文件

    做测序数据分析的时候经常需要将gff格式的注释文件转换成gtf格式的文件.今天小编就给大家介绍一个工具,gffread来实现这个目的.注意这个工具需要在linux或者mac操作系统上运行. 下面是一个 ...

  3. 根据gtf格式的基因注释文件得到人所有基因的染色体坐标

    用bedtools对基因组片段区域进行基因注释 根据gtf格式的基因注释文件得到人所有基因的染色体坐标 选择的genecode内最早的Grch38版本(201408) v20是最早的hg38版本对应的 ...

  4. GTF基因注释文件详解

    GFF和GTF是两种最常用的数据库注释格式,在信息分析中建库时除了需要fasta文件一般还会需要这两种文件,提取需要的信息进行注释. Cufflinks/Tophat 软件需要 GTF文件作为基因注释 ...

  5. gffread gffcompare 将gff与gtf格式的注释文件转换与合并

    gffread gffcompare 将gff与gtf格式的注释文件转换与合并 使用: (1)gffread 安装: conda install gffread -y 使用: mkdir gtf# 格 ...

  6. gff文件_根据gff/gtf等注释文件取负链上的序列:先反向互补染色体再截取?还是先截取区间再反向互补序列?...

    最近需要根据注释文件在基因组上截取序列,突然想到一个问题:对于下面这样在负链上的基因,我们是先将整条染色体反向互补再截取对应区间?还是先截取对应区间再反向互补呢? 首先亮出答案:先截取区间,再反向互补 ...

  7. 根据gff/gtf等注释文件取负链上的序列:先反向互补染色体再截取?还是先截取区间再反向互补序列?

    最近需要根据注释文件在基因组上截取序列,突然想到一个问题:对于下面这样在负链上的基因,我们是先将整条染色体反向互补再截取对应区间?还是先截取对应区间再反向互补呢? 首先亮出答案:先截取区间,再反向互补 ...

  8. NGS基础 - 参考基因组和基因注释文件

    参考基因组和基因注释文件获取 通常测序生成的reads要与参考基因组或参考转录组进行比对,或Pseudo-alignment.所以首先需要获取参考基因组和参考转录组信息. Ensembl(http:/ ...

  9. linux基因组文件,科学网-NGS基础 - 参考基因组和基因注释文件-陈同的博文

    NGS基础 - 参考基因组和基因注释文件 同步滚动:关 参考基因组和基因注释文件获取 通常测序生成的reads要与参考基因组或参考转录组进行比对,或Pseudo-alignment.所以首先需要获取参 ...

最新文章

  1. 关于一道简单的Java 基础面试题的剖析: short s1=1;s1 = s1 +1会报错吗?
  2. 初学者自学python要看什么书-学习Python可以看书籍学习吗?老男孩Python入门课程...
  3. struts2 实现多文件限制上传
  4. 来电掉队,共享充电宝或许只是外表光鲜
  5. 如何保存一个函数_如何表达一个“分段函数”之学习Matlab Function模块
  6. SSL certificate problem: unable to get local issuer certificate 的解决方法
  7. tbb flow graph node types
  8. 项目实战Git团队操作_图形化版本
  9. linux内核对TCP的连接状态管理
  10. python背包问题递归_想问下大神python的背包问题的源代码(最好玩也有伪代码,请用递归法实现),因为只学过递归法,所...
  11. java excel导出(基于注解)
  12. 中望lisp加密_alisp文件加密测试.LSP
  13. 常用激活函数(激励函数)理解与总结
  14. 深度可分离卷积及其代码实现
  15. Java 和python多态区别_python面向对象之多态鸭子类型与Java的比较
  16. redis集群scan_Redis中的Scan命令的使用:查询大数据量
  17. 《SLA by Short brain》—学好英语口语的终极法宝!
  18. PCIe及PCB设计要求
  19. BC20 MQTT与GPS功能测试
  20. java短信登录_JAVA短信验证登录

热门文章

  1. css 属性名 查询表
  2. 【jQuery笔记Part1】12-jQuery元素的角标
  3. 读书笔记_打开量化投资的黑箱11
  4. 有了数据湖,距离数据仓库消失还有几年?
  5. Mozilla的 MDN 学习区Web开发
  6. python字符串format和center居中应用(三分钟读懂)
  7. 计算机98k音乐,【土豆】handclap 98K 完整版
  8. php变量值传递,PHP将值传递到包含文件中的变量
  9. github上markdown文件编写笔记
  10. 【计算机网络】IPv4 NAT