初步了解hg19注释文件的内容 | gtf
hg19有哪些染色体?
chr1 chr2 chr3 chr4 chr5 chr6 chr7 chr8 chr9 chr10 chr11 chr12 chr13 chr14 chr15 chr16 chr17 chr18 chr19 chr20 chr21 chr22 chrX chrY chrM
其实还有其他“染色体”,只是我们的研究一般用不到,所以就没有合并进来。比如做同源分析,找变异什么的,还是要选好基因组。
gene_type有哪些?
cat gencode.v27.annotation.gtf | grep exon | cut -f6 -d\" | grep -v "#" | sort | uniq > gene_type
3prime_overlapping_ncRNA IG_C_gene IG_C_pseudogene IG_D_gene IG_J_gene IG_J_pseudogene IG_V_gene IG_V_pseudogene IG_pseudogene MIAT_exon1 MIAT_exon5_1 MIAT_exon5_2 MIAT_exon5_3 Mt_rRNA Mt_tRNA SOX2OT_exon1 SOX2OT_exon3 SOX2OT_exon4 TEC TR_C_gene TR_D_gene TR_J_gene TR_J_pseudogene TR_V_gene TR_V_pseudogene Xist_exon1 Xist_exon4 antisense_RNA bidirectional_promoter_lncRNA lincRNA macro_lncRNA miRNA misc_RNA non_coding polymorphic_pseudogene processed_pseudogene processed_transcript protein_coding pseudogene rRNA ribozyme sRNA scRNA scaRNA sense_intronic sense_overlapping snRNA snoRNA transcribed_processed_pseudogene transcribed_unitary_pseudogene transcribed_unprocessed_pseudogene translated_processed_pseudogene unitary_pseudogene unprocessed_pseudogene vaultRNA
一共多少个基因?
cat gencode.v27.annotation.gtf | cut -f4 -d\; | grep -v "#" | grep -v level | sort | uniq > gene
56609
一共多少个转录本?
cat gencode.v27.annotation.gtf | cut -f2 -d\; | grep -v "#" | grep -v gene_type | sort | uniq > transcipt
200401
一共多少个外显子?
cat gencode.v27.annotation.gtf | grep -v "#" | grep exon | cut -f3-5 | sort | uniq > exon
1132357
有多少条lncRNA
cat gencode.v27.long_noncoding_RNAs.gtf | grep -v "#" | cut -f3 -d\; | grep -v gene_type | sort | uniq > lincRNA
15754
转载于:https://www.cnblogs.com/leezx/p/8653072.html
初步了解hg19注释文件的内容 | gtf相关推荐
- 用哪个版本的基因组和注释文件好?| 亲测
What Ensembl genome version should I use for alignments? (e.g. toplevel.fa vs. primary_assembly.fa) ...
- gff文件用什么打开_gff文件转换成gtf文件
做测序数据分析的时候经常需要将gff格式的注释文件转换成gtf格式的文件.今天小编就给大家介绍一个工具,gffread来实现这个目的.注意这个工具需要在linux或者mac操作系统上运行. 下面是一个 ...
- 根据gtf格式的基因注释文件得到人所有基因的染色体坐标
用bedtools对基因组片段区域进行基因注释 根据gtf格式的基因注释文件得到人所有基因的染色体坐标 选择的genecode内最早的Grch38版本(201408) v20是最早的hg38版本对应的 ...
- GTF基因注释文件详解
GFF和GTF是两种最常用的数据库注释格式,在信息分析中建库时除了需要fasta文件一般还会需要这两种文件,提取需要的信息进行注释. Cufflinks/Tophat 软件需要 GTF文件作为基因注释 ...
- gffread gffcompare 将gff与gtf格式的注释文件转换与合并
gffread gffcompare 将gff与gtf格式的注释文件转换与合并 使用: (1)gffread 安装: conda install gffread -y 使用: mkdir gtf# 格 ...
- gff文件_根据gff/gtf等注释文件取负链上的序列:先反向互补染色体再截取?还是先截取区间再反向互补序列?...
最近需要根据注释文件在基因组上截取序列,突然想到一个问题:对于下面这样在负链上的基因,我们是先将整条染色体反向互补再截取对应区间?还是先截取对应区间再反向互补呢? 首先亮出答案:先截取区间,再反向互补 ...
- 根据gff/gtf等注释文件取负链上的序列:先反向互补染色体再截取?还是先截取区间再反向互补序列?
最近需要根据注释文件在基因组上截取序列,突然想到一个问题:对于下面这样在负链上的基因,我们是先将整条染色体反向互补再截取对应区间?还是先截取对应区间再反向互补呢? 首先亮出答案:先截取区间,再反向互补 ...
- NGS基础 - 参考基因组和基因注释文件
参考基因组和基因注释文件获取 通常测序生成的reads要与参考基因组或参考转录组进行比对,或Pseudo-alignment.所以首先需要获取参考基因组和参考转录组信息. Ensembl(http:/ ...
- linux基因组文件,科学网-NGS基础 - 参考基因组和基因注释文件-陈同的博文
NGS基础 - 参考基因组和基因注释文件 同步滚动:关 参考基因组和基因注释文件获取 通常测序生成的reads要与参考基因组或参考转录组进行比对,或Pseudo-alignment.所以首先需要获取参 ...
最新文章
- 关于一道简单的Java 基础面试题的剖析: short s1=1;s1 = s1 +1会报错吗?
- 初学者自学python要看什么书-学习Python可以看书籍学习吗?老男孩Python入门课程...
- struts2 实现多文件限制上传
- 来电掉队,共享充电宝或许只是外表光鲜
- 如何保存一个函数_如何表达一个“分段函数”之学习Matlab Function模块
- SSL certificate problem: unable to get local issuer certificate 的解决方法
- tbb flow graph node types
- 项目实战Git团队操作_图形化版本
- linux内核对TCP的连接状态管理
- python背包问题递归_想问下大神python的背包问题的源代码(最好玩也有伪代码,请用递归法实现),因为只学过递归法,所...
- java excel导出(基于注解)
- 中望lisp加密_alisp文件加密测试.LSP
- 常用激活函数(激励函数)理解与总结
- 深度可分离卷积及其代码实现
- Java 和python多态区别_python面向对象之多态鸭子类型与Java的比较
- redis集群scan_Redis中的Scan命令的使用:查询大数据量
- 《SLA by Short brain》—学好英语口语的终极法宝!
- PCIe及PCB设计要求
- BC20 MQTT与GPS功能测试
- java短信登录_JAVA短信验证登录