玩转基因组浏览器之使用IGV查看基因结构信息
欢迎关注”生信修炼手册”!
基因结构是最基本的基因组注释信息,通常情况下,我们最关心基因区域内的数据分布情况,有多种文件格式可以存储基因结构信息
GFF
GTF
BED
用固定格式来存储对应的信息,使得生物信息软件可以更加标准化其输入输出,为数据分析带来便利。但是存储在文件中的信息对于我们而言,并不够直观。为了更加直观的查看基因结构,可以使用IGV浏览器,只需要将对应格式的文件导入软件中即可。
基因结构信息的本质是染色体坐标,IGV要求导入的数据必须是排序之后的结果。以GTF文件为例,可以采用如下命令先进行排序
sort -k1,1 -k4,4n -k5,5n hg19.gtf > hg19.sort.gtf
排序之后还需要对文件建立索引,这样检索的速度会更快,用igvtools可以建立索引,命令如下
igvtools index hg19.sort.gtf
运行完成后,会生成一个后缀为idx
的文件,将排序后的gtf文件和其索引放在同一个目录下,然后导入gtf文件即可。导入成功之后, 可以看到如下所示的结果
所有的转录本折叠在同一行进行展示,下方是对应的gene name。这种展示方式称之为Collapsed
, 比较节省空间,但是很多的转录本折叠在一起,无法相互区分。
同一个基因的多个转录本会存在重叠,相邻基因的转录本也可能存在重叠,为了更加的区分重叠的转录本,还支持以下两种展示方式
1. Expanded
结果示意如下
2. Squished
结果示意如下
通过右键可以切换不同的展示方式,Expanded模式下转录本区分的最清楚,但是占据的空间很大,Squished则是一种折中方案,抛弃了gene_name, 进一步压缩了空间。
每一条转录本,由3种元素构成
矩形
线条
箭头
示意如下
其中矩形表示exon区域 ,线条表示基因的正负链信息,向右的箭头表示正链,向左的箭头表示负链。有时会看到类似下图的转录本结构
上图中较窄的矩形区域表示的是UTR区域,对于蛋白编码RNA, 当GTF文件中提供了UTR或者CDS的区间时,会自动计算出UTR区域并进行标注。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
更多精彩
KEGG数据库,除了pathway你还知道哪些
全网最完整的circos中文教程
DNA甲基化数据分析专题
突变检测数据分析专题
mRNA数据分析专题
lncRNA数据分析专题
circRNA数据分析专题
miRNA数据分析专题
单细胞转录组数据分析专题
chip_seq数据分析专题
Hi-C数据分析专题
HLA数据分析专题
TCGA肿瘤数据分析专题
基因组组装数据分析专题
CNV数据分析专题
GWAS数据分析专题
2018年推文合集
2019年推文合集
写在最后
转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。
扫描下方二维码,关注我们,解锁更多精彩内容!
一个只分享干货的
生信公众号
玩转基因组浏览器之使用IGV查看基因结构信息相关推荐
- 玩转基因组浏览器之初识IGV
欢迎关注"生信修炼手册"! 基因组浏览器可以直观的展示基因组及其各种注释信息,是展示NGS数据和分析结果的利器.在维基百科中,将基因组浏览器定义为一种展示生物数据库中基因组学数据的 ...
- 玩转基因组浏览器之自定义IGV的参考基因组
欢迎关注"生信修炼手册"! IGV软件内置了很多的参考基因组,全部放在亚马逊的云服务器上,完整的参考基因组列表见如下链接 http://software.broadinstitut ...
- 玩转基因组浏览器之利用IGV查找motif结合位点
欢迎关注"生信修炼手册"! motif在基因组上结合位点的查找是生信分析中的一项基本技能,在转录因子的chip_seq, m6A_seq等落雨都有广泛应用,之前也写了很多的文章来介 ...
- 玩转基因组浏览器之展示RNA二级结构
欢迎关注"生信修炼手册"! 除了展示GTF, bed等常规格式的基因结构信息,IGV还可以展示RNA的二级结构,在下面这篇文章中,就是通过IGV的这一功能来直观的展示RNA二级结构 ...
- 玩转基因组浏览器之查看gwas结果
欢迎关注"生信修炼手册"! IGV支持动态查看gwas分析结果,对于gwas结果而言,要求至少要包含以下几列 CHR BP SNP P 对列的顺序没有要求,IGV通过文件名后缀来识 ...
- 玩转基因组浏览器之查看MAF文件
欢迎关注"生信修炼手册"! 对于基因组变异位点的存储,除了VCF外,还有一种常见的文件格式--MAF,是专门针对human突变位点注释信息的存储而定义的一种文件格式,最早在TCGA ...
- 玩转基因组浏览器之IGV进行序列比对
欢迎关注"生信修炼手册"! 除了动态的查看基因组学数据,IGV还内置了以下两个工具 Blat Motif finder 前者用于序列比对,后者用于motif的查找,本文的重点是介绍 ...
- oracle查看表结构信息
查看表结构 select COLUMN_NAME,DATA_TYPE,DATA_LENGTH from user_tab_columns where table_name='表名'; 查看表的注释 s ...
- mysql查看表结构信息
需求背景是给一个表名然后给出相应的表结构信息及索引信息 常用的命令有如下: 1. desc tableName; desc employees.employees; 2. show columns f ...
- NCBI查看基因注释信息
1.打开NCBI 2.下划选择<gene>选择ADK基因名点击<search> 示例展示的猪(Pig)中的ADK基因 3.点击查询结果 4.结果界面 5.查看具体序列
最新文章
- RGB-D相机视觉SLAM
- 补习系列(11)-springboot 文件上传原理
- python画数学函数_Python 绘制你想要的数学函数图形
- Please remove usages of `jcenter()` Maven repository from your build scripts and migrate your build
- hive添加字段报conflicting lock
- 标图123123666
- 03JavaScript程序设计修炼之道_2019-06-18_21-27-56_事件onchange
- Python使用pyserial实现串口收发
- 兔子-蓝牙 bluetooth (二) 打开蓝牙
- Spring中的 @Lazy注解简析
- 【Anaconda】修改conda默认envs_dirs和pkgs_dirs
- 山也就只有这么高嘛。
- WebService 理论详解、JWS(Java Web Service) 快速入门
- 儿童学计算机编程好处,孩子学编程的好处和坏处
- 计算机论文致谢词范文500字,论文致谢词范文500字(精选6篇)
- 用R语言进行数据探索
- python gdal:hdf转tif
- 【恒指早盘分析】期货交易绝非你想的那么简单
- 微信图标现在可以换颜色了???
- 6个奇淫小软件,让Windows像杜蕾斯上的油一样爽滑好用