欢迎关注”生信修炼手册”!

基因结构是最基本的基因组注释信息,通常情况下,我们最关心基因区域内的数据分布情况,有多种文件格式可以存储基因结构信息

  1. GFF

  2. GTF

  3. BED

用固定格式来存储对应的信息,使得生物信息软件可以更加标准化其输入输出,为数据分析带来便利。但是存储在文件中的信息对于我们而言,并不够直观。为了更加直观的查看基因结构,可以使用IGV浏览器,只需要将对应格式的文件导入软件中即可。

基因结构信息的本质是染色体坐标,IGV要求导入的数据必须是排序之后的结果。以GTF文件为例,可以采用如下命令先进行排序

sort -k1,1 -k4,4n -k5,5n hg19.gtf > hg19.sort.gtf

排序之后还需要对文件建立索引,这样检索的速度会更快,用igvtools可以建立索引,命令如下

igvtools  index hg19.sort.gtf

运行完成后,会生成一个后缀为idx的文件,将排序后的gtf文件和其索引放在同一个目录下,然后导入gtf文件即可。导入成功之后,  可以看到如下所示的结果

所有的转录本折叠在同一行进行展示,下方是对应的gene name。这种展示方式称之为Collapsed,  比较节省空间,但是很多的转录本折叠在一起,无法相互区分。

同一个基因的多个转录本会存在重叠,相邻基因的转录本也可能存在重叠,为了更加的区分重叠的转录本,还支持以下两种展示方式

1.  Expanded

结果示意如下

2. Squished

结果示意如下

通过右键可以切换不同的展示方式,Expanded模式下转录本区分的最清楚,但是占据的空间很大,Squished则是一种折中方案,抛弃了gene_name, 进一步压缩了空间。

每一条转录本,由3种元素构成

  1. 矩形

  2. 线条

  3. 箭头

示意如下

其中矩形表示exon区域 ,线条表示基因的正负链信息,向右的箭头表示正链,向左的箭头表示负链。有时会看到类似下图的转录本结构

上图中较窄的矩形区域表示的是UTR区域,对于蛋白编码RNA, 当GTF文件中提供了UTR或者CDS的区间时,会自动计算出UTR区域并进行标注。

·end·

—如果喜欢,快分享给你的朋友们吧—

原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!

本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

更多精彩

  • KEGG数据库,除了pathway你还知道哪些

  • 全网最完整的circos中文教程

  • DNA甲基化数据分析专题

  • 突变检测数据分析专题

  • mRNA数据分析专题

  • lncRNA数据分析专题

  • circRNA数据分析专题

  • miRNA数据分析专题

  • 单细胞转录组数据分析专题

  • chip_seq数据分析专题

  • Hi-C数据分析专题

  • HLA数据分析专题

  • TCGA肿瘤数据分析专题

  • 基因组组装数据分析专题

  • CNV数据分析专题

  • GWAS数据分析专题

  • 2018年推文合集

  • 2019年推文合集

写在最后

转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。

扫描下方二维码,关注我们,解锁更多精彩内容!

一个只分享干货的

生信公众号

玩转基因组浏览器之使用IGV查看基因结构信息相关推荐

  1. 玩转基因组浏览器之初识IGV

    欢迎关注"生信修炼手册"! 基因组浏览器可以直观的展示基因组及其各种注释信息,是展示NGS数据和分析结果的利器.在维基百科中,将基因组浏览器定义为一种展示生物数据库中基因组学数据的 ...

  2. 玩转基因组浏览器之自定义IGV的参考基因组

    欢迎关注"生信修炼手册"! IGV软件内置了很多的参考基因组,全部放在亚马逊的云服务器上,完整的参考基因组列表见如下链接 http://software.broadinstitut ...

  3. 玩转基因组浏览器之利用IGV查找motif结合位点

    欢迎关注"生信修炼手册"! motif在基因组上结合位点的查找是生信分析中的一项基本技能,在转录因子的chip_seq, m6A_seq等落雨都有广泛应用,之前也写了很多的文章来介 ...

  4. 玩转基因组浏览器之展示RNA二级结构

    欢迎关注"生信修炼手册"! 除了展示GTF, bed等常规格式的基因结构信息,IGV还可以展示RNA的二级结构,在下面这篇文章中,就是通过IGV的这一功能来直观的展示RNA二级结构 ...

  5. 玩转基因组浏览器之查看gwas结果

    欢迎关注"生信修炼手册"! IGV支持动态查看gwas分析结果,对于gwas结果而言,要求至少要包含以下几列 CHR BP SNP P 对列的顺序没有要求,IGV通过文件名后缀来识 ...

  6. 玩转基因组浏览器之查看MAF文件

    欢迎关注"生信修炼手册"! 对于基因组变异位点的存储,除了VCF外,还有一种常见的文件格式--MAF,是专门针对human突变位点注释信息的存储而定义的一种文件格式,最早在TCGA ...

  7. 玩转基因组浏览器之IGV进行序列比对

    欢迎关注"生信修炼手册"! 除了动态的查看基因组学数据,IGV还内置了以下两个工具 Blat Motif finder 前者用于序列比对,后者用于motif的查找,本文的重点是介绍 ...

  8. oracle查看表结构信息

    查看表结构 select COLUMN_NAME,DATA_TYPE,DATA_LENGTH from user_tab_columns where table_name='表名'; 查看表的注释 s ...

  9. mysql查看表结构信息

    需求背景是给一个表名然后给出相应的表结构信息及索引信息 常用的命令有如下: 1. desc tableName; desc employees.employees; 2. show columns f ...

  10. NCBI查看基因注释信息

    1.打开NCBI 2.下划选择<gene>选择ADK基因名点击<search> 示例展示的猪(Pig)中的ADK基因 3.点击查询结果 4.结果界面 5.查看具体序列

最新文章

  1. RGB-D相机视觉SLAM
  2. 补习系列(11)-springboot 文件上传原理
  3. python画数学函数_Python 绘制你想要的数学函数图形
  4. Please remove usages of `jcenter()` Maven repository from your build scripts and migrate your build
  5. hive添加字段报conflicting lock
  6. 标图123123666
  7. 03JavaScript程序设计修炼之道_2019-06-18_21-27-56_事件onchange
  8. Python使用pyserial实现串口收发
  9. 兔子-蓝牙 bluetooth (二) 打开蓝牙
  10. Spring中的 @Lazy注解简析
  11. 【Anaconda】修改conda默认envs_dirs和pkgs_dirs
  12. 山也就只有这么高嘛。
  13. WebService 理论详解、JWS(Java Web Service) 快速入门
  14. 儿童学计算机编程好处,孩子学编程的好处和坏处
  15. 计算机论文致谢词范文500字,论文致谢词范文500字(精选6篇)
  16. 用R语言进行数据探索
  17. python gdal:hdf转tif
  18. 【恒指早盘分析】期货交易绝非你想的那么简单
  19. 微信图标现在可以换颜色了???
  20. 6个奇淫小软件,让Windows像杜蕾斯上的油一样爽滑好用

热门文章

  1. 入职两个月的一些感受
  2. 如何快速掌握一门新的技术?
  3. hp 430g8 笔记本摄像头黑屏问题解决
  4. PS常用快捷键 初学者必看
  5. 漫画戏说:如何破解MD5加密算法
  6. Appium-iOS环境搭建
  7. 善于总结、不断反思做更好的自己
  8. python实验收获与反思 100字_期中考试总结与反思100字
  9. Android 获取地理位置的经度和纬度
  10. 为什么要分析网络流量?