高通量数据分析必备|基因组浏览器使用介绍 - 1
基因组浏览器是高通量测序分析的一个重要的可视化工具。相比于最终提供的表格,基因组浏览器可以提供更多的信息,如直观展示突变位点、查看有无新转录本或新的可变剪接形式、查看peak的可信度、上下游基因、区域保守性、重复元件、蛋白结合motif等。
我们前面有测序数据可视化列举了4个常用的高通量数据可视化工具,详细介绍了IGV基因组浏览器可视化高通量测序数据和UCSC 基因组浏览器的安装使用。
最近几次将以华盛顿大学(DC)开发的EPGG基因组浏览器为主要工具 (目前主流浏览器之一,不同的功能更新分别发表于NBT, Nature method等杂志),介绍下基因组浏览器的基本展示内容、各部分含义、使用方式等。
基因组浏览器都可以按照位置或基因名字搜索,可进行局部放大和缩小。虽然每个软件略有不同,但基本操作是通用的。点一点,拽一拽,就都能用了。初次接触一个软件,多一点耐心,多一点操作,其实没那么难。
基因信息展示包含基因的转录方向信息 (箭头),基因结构信息 (CDS, UTR, intron),基因功能描述信息等。方向信息对我们识别转录起始位点及启动子区域和启动子上的ChIP peak至关重要。
另外还有个功能,基因只在基因组占1%,浏览起来不方便,Juxtapose模式可以只显示基因区,其它区域隐藏,这样截图或浏览起来都更方便。
重复元件是我们做分析时需要关注的一个点,最近Cell文章发现 LINE元件 (A LINE-1-Nucleolin Patnership Regulates Early Development and ESC Identity)是胚胎发育的关键。如果我们的数据能在某个重复元件上有特殊分布,也可能催生重要发现呢。
“峰图”是最常见的展示形式,reads的分布有高有低,在基因组上形成层恋叠嶂的山峰状。峰顶表示对应区域的表达、修饰或结合比较高。
除了峰形图,也可以展示热图、线图等。
数值Track支持的数据一般是bigWig格式,在不同浏览器之间通用。不同Track之间比较时需要先对数据做标准化,也需要设置同等大小的Y轴。数据可以进行一定程度的拟合,使得结果更清晰 (图中的Smooth window)。
这个线图常用于比较富集样品和对照样品,或比较不同样品之间的表达量高低等。把2个Track放到一起展示,高低立见。UCSC genome browser也有类似功能,而且展示效果更好,我们前面也已提过。
EPGG特有的甲基化数据展示,给定每个位点测序深度,CG甲基化比例,CHH,CHG甲基化比例等。还可以在线过滤,筛选不同支持reads数的甲基化位点,更有动态性。是甲基化分析的必备神器。
染色体的三维结构研究越来越多,用途也越来越大。关联SNP位点的功能,寻找enhancer的靶基因,基因组区域互作,都可以通过Hi-C数据提供更多支持信息。EPGG可以用互作热图或loop连线两种方式展示区域之间的互作。
互作热图的识别方式是:如果要看位点A和位点B之间是否有互作,只需在正负45度方向画一条线,查看线是否有交点和交点处颜色强弱即可判断。
还有圈图形式,从宏观展示某个位点与基因组其它区域的互作。
SNP位点展示及连锁不平衡展示,这也是EPGG的特有功能。可视化与Hi-C染色体互作类似。
下一步将讲一下EPGG的自带数据和分析功能,以更方便使用。
访问链接:http://epigenomegateway.wustl.edu/browser/
往期精品(点击图片直达文字对应教程)
机器学习
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集
高通量数据分析必备|基因组浏览器使用介绍 - 1相关推荐
- 中国农科院微生物生态和进化方向博士后招聘(有高通量数据分析经验者优先)...
中国农科院微生物生态和进化方向博士后招聘(有高通量数据分析经验者优先) 1.团队介绍 张西美老师团队隶属于中国农业科学院农业环境与可持续发展研究所,办公地址设在北京市海淀区中关村南大街12号.研究组组 ...
- 重磅微生物新技术分享 | 高通量微生物单细胞基因组技术2bRAD-M简化宏基因组技术...
新技术推动微生物研究 新技术一直是推动科研发展的利器. 微生物作为生物学家研究热点,对其基因组进行高分辨率.精准解析,一直是科研人员的共同需求. 当前,解析微生物群落的物种构成主要依赖于扩增子测序和宏 ...
- 高通量测序分析工具Bedtools使用介绍
http://blog.genesino.com/2018/04/bedtools/ Bedtools是处理基因组信息分析的强大工具集合,其主要功能如下: bedtools: flexible too ...
- 基因组浏览器IGV的安装和图形解读
IGV (Itegrative Genomics Viewer)是一款功能强大的综合性基因组学可视化工具,能够将基因组的变异情况进行可视化,因此广泛应用于基因组学的研究中.IGV的开发得到了美国国立癌 ...
- mysql like反义_[转载]关于小RNA高通量测序数据分析方法的研究
1 引言 小RNA(small RNAs)主要指长度在18-30nt的一类非编码RNA(ncRNAs),在真核生物中,具有基因表达调控功能的小RNA主要有微小RNA(microRNAs,miRNAs) ...
- 基因组浏览器使用 (EPGG)
基因组浏览器是高通量测序分析的一个重要的可视化工具.相比于最终提供的表格,基因组浏览器可以提供更多的信息,如直观展示突变位点.查看有无新转录本或新的可变剪接形式.查看peak的可信度.上下游基因.区域 ...
- NBT:主流高通量测序仪在人/细菌/宏基因组测序评测结果发布,华大智造表现优异...
导读 高通量DNA测序技术(DNA-seq)是临床和基础生物医学研究的重要手段之一.作为一种常规的技术方法,DNA-seq在多个领域均有广泛应用,例如个体基因分型和变异鉴定,种群和物种水平的基因组特征 ...
- 高通量测序数据分析:RNA-seq
本文围绕RNA-seq学习路线进行生信入门,主要内容有: ☆ RNA-seq方法原理 ☆ RNA-seq的生物信息分析 1.数据获取 测序数据下载与处理(SRA Toolkit) 测序数据质控与过滤( ...
- Microbiome:利用Nanopore高通量测序技术解析污水处理体系可移动抗性基因组(一作解读)
文章目录 Microbiome:利用Nanopore高通量测序技术解析污水处理体系可移动抗性基因组 背景解读 结果分析 一.携带抗性基因的质粒和整合性结合元件在污水处理体系抗性组中占主导地位 二.快速 ...
最新文章
- 高级网络配置《 bond team桥接 》的建立
- 用Python Pandas处理亿级数据
- boost::gregorian模块实现月末日的测试程序
- 如何在源代码(而非库文件)模式下构建并且运行 SAP Spartacus
- 004-hadoop家族概述
- 打印五行五列的直角三角形
- 苹果首款自研芯片Mac成本可能上升 因设计改变
- Flickr 网站架构分析
- 倒角距离(Chamfer distance)和earth mover‘s diatance
- 冲刺七天----03
- 网上邻居是网络还是计算机,如何从局域网网络中找到网上邻居
- 高等数学Mathematica实验题——2.2 - 16. 欧拉常数的计算(Calculation of EulerGamma Constant)
- Blowfish加密算法
- oracle方案对象有表空间吗,oracle数据库中,实例、表空间、用户、方案、表、数据的关系例子...
- 找工作神器,提取各大网站有效的招聘信息(前程无忧、智联招聘、猎聘网)
- 鸿蒙系统卸载App,强力卸载手机软件
- P9065 [yLOI2023] 云梦谣 题解
- steamlit安装
- 保护你的眼睛——设置电脑屏幕颜色和ClearType字体
- 日计划安排 --- 凡事预则立,不预则废