欢迎关注微信公众号《生信修炼手册》!

融合基因是指两个或者多个基因联合起来,共同转录形成一个转录本,融合基因可以作为某些疾病的特异分子标记,常见的有以下几种

  1. bcr/abl融合基因存在于95%以上的慢性粒细胞白血病患者中;
  2. AML1/ETO融合基因主要见于急性粒细胞白血病部分分化型患者中;
  3. CBFβ/MYH11融合基因是M4Eo型白血病的分子标志;
  4. PML/RARα融合基因是急性早幼粒细胞白血病(APL)的分子标志

利用RNA_seq的数据,我们可以检测融合转录本,从而识别融合基因。 fusionMap就是这样的一款工具,官网如下

http://www.arrayserver.com/wiki/index.php?title=FusionMap

通过两种方式来检测融合基因

  • 对于没有比对上基因组的序列,即unmapped reads, 通过识别Fusion junction-spanning reads 来识别融合基因;这部分reads覆盖到了融合基因的连接点,在连接点两侧的序列分别比对到构成融合的多个基因上
  • 对于比对上基因组的reads, 通过识别 Inter-transcript read pairs来识别融合基因,这部分reads虽然没有直接覆盖连接点,但是其R1端和R2端分别比对到不同的基因
    示意图如下

    在fusionmap 中,假定融合基因由2个基因组成,对于没能比对上基因组的Fusion Junction-spanning reads, 又分为两类:设定一个比对长度的阈值,如果这条reads在两个基因中比对上的长度都大于阈值,就属于seed reads; 如果在任意一个基因中比对上的长度小于阈值,就属于rescued reads

    Fusionmap会输出如下所示的表格

    关键的几列信息解释如下
  • FusionID : 识别到的融合基因的ID,前缀都为FUS,第一个数字为融合基因的起始位置,第二个数字为融合基因的终止位置,这里的位置实际上都是累积位置,把所有的染色体按照字母顺序首位相连构成一条参照的染色体,这样每个基因在这条染色体上都有一个位置,所以这里的位置都是累积位置,可以发现,终止位置的数字总是比起始位置大;括号里的内容是形成融合基因的两个基因的链的方向
  • Strand : 形成融合基因的两个基因的链的方向, 包括++, --, ±, -+ 四种组合
  • Position1: 检测到的融合基因的起始位置
  • Chromosome1 : gene1 所在的染色体
  • Chromsome2: gene2 所在的染色体
  • Position2: 检测到的融合基因的终止位置
  • knowGene1 : gene1 的symbol
  • KnowTranscriptStrand: gene1的转录本的方向,有多个转录本,就有多个方向
  • KnowGene2: gene2 的symbol
  • KnowTranscripitStrand : gene2的转录本的方向,有多个转录本,就有多个方向
  • FusionGene: 融合基因的名字,有gene1->gene2

除此之外,还包含以下几种比较难理解的信息

1. 支持该融合基因的reads数目

包含以下3种
1.accepted_hits.UniqueCuttingPositionCount
2.accepted_hits.SeedCount
3.accepted_hits.RescuedCount

SeedCountRescuedCount代表的就是上文中提到了seed readsrescued reads的个数,二者相加就是Fusion Junciton-spanning reads数目,除此之外,还有Inter-transcript reads,这两种reads的总数就是所有支持该融合基因的reads数目,reads数肯定是越多越好,但是由于建库过程中存在PCR重复,所以为了提供更加可信的reads数信息,需要去冗余,保证PCR reads不重复计算,去冗余之后,就得到了UniqueCuttingPositionCount。示意图如下

黑色的线条是真实存在的融合基因形成的转录本,灰色的fragment是随机打断该转录本生成的序列,红色为融合基因对应的breakpoint,图中一共4条reads, 但是中间的2条reads 位置相同,可能是PCR 重复,所以实际上只能说有3条reads 支持该融合基因;fusinomap 在统计reads 数目的时候,实际上只看在第二个基因中的终止位置是否相同来判断,对于例子中的融合基因,最终的UniqueCuttingPositionCount的值就是3,这个数值越大,该融合基因越可靠。

2. 密码子类型

融合转录本也会进行翻译,相比原本两个基因的密码子,融合转录本的密码子会存在移码现象,对于结果中frameshift这一列的信息,示意图如下

以上就是4种常见的融合转录本密码子类型,在FrameshiftClass这一列信息中,将这4种常见类型定义为In-Frame, 其他类型定义为Frame-Shift。

3. 连接点两侧的碱基

通常认为是两个基因的exon区域连接形成了融合转录本,而exon起始和终止的碱基序列相对保守,根据这一特征,fusionmap定义了SplicePattern, 即连接点两侧序列的模式,GA-TC这样的剪切模式是最常见的,类型为CanonicalPatter[Major],接下来比较常见的是GC-AG 和 AT-AC, 类型为CanonicalPatter[Minor], 对于其他的剪切模式,一般不常见,类型为NonCanonicalPatter;如果一个融合基因的breakpoint 处的剪切模式越常见,则检测到的该融合基因为真实存在的融合基因的可能信越大。

同时也会判断连接点两侧是否位于eoxn边界,对应的信息保存在OnExonBoundary这一列,如果连接点位于两个exon边界,取值为Both, 其他取值包括Single和None, 详细的用法请参阅官方文档。

扫描关注微信号,更多精彩内容等着你!

使用FusionMap检测融合基因相关推荐

  1. mRNA数据分析专题

    欢迎关注"生信修炼手册"! mRNA是基因实时表达的产物,研究mRNA可以探究基因表达以及调控的规律:同时也可以用于发现基因结构的变化,比如可变剪切,融合基因等事件,本文整理了mR ...

  2. 【bioinfo】融合检测软件FusionMap分析流程和报告结果

    文章目录 写在前面 FusionMap融合检测原理 FusionMap与其他软比较 FusionMap分析流程 FusionMap结果文件说明 FusionMap mono CUP设置 图片来源: h ...

  3. RNA 15. SCI 文章中的融合基因之 FusionGDB2

    基于 RNA 数据分析1-13期基本介绍完成,而基因融合同样也是转录组测序中能够获得的对于临床上非常有意义的数据,这期就看看融合基因该怎么分析,增添文章的内容. 一. 融合基因 融合基因就是两个基因& ...

  4. 揭秘转录组分析中的融合基因鉴定

    欢迎关注"生信修炼手册"! 对于疾病或者肿瘤相关的转录组数据,除了进行基础的差异分析外,还可以从可变剪切,融合基因,SNP等各种角度挖掘相关的信息,本文主要介绍下转录组中的融合基因 ...

  5. mysql基因测序_基因融合检测数据库介绍

    点击蓝字 关注我们 基 因融合指的是两个或者多个基因的部分序列结合到一起形成了一种新的基因. 随着高 通量测序 的 发展,我们可以利用二代测序的数据来鉴定出发生在不同疾病当中的融合基因,所以也就出现了 ...

  6. 使用STAR-fusion进行融合基因的分析

    欢迎关注"生信修炼手册"! STAR是目前主流的RNA-seq比对软件之一,而STAR-fusion就是一款基于STAR比对结果进行融合基因鉴定的软件,该项目的地址如下 https ...

  7. 距离传感器控制灯泡代码_如何使用颜色传感器和超声波传感器检测障碍物和避障...

    上一期的内容中,我给大家介绍了如何使用触碰传感器检测障碍物和避障,今天我们再来说说如何使用颜色传感器和超声波传感器检测障碍物和避障. 使用颜色传感器 在大多数情况下,EV3颜色传感器并不适合用于障碍物 ...

  8. 微调torchvision 0.3的目标检测模型

    微调torchvision 0.3的目标检测模型 本文将微调在 Penn-Fudan 数据库中对行人检测和分割的已预先训练的 Mask R-CNN 模型.它包含170个图像和345个行人实例,说明如何 ...

  9. 部署可扩展的目标检测管道:推理过程(下)

    部署可扩展的目标检测管道:推理过程(下) 融合 感兴趣的目标可以被遮挡.有时只能看到目标的一小部分(少至几个像素). • 图19.车辆和交通信号灯被遮挡. • 图20:阻塞了总线. • 图21:左侧的 ...

最新文章

  1. php 不等待返回的实现方法(异步调用)
  2. mysql 分表的3种方法
  3. SAP信贷出口(用户1,2,3)
  4. docker 查看日志_8个优秀Docker容器监控工具,收藏了
  5. Response响应方法详解
  6. 五、Spring中的@Import注解
  7. HDR与ToneMapping
  8. 用matlab拟合多元函,MatLab中多元拟合的函数是什么?
  9. 如何使用Arrays工具类操作数组
  10. 【Python实例第20讲】手写数字识别问题的K-Means聚类
  11. java输入身高体重计算体脂率_追求健康的体脂率,比追求体重数更有意义:一个公式教你计算...
  12. echarts宽度随屏幕宽度改变自适应
  13. R语言—基本统计分析
  14. 【LOJ2863】「IOI2018」组合动作
  15. Android12 HDR相关
  16. 关于google地图的一些使用
  17. 2022高频面试题之css篇
  18. flac转换成mp3,4种方法教会你
  19. 敏捷开发的价值观(转自MBAlib)
  20. jdk-7u80-linux-i586.tar.gz

热门文章

  1. python函一维聚类_聚类实战:一维数组数据聚类
  2. c语言的局部变量,全局变量及静态局部变量和静态全局变量
  3. python作业练习
  4. SQL 增加列、修改列、删除列
  5. python通过win32api、win32clipboard等包实现微信pc端消息自动发送
  6. 【心灵感悟】—看【人生就是一次列车的旅行】PPT之感
  7. Win10 Pycharm安装码云(Gitee)插件
  8. 凯捷携手亚马逊云科技推出“汽车出海白皮书”
  9. python怎么去掉换行符_python怎么移除字符串中的换行符
  10. 2016 华山杯 Writeup