1. 基因转录本亚型

蛋白质亚型或“蛋白质变体“是一组高度相似的蛋白质成员,这些成员来源于单个基因或基因家族,是遗传差异造成的结果。虽然许多具有相同或相似的生物学作用,但一些亚型具有独特的功能。这些高度相似的蛋白质亚型可以由可变剪切(图1)、可变启动子或单基因的其他转录后修饰形成,通常不考虑翻译后修饰。通过RNA剪切机制,mRNA具有从基因中选择不同蛋白质编码区(外显子)的能力,甚至是从RNA中选择外显子的不同部分以形成不同的mRNA序列,每个独特的mRNA序列产生独特的蛋白质。

图1 可变剪切产生不同的转录本和蛋白质

        1.1 可变剪切

  可变剪切依据外显子之间连接位置的不同,又可以具体细分为如下(图2)几种剪切方式:

  • 组成型拼接
  • 外显子跳跃拼接
  • 内含子保留拼接
  • 相互排斥的外显子拼接
  • 替代5’端剪切
  • 替代3'端剪切

图2 不同的RNA剪切机制

        2. 基因所有亚型外显子区域获取

    楼主想研究一个基因所有外显子区域,而不是单独一个转录本的外显子区域,因此需要获取该基因的所有转录本信息,这里备选三个数据库(NCBI、Ensembl和UCSC)供使用,以BRCA1为例。

  2.1 使用NCBI数据库获取BRCA1基因的所有外显子区域

    2.1.1 选择“Gene”数据库,输入基因名(例如,“BRCA1”),点“Search”按钮搜索

    2.1.2 根据物种(例如,“human”),点击相应基因链接

    2.1.3 查看转录本个数,点击“GenBank”进入详情

    2.1.4 点击“Send to”,按下图所示选择相应的项,点击“Create File”创建“gff3”格式文件

  
  如图所示,得到BRCA1基因区域所有“feature”的物理位置,包括外显子。

  2.2 使用Ensembl数据库获取BRCA1基因的所有外显子区域

    2.2.1 物种选择“Human”数据库,输入基因名(例如,“BRCA1”),点“Go”按钮搜索

    2.2.2 选择“BRCA1”链接,查看详细

    2.2.3 如图所示,“BRCA1”共有33个转录本,点击“Export data”按钮,配置相关参数导出数据

    2.2.4 选择输出格式为“gff3”,输出内容只选择“exon”,然后点击“next”,如下图所示

  2.3 使用UCSC数据库获取BRCA1基因的所有外显子区域

  使用UCSC数据库,需要安装MySQL客户端链接UCSC数据库(不建议使用)

    2.3.1 链接UCSC数据库

  

   2.3.2 查询基因“BRCA1”,共有6个记录

        3. 小结

NCBI、Ensembl和UCSC均可以对基因的转录本的所有外显子进行查询,推荐使用Ensembl数据库,其次NCBI数据库,最后UCSC数据库。

参考资料

NCBI

Ensembl

UCSC

转载于:https://www.cnblogs.com/yahengwang/p/9361101.html

获取基因的所有转录本(不同亚型)的外显子区域相关推荐

  1. 使用R包ggbio画单个基因的 autoplot转录本信息图

    autoplot转录本信息for循环画图并保存 话不多说,直接上代码 if (!requireNamespace("BiocManager", quietly = TRUE))in ...

  2. js获取笔记本屏幕的分辨率以及缩放到125%工作区域的高度

    前言:现在笔记本很多买回来后默认的缩放都是125%,打开浏览器把页面的内容等于放大了1/4倍,研发开发都是在100%的缩放基础上研发的,所以这时需要研发的同志们来做适配了,那怎么区分笔记本的缩放比例是 ...

  3. 如何获取百度地图的全国各省市区的地理区域位置(地图-JSON-点位-行政区域)

    如何获取百度地图的区县点位? 打开百度地图开发平台,将代码拷贝到红色框内后点击运行即可,注意输入自己需要的行政区域,支持省市县. <!DOCTYPE html> <html> ...

  4. 易基因:RRBS揭示晚年锻炼可以减缓骨骼肌表观遗传衰老(甲基化年龄)|新研究

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 2021年12月21日,美国阿肯色大学.德克萨斯大学和肯塔基大学的研究人员合作在<Aging Cell>杂志发表了题为&qu ...

  5. Annovar 信息注释

    ANNOVAR 注释软件 ANNOVAR简介 ANNOVAR结构 ANNOVAR下载数据库 ANNOVAR输入格式 ANNOVAR格式转换 ANNOVAR注释功能 用table_annovar.pl进 ...

  6. 发基因组学、生物医学《SCI》《Nature》的最好方向!

    培训背景 基因组学(genomics)是对生物体所有基因进行集体表征.定量研究及不同基因组比较研究的一门交叉生物学学科,基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系 ...

  7. transPlotR 优雅的绘制基因转录本结构

    无能为力 1引言 这个工作大概陆陆续续花费了一周多的时间基本完善的差不多了.你会想不会有这么多轮子了吗?(R 包),比如 ggtranscript, gggenes, wiggleplotr, Gvi ...

  8. 如何获取目标基因的转录因子

    <h1 class="post-title entry-title">如何获取目标基因的转录因子</h1><div id="toc" ...

  9. python-根据gtf绘制基因全部转录本结构图

    根据基因组注释文件gtf绘制基因全部转录本的结构图,利用python进行实现,并实现了GUI 可以下载各种gtf,从NCBI,ENSEMBL,UCSC,GENCODE都可以,但是要根据相应的版本修改代 ...

  10. ISME:污水厂抗性组受细菌组成和基因交换驱动且出水中抗性表达活跃

    污水厂抗性组受细菌组成和基因交换驱动且出水中抗性表达活跃 原英文标题:Wastewater treatment plant resistomes are shaped by bacterial com ...

最新文章

  1. 你的数据也可以-两篇NAR的数据库
  2. Xamarin Essentials教程安全存储SecureStorage
  3. 06_一对一和一对多
  4. git checkout -b dev origin/dev详解
  5. java --HashTable学习
  6. 实例化Spring Bean:Bean实例化的姿势有多少种?
  7. python中类的定义方法_在Python中定义类变量的正确方法
  8. k-means 聚类过程演示
  9. 很大的.xls 文件导入sqlserver2005导入不全_python3 接口测试数据驱动之操作 excel 文件...
  10. 倒计时3天!携手开发者,一起精准打造数智未来!
  11. Java非对称加密KeyPairGenerator类
  12. MATLAB教程(1) MATLAB 基础知识(2)
  13. 分布式消息系统jafka快速起步(转)
  14. 100万“音乐难民”陪伴虾米到最后一刻
  15. hexo之icarus主题的美化修改以及简单的SEO配置
  16. edge浏览器突然不能播放视频解决办法
  17. 什么是X86和X86-64
  18. AutoCAD如何方便截图放到Word文档,改成白底黑字
  19. C++递归算法之分成互质组
  20. 数据结构--迷宫问题的四种解法

热门文章

  1. 工控硬件芯片级电路板维修方法
  2. 2021毓英中学高考成绩查询,泉州知名中学2020高考成绩喜报大集合(7.26更新)
  3. contest13 CF197div2 oooxx ooooo ooooo
  4. monkey命令——压力测试——转载参考01
  5. 让你快速逃离万能五笔的广告
  6. java设计triangle三角形_Java:【三角形类Triangle】设计一个名为Triangle的类来扩展GeometricObject类。该类包括:...
  7. 【练习】canvas——flappyBird
  8. 导弹巡航追踪目标模拟程序(1)源码版--matlab
  9. m基于LS+变步长LMS的Volterra级数数字预失真DPD系统matlab仿真
  10. 修改IAR for msp430工程名方法