基因的表达是一个非常重要的过程,转录组测序是检测基因表达的技术,本篇文献对转录组分析流程和数据分析方法进行介绍。

引言

  • 基因表达特征:时空特异性
  • 转录层面研究基因表达的技术:PCR、基因芯片、转录组测序(RNA-seq)、Nanostring等
  • 高通量技术:检测样品中的大量基因表达情况,目前的热门研究领域。
  • 关键词:转录组、生信、数据发掘

大规模转录组数据

常规转录组测序

转录组是一个细胞或者样本中全部的基因表达转录本信息,研究转录组是解析基因组中功能元件和生命活动的发生及调控机制的必要基础。

  • 普通转录组

多细胞啊混池的mRNA测序,便宜应用广泛。通常用于分析基因表达、表达差异、可变剪切体、融合基因、检测SNP、RNA编辑变化。

  • 小RNA测序

小RNA是指序列比较短的非编 码RNA(noncoding RNA)。用于研究miRNA和piRNA,前者被证明对蛋白质的表达调控有影响。

  • 全转录组

研究发现一些非编码RNA有调控功能,因此对细胞内除rRNA外其他所有RNA测序的技术逐渐发展,包括mRNA、IncRNA、环形RNA(cir-cular RNA, circRNA)和小RNA进行测序的技术。

  • 全长转录组

三代测序技术能够检测完整的全场RNA序列,如Pacbio等技术,可用于新转录本发现。

数据库

  • NCBI GEO和SRA. GEO

简介:储存表达芯片和转录组测序数据(RNA和DNA)

用途:分析多组样本间差异表达基因。

  • EBI ArrayExpress

欧洲生物信息研究所(The European Bioinformatics Institute, EBI)用于存储高通量功能基因组实验数据的数据库,主要包括基因表达芯片和转录组测序数据,该数据库也提供工具方便用户上传和下载数据,以及分析芯片数据。

  • GSA

国家基因组科学数据中心(NGDC),其主要数据库为GSA(Genome Sequence Archive),用于存储各种高通量测序数据的原始数据,包括DNA-seq和RNA-seq数据.

转录组常规分析

分析流程

  • 计算差异表达量
  • 差异表达分析(NOIseqW和DEseq)
  • 差异表达基因的功能富集分析(Fishier、DAVID(https://david.ncifcrf.gov)、Metascape(http://metas-cape.org/gp/index.html)和PANTHER(http://pantherdb.org/) ,以及clusteprofiler这款R软件包)

根据不同转录组测序的方法,可以分析RNA可变剪切、全长转录本和IncRNA,circRNA,miRNA等非编码RNA,及其竞争性内源RNA(ceRNA)调控关系.

1.Tophat2或STAR比对+Cufflinks系列软件

2.HISAT, StringTie和Ballgown流程

3.免比对(alignment fiee)流程Salmon, Sailfish和Kallis

基因特异表达分析

不同的组织和样本中有特异的表达谱,可以用于检测标志物。 工具软件:SEGtool

基因表达的调控分析

基因表达受到DNA甲基化、组蛋白修饰、增强子、染色质开放性和转录因子 (TF)的调控,PlantTFDB是重要的植物转录因子库。

miRNA转录后调控基因表达也非常普遍,转录因子和miRNA分别在转录转录后进行调控,形成前馈环实现精细调节。

差异共调控分析

差异共调控网络能比较突变和正常之间的调控差异,目前常用的方法和工具是WGCNA,DCGL, DifTCorr和DysRegSig。

  • WGCNA

加权基因共表达网络分析,目的是寻找共表达基因模块、基因和表型之间的关系、寻找核心基因。

  • DCGL和DiffCorr

芯片表达数据检测差异共表达的R包

  • DysRegSig

机器学习方法分析基因失调的框架,从高纬度中发掘信息。

时间序列基因表达分析

基因表达是动态过程,对不同时间点的样品进行转录组测序,然后进行转录组分析,研究表达趋势和规律。

常用软件:STEM、TRAP

细胞组分和丰度分析

普通转录组是混池样本,包含多种细胞类型,不同细胞有不同的功能和基因表达规律,因此,分析组分和丰度至关重要。

常用软件或方法:xCell, CIBERSORTx, Immu-CellAI, TIMER和seq-ImmuCC

转录组新技术

单细胞测序

检测单个细胞中的基因表达,以获得不同细胞的基因表达特征的测序方法。单细胞转录组测序能准确分析每个细胞的基因表达、区分不同细胞群体、发现新的细胞类型等。

常见的单细胞测序方式有Smart- Seq2, 10x Genomics和microwell-seq

单细胞转录组数据分析:

质控、测序片段比对、条形码矩阵生成、数据归一化、降维和聚类、可视化、差异表达、细胞类型鉴定和细胞轨迹推断。

常见方法有Seurat, Scanpy和Cell Ranger

空间转录组

具有不同组织器官的多细胞生物是立体的复杂生命体,其基因表达具有时间特异性空间特异性

空间转录组中最难的点是不同空间样本的获取和重定位,一般是结合组织冷冻切片、显微解剖、荧光原位杂交和不同探针条形码等技术来获取和定位样本。

Spa-tialCPie是一个分析空间转录组聚类的R软件包。

SPARK是一个新的统计方法,用于从不同空间转录组数据中发现基因的空间表达模式。

ST Viewer是一个交互式分析和可视化空间转录组数据的工具。

总结

基因表达研究基础而重要,转录组测序作为最常见的高通量表达技术,其数据分析和挖掘也逐渐成熟、深入和延展。分析的方法比较多,目前还在不断完善,还需通过学习进行深入讨论。


文献:基因转录表达数据的生物信息挖掘研究-郭安源-华中科技大学生命科学与技术学院,人工智能生物学中心

本文由 mdnice 多平台发布

文献学习笔记丨转录组表达数据的生信挖掘研究相关推荐

  1. JavaWeb黑马旅游网-学习笔记05【分类数据展示功能】

    Java后端 学习路线 笔记汇总表[黑马程序员] JavaWeb黑马旅游网-学习笔记01[准备工作] JavaWeb黑马旅游网-学习笔记02[注册功能] JavaWeb黑马旅游网-学习笔记03[登陆和 ...

  2. 学习笔记(五)——数据适配器、数据表、数据网格视图控件的综合应用。

    学习笔记(五)--数据适配器.数据表.数据网格视图控件的综合应用. 1.  批量修改 修改包括增加,删除以及更新3个操作,所以声明实力化3个SQL命令分别应用于插入,删除以及修改 将声明的SQL命令连 ...

  3. HALCON 20.11:深度学习笔记(3)---Data(数据)

    HALCON 20.11:深度学习笔记(3)---Data(数据) HALCON 20.11.0.0中,实现了深度学习方法.其中,关于术语"数据"的介绍如下: 术语"数据 ...

  4. R学习笔记(4): 使用外部数据

    来源于:R学习笔记(4): 使用外部数据 博客:心内求法 鉴于内存的非持久性和容量限制,一个有效的数据处理工具必须能够使用外部数据:能够从外部获取大量的数据,也能够将处理结果保存.R中提供了一系列的函 ...

  5. SDN软件定义网络 学习笔记(4)--数据平面

    SDN软件定义网络 学习笔记(4)--数据平面 1. 简介 2. SDN数据平面架构 2.1 传统网络交换设备架构 2.2 SDN交换设备架构 2.3 数据平面架构图 3. SDN芯片与交换机 3.1 ...

  6. 【Vue】学习笔记-组件传值的数据累加器

    [Vue]学习笔记-组件传值的数据累加器 前言 父级组件 购物车组件 计数器组件 常见错误总结 前言 组件传值的数据累加器可以分为三个部分 App.vue为父级组件 Carts.vue表示购物车 Co ...

  7. SQLite学习笔记(七)-- 数据插入、更新和删除(C++实现)

    1.代码实例 代码说明 本例主要说明如何对数据表进行插入.更新和删除操作. 测试平台 1.开发语言:C++ 2.开发工具:VS2015 3.操作系统:Win7 X64 测试数据说明 测试表为Stude ...

  8. Python学习笔记---merge和concat数据合并(1)

    Python学习笔记-merge和concat数据合并(1) Python学习笔记-merge和concat数据合并(2) 文章目录 Python学习笔记---merge和concat数据合并(1) ...

  9. 数据库学习笔记(一) | 数据(Data)的定义

    数据库学习笔记(一) | 数据(Data)的定义和种类 什么是数据(Data) 结构化数据(Structured Data) 半结构化数据(Semi-structured Data) 非结构化数据(U ...

  10. MySQL学习笔记-约束以及修改数据表

    MySQL学习笔记-约束以及修改数据表 约束: 按功能划为: NOT NULL , PRIMARY KEY , UNIQUE KEY , DEFAULT , FOREIGN KEY 按数据列的数目划为 ...

最新文章

  1. is not a supported wheel on this platform pip安装报错
  2. oracle查看相关用户表
  3. 面向对象深入:继承03——抽象类
  4. (转,改)UML中的几种关系
  5. 抚摸斯蒂芬·金 (图)
  6. ubuntu网站做图像外链
  7. python crypto安装_关于python安装pip及crypto库
  8. 想要改变自己,请先突破这3个自我限制
  9. 头文件相互包含问题的解决办法
  10. 51单片机流水灯方法大全
  11. 【GNSS】GNSS数据下载工具
  12. ENSP实验——Telnet远程连接
  13. Cocos2d-x 2.x、3.x读书摘要(2016-6-25 07:18)
  14. 生活小剧场30天吸粉44w,小红书最受欢迎的笔记长这样
  15. 从零搭建“人工智障”音箱
  16. 简洁明了的刘海屏适配方案
  17. 使用poi将数据导出到excel
  18. jzyzoj 1216 poj虫洞 3259 Bellman_Ford模板
  19. 细数2021年前端圈发生的30多件大事
  20. reverse方向入门过程

热门文章

  1. 想要在工作中脱颖而出?这几款优秀的PC软件能够帮你
  2. 数字信号处理matlab版答案,数字信号处理matlab版答案
  3. python模拟用户数据
  4. Vue学习笔记(利用网易云API实现音乐播放器 实例)
  5. 大屏导航Linux系统下载,掌讯方案MTK3561大屏导航ROOT固件
  6. Mac 设置 word 单面打印 双面打印
  7. LeetCode答案汇总(持续更新...)
  8. sap销售发货的流程_基于SAP系统批量创建销售订单及交货单过账的方法与流程
  9. 哪些思维方式是你刻意训练过的?
  10. matlab R2021b 激活错误