r语言 转录本结构及丰度_肠道菌群:宏转录组测序分析流程解读
上回给大家讲述了16S测序分析 和 宏基因组测序分析,本期的宏转录组来啦~
你知道吗?通过16S测序分析 和 宏基因组测序分析,我们只能够知道肠道菌群做好事或坏事的潜力,而并不知道它们此时此刻正在我们体内干神马,通过宏转录组测序分析有助于发现真相。
image
基因无论是启动还是关闭,菌内的原始DNA拷贝数始终保持恒定,而真正发挥作用的是RNA。
菌群的代谢特征不是来自于恒定的基因序列,而是决定于基因转录出来的RNA数量。
什么是宏转录组学?
宏转录组学是一门在整体水平上研究某一特定环境、特定时期微生物群落中全基因组转录情况以及转录调控规律的学科。
宏转录组测序是可原位研究特定生境、特定时空下微生物群落中活跃菌种的组成以及活性基因的表达情况。
为什么进行宏转录组学研究?
与宏基因组相比,宏转录组具有明显的研究优势,因为在DNA水平上基因的存在,并不意味着该基因具有转录活性并发挥作用,特别在复杂环境例如土壤当中这些微生物很难同时大量分裂增殖而发挥重要功能。
宏转录组能在进行物种鉴定的同时,也能研究特定时空下有活性的微生物群落组成和活性基因的表达情况。
image
宏转录组RNA样本制备方法
在原核生物中,mRNA 只占全部 RNA 的 1-5%,其余绝大部分是16S 和 23S 核糖体RNA以及tRNA,因此要测序 mRNA 首先必须先将 mRNA 纯化出来。但是,原核生物并不像真核生物 mRNA 具有 poly A 的结构,因此,无法直接利用 oligo T 将 mRNA 纯化出来。
如何提升原核生物 mRNA 的量,这是宏转录组测序的关键问题。
目前,提升原核生物 mRNA 的量,最主要的方式分为两大类,第一类是去除rRNA (图 a 与 b )。
image
图 a 的方式是利用 rRNA 的探针将 rRNA 去除,这也是最常用的方式,然而,去除 rRNA 的效率会与探针序列的设计、生物物种有关;
图 b 的方式是利用针对 rRNA 作用的酵素将 rRNA 去除,主要是利用原核生物的 mRNA 5’端有三个磷酸,而此酵素无法对有三个磷酸结构的mRNA作用,因此,能够有效去除 rRNA。
这类方法的缺点是需要较高量的起始RNA,并且是直接对RNA操作,容易使得目标mRNA降解。
另外一大类则是将 mRNA 分离纯化出来(图 c 与 d )。
图 c 的方式是利用大肠杆菌的 poly A polymerase 将 mRNA 3’端接上 poly A,再利用 oligo T 将 mRNA 纯化出来;
图 d 的方式是利用 Co-IP 的方式针对 RNA binding protein 进行 IP,最后再将 mRNA 纯化出来。
以上四种方式是目前比较常见的方式,各有其优缺点,主要还是依不同研究的目标和需求,找出最适当的方式。
宏转录组文库构建
image
宏转录组测序分析流程
宏转录组测序分析流程,一般包括如下步骤:
- 对测序下机的双端原始数据进行质量控制,获取可用于下游分析的高质量序列;
- 对高质量序列进行宿主RNA和细菌的核糖体RNA序列剔除,得到mRNA的转录本序列集;
- 对每个样本分别进行Denovo拼接,构建宏转录组序列集,并进行基因预测,获得非冗余蛋白序列集;
- 对蛋白序列用多种常用数据库进行功能注释,获得各功能类群丰度图谱,并进行差异比较分析、代谢通路富集分析、聚类分析等;
- 对序列进行物种注释,获得种以及种以下精细水平的物种组成谱,并进行差异比较分析、聚类分析、物种组成分析和关联网络分析;
- 基于上述获得的功能丰度谱和物种组成谱,可以进一步对宏转录组样本进行Alpha和Beta多样性分析,进而通过统计学方法筛选得到关键生物标记物;
一款宏转录组测序分析软件包:SAMSA2
SAMSA2: a standalone metatranscriptome analysis pipeline
- SAMSA2是SAMSA的升级版本
- SAMSA2速度更快,这是由于使用了DIAMOND(详情请见生信入门:序列比对之diamond)
- SAMSA2更加灵活,这是由于使用了本地数据库
- SAMSA2分析流程如下:
image
通过SAMSA2的可视化脚本获得的PCA图和热图
image
物种丰度柱状图
image
宏转录组学的缺点和挑战
宏转录组研究虽然火热,但是如上所述获得高质量RNA还是一个挑战。
另一个需要考虑的问题是mRNA的半衰期较短,因此可能很难检测到针对环境刺激的快速反应。而且,mRNA和蛋白质并不总是同步出现的。
因此,需要一个整合来自于宏基因组学、宏转录组学、宏代谢组学和宏蛋白质组学数据集的分析流程,这可能有助于多层次的全面了解微生物群的组成和功能。
常见问题
宏转录组与宏基因组差别?
宏基因组是以环境中所有微生物的DNA为研究对象,宏转录组以环境中所有微生物的RNA为研究对象。
宏基因组能够告诉我们环境中所有微生物能够做什么,而宏转录组能够告诉我们环境中所有微生物正在做什么。
宏基因组测序获得的基因为整个环境微生物的基因组,主要侧重于研究基因的结构,预测潜在的代谢功能和基因表达情况,但是在特定的时空下并非所有的基因都会表达,宏转录组测序获得的是具有转录活性的基因。
宏转录组应用范围
宏转录组学,和宏基因组学一样适用范围广泛,其包括:人体微生态、环境、工业、农业等领域。
image
人和动物样本
- 不同类型,如胃黏膜、粪便、唾液、肺部灌洗液、生殖道分泌物等;
- 不同处理,如正常与患病、不同年龄、不同药物处理等。
取样方法
动物组织样本,采用RNase-free水或1×PBS缓冲液(pH7.4)清洗,可用RNAlater保存剂,或液氮速冻,-80℃以下的环境中保存,或干冰运输。
所有宏转录组样本类型,提取出来的RNA总量需至少1 μg,OD260/280值为1.6~2.3,有明显主条带28S/18S≥1,即达到合格。
宏转录组测多少数据量?
普通环境样本,推荐>5G数据量;
肠道微生物或寄生微生物,推荐>10G数据量,由于可能存在宿主RNA的污染需要加大测序量;
建议根据自己的研究目的来选择适宜的数据量。
文章实例
人肠道菌群宏基因组和宏转录组的整合研究
PNAS June 3, 2014 111 (22) E2329-E2338; first published May 19, 2014 http://dx.doi.org/10.1073/pnas.1319284111
研究背景:
本研究利用受试者自己收集的人体多部位样品,进行了第一个结合表型分类学、宏基因组学和宏转录组谱的人类微生物组的研究。
image
结果详细描述了肠道菌群基因组潜能和基因表达之间的关系,论证了在受试者收集和运输的样品中开展宏转录组研究的可行性。
研究结果:
自采集的方法对组学研究的影响很小,可提供有代表性的宏基因组和宏转录组数据。
以KO数据库为参考,最终得到3,292个DNA和RNA相对丰度,并对DNA和RNA水平进行了关联,结果表明基因和转录本的丰度具有良好的相关性。
尽管不同个体间宏基因组的组成保守性较高,但是其在宏转录组水平却有区别,说明存在特异的宏基因组调控模式。
image
图. 不同样本处理方法得到物种组成和基因功能分类具有一致性
Nature子刊:老年男性粪便菌群中的宏转录组
Nature Microbiology
Metatranscriptome of human faecal microbial communities in a cohort of adult men.
2018-01-15 DOI: 10.1038/s41564-017-0084-4
① 收集308名老年男性的粪便菌群,分析372份宏转录组样本和929份宏基因组样本;② 鉴定出了“核心”宏转录组,包括核苷酸生物合成通路、糖酵解及碳水化合物代谢通路、氨基酸合成通路、非氧化戊糖磷酸循环通路等;③ 在“核心”转录组之外,还鉴定出了宏转录组中的“可变”部分,包括长链脂肪酸、萜类化合物、多胺等。
image
Nature子刊:老年男性肠道菌群的稳定性
Nature Microbiology
Stability of the human faecal microbiome in a cohort of adult men
2018-01-15 DOI: 10.1038/s41564-017-0096-0
① 对308名老年男性的粪便菌群进行宏转录组及宏基因组测序分析;② 受试者共提供4份粪便样本,前两份(相隔24-72小时)与后两份(相隔24-72小时)之间间隔6个月;③ 粪便菌群的个体内分类学及功能差异始终低于个体间的差异,但在宏转录组上个体内的差异及个体间差异的程度相似;④ 宏基因组稳定性高于宏转录组,宏基因组不稳定性约占相应宏转录组不稳定性的74%;⑤ 拟杆菌属/链球菌属分别是最稳定/最不稳定的转录组的主要贡献者。
image
END
感谢您的阅读,欢迎点赞、评论、支持和转发!!
image
相关阅读
肠道菌群:16S测序分析流程解读
肠道菌群:宏基因组测序分析流程解读(上)
r语言 转录本结构及丰度_肠道菌群:宏转录组测序分析流程解读相关推荐
- r语言 转录本结构及丰度_桑基图的绘制核心微生物组分类学及丰度展示
为什么要用桑基图 桑基图 (Sankey diagram)是一种展现数据之间流动和相互关系的图像,类似于一种网络图,通过不同层级节点之间的连接以及连接边的宽度,展示数据之间的流动关系. 在微生物群落分 ...
- r语言 转录本结构及丰度_【R语言】数据结构Ⅱ—列表,数据框,因子
四.列表 列表(list),可以包含不同类型的对象,甚至可以包括其他列表.列表的灵活性使得它非常有用. 例如,用R 拟合一个线性回归模型,其返回结果就是一个列表,其中包含了线性回归的详细结果,如线性回 ...
- r语言 转录本结构及丰度_生信实操|一个生信素人的上道经验分享转录组测序(绘图篇)...
转录组测序技术(RNA-seq)作为目前二代测序领域最普遍的技术手段,自从转录组测序问世以来,已经开发了数百种分析工具.根据转录组分析内容可大致将其分析流程分为比对,转录本组装,差异表达分析和差异基因 ...
- 转录组分析_肠道菌群:宏转录组测序分析流程解读
上回给大家讲述了16S测序分析 和 宏基因组测序分析,本期的宏转录组来啦~ 你知道吗?通过16S测序分析 和 宏基因组测序分析,我们只能够知道肠道菌群做好事或坏事的潜力,而并不知道它们此时此刻正在我们 ...
- 使用R语言获得16S物种丰度
还是获得16S物种丰度得老问题,最近在一台新机器上安装qiime1,发现有报错,对于这种停止维护的软件,也是正常现象吧,于是想别的办法解决,恰巧最近读R几本R语言的入门书,发现prop.table() ...
- R语言进行线性回归的拟合度
R语言进行线性回归的拟合度. 本文只是使用 R做回归计算,查看拟合度等,不讨论 R 函数的内部公式 在R中线性回归分析的函数是lm(),基本语法是 一元回归: lm(y ~ x,data) 多元回归: ...
- R语言主成分回归(PCR)、 多元线性回归特征降维分析光谱数据和汽车油耗、性能数据...
原文链接:http://tecdat.cn/?p=24152 什么是PCR?(PCR = PCA + MLR)(点击文末"阅读原文"获取完整代码数据). • PCR是处理许多 x ...
- R语言使用party包中的ctree函数构建条件推理决策树的流程和步骤、条件推理决策树是传统决策树的一个重要变体、条件推理树的分裂是基于显著性测试而不是熵/纯度/同质性度量来选择分裂
R语言使用party包中的ctree函数构建条件推理决策树的流程和步骤(Conditional inference trees).条件推理决策树是传统决策树的一个重要变体.条件推理树的分裂是基于显著性 ...
- R语言data.table进行滚动数据连接,滚动连接通常用于分析涉及时间的数据(例如商业销售活动和对应的广告投放的安排之之间的关系)实战:实战和动画说明滚动数据连接的形式及方法
R语言data.table进行滚动数据连接,滚动连接通常用于分析涉及时间的数据(例如商业销售活动和对应的广告投放的安排之之间的关系)实战:实战和动画说明滚动数据连接的形式及方法 目录
最新文章
- 大数据分布式集群搭建(9)
- Linux文件系统2---VFS的四个主要对象
- (仿头条APP项目)6.点击过的新闻列表文字变灰和下拉刷新与滚动加载新闻数据
- quartz 表说明
- 聊聊spring的ioc
- 利用matlab符号变量进行矩阵乘法公式推导
- day01 Redis
- 计算机毕业设计Java智能超市导购系统(源码+系统+mysql数据库+lw文档)
- 第九届蓝桥杯JavaB组省赛真题
- vue3中的ref 和 reactive 定义数组
- 如何将1万元用到极致?5种方法效果截然不同
- PCIe4.0扩展坞设备
- 《Python语言程序设计》王恺 王志 李涛 机械工业出版社 第2章 Python的基础语法 课后习题答案【强烈推荐】
- Google和facebook登录
- 小豪学Linux——vim文本编辑器与shell脚本
- 移动适配(引入js知识)
- 计算机七年级知识点,七年级信息的技术演示课件——计算机与信息的技术基本知识点.ppt...
- Mac OS平台上全世界上最广泛使用的扫描仪驱程序,能够随时随地为旧的扫描仪创建驱动程序
- 计算机辅助语言学,计算机辅助语言教学的历史发展与前景展望.pdf
- 博弈六子棋安徽省2020省三源码
热门文章
- 怎样检测微信好友是否删除了你!安全无痕零打扰!
- SPEC文件参数查阅
- 第九章计算机网络技术与应用作业,08-09《计算机网络技术与应用(第一章).ppt
- IDEA学习记录(二)-win10 常用设置篇Appearances Editors部分-(版本:2020.2.4 x64)
- 新计算机设置,请问新电脑怎样设置BIOS????
- 生成法线贴图的几款软件和轻量法线效果查看小工具
- [附源码]SSM计算机毕业设计超市收银系统JAVA
- NLP实战:使用机器/深度学习做文本分类
- T-C3D 实时行为识别时序卷积网络
- 【Kevin Learn QMUI】-->QMUILinkTextView