欢迎关注微信公众号生信宝典:https://mp.weixin.qq.com/s/Kx0gaU2x4pWjBq2I2Ffe6Q
转录组分析是目前应用最广的高通量测序分析技术之一。常见设计是不同样品之间比较,寻找差异基因、标志基因、协同变化基因、差异剪接和新转录本,并进行结果可视化、功能注释和网络分析等。

转录组的测序分析也相对成熟,从RNA提取、构建文库、上机测序再到结果解析既可以自己完成,又可以在专业公司进行。概括来看转录组的分析流程比较简单,序列比对-转录本拼接 (可选)-表达定量-差异基因-功能富集-定制分析。整个环节清晰流畅,可以作为最开始接触高通量测序学习最合适的技术之一。

但重点和难点在于理解这些过程都是怎么做的,有什么需要注意的,结果怎么解读,后续分析怎么做。这些只有自己动手操作过,才可能有理解。而理解了一个,再去做其它类型分析,也会轻松很多。

实验设计这块重要的是对照和至少3个生物学重复,并选择合适的测序通量。ENCODE要求重复之间的Spearman correlation值大于0.9 (遗传背景不一致的生物重复相关系数要大于0.8)。定量基因表达和评估转录图谱相似性只需要中等测序深度;而研究新转录本和可变剪接则需要更深的测序;一般来讲长RNA-seq文库测序深度满足可用reads20-30 million (如果测PE150,换算成碱基数为6G-9G)。

另外一个需要注意的是测序的批次效应,保证自己的样品同时处理、RNA同时提取、同时构建文库和上机测序。这些环节虽然不能总受我们控制,但记录下对应的操作时间和批次,最后在绘制表达图谱时与实验相关参数进行关联展示,从而保证结果没有受到试验中处理批次的影响。ENCODE计划有一篇文章在比较人和小鼠不同组织的表达谱相似度时得到的结果是样品按物种而非组织聚在一起,这与之前认为的发育通路的保守性不符。后来发现是测序批次捣的鬼,做了批次效应矫正后,表达图谱按组织而非物种聚在一起了。

测序环节通常不需要自己操作,测序公司都很成熟,但测序的原理需要知道。这会影响到后续分析时参数的选择,比如知道什么是插入片段大小,什么是链特异性测序,什么情况会有接头序列,双端测序如何测等。

获得数据后,就涉及到数据的传输和质量评估(也包括如何从公共数据库下载数据)和文件格式的转换。FASTQ格式解释和质量评估中有些提及。质量评估的意义在于从测序质量角度评价建库和测序的成功与否,指导接头和低质量碱基的去除。这一步参数控制的严格与否对后续的比对会有影响,同时也会受到后续分析选择的工具的影响。对Linux系统一定程度的了解,是进行这些工作的基础。

39个转录组分析工具,120种组合评估(转录组分析工具哪家强)中讲述了如何选择、评估合适的比对工具,序列拼装工具,定量工具和差异分析工具。值得我们在进入正式的分析之前,仔细阅读。另外类似的评估文章,还有几篇,都可以一并读一下,这样在后期分析时对工具的选择和使用才更得心应手。

工具比较类文章一般只告诉你做了什么,不告诉你这么做的原因是什么,而且每一步细分开来又有很多小细节需要注意,比如在比对环节就会涉及到:不同的样本如何选择合适的基因组和注释文件,什么样的软件支持Junction reads的比对,什么样的比对率是合适的,比对质量怎样,测序中RNA有无降解或选择偏好性,测序饱和度如何等。

这些可能都不会体现在最终的结果中,但都是确保后期结果可靠性所必须要做的事情。2002年诺贝尔奖得主Sydney Brenner曾对数据分析做过提醒Garbage in, Garbage out。软件是死的,提供了格式正确的输入,就可以得到输出,但输出正确与否,就得靠人的经验来判断了。

在后面的差异基因鉴定阶段,还存在把FPKM值转换为整数再提交给DESeq2做分析的,软件不报错,但结果不对。或者能顺着教程运行DEseq2分析,但换成自己的数据就不知道如何下手的。这些问题都需要在实践过程中持续不断的试错、的文章和教程来步步矫正。这当然是一个耗时耗力的过程,那么有没有一个更好的方式呢?

生信宝典团队经过紧张的筹备,决定推出一系列的针对生信学习和高通量分析的学习小组(在生信学习系列教程的基础上进一步拓展和深入),跟大家一起去走过这段历程。我们的口号是易生信,毕生缘,希望能通过短暂高强度的训练快速推进大家在生信分析领域的进展。

但生信学习是个缓慢的过程,需要教、学、练、改不断的循环。我们希望能通过系列课程,再加上三段式培训模式集中讲解实战(2天)-自行练习(5天)-再讲解答疑考核(2天)跟大家一起探索如何尽可能快的学会生信,学到可以自己做,有问题自己可以解决的程度。点击阅读原文可查看详细信息。

再强调下,培训时间是2017年11月4日、5日、11日、12日。培训地点是北京,点击阅读原文可查看详细信息。

欢迎大家咨询、报名和提出建议 (报名网址: http://www.ehbio.com/Training)。

生信宝典: http://mp.weixin.qq.com/s/d1KCETQZ88yaOLGwAtpWYg

生信宝典,生物信息学习系列教程,转录组,宏基因组,外显子组,R作图,Python学习,Cytoscape视频教程

http://mp.weixin.qq.com/s/d1KCETQZ88yaOLGwAtpWYg

生信宝典,最好的生物信息培训课程,培训课程资料

www.ehbio.com/Training

转录组分析的正确姿势相关推荐

  1. 转录组分析_转录组分析的正确姿势

    转录组分析是目前应用最广的高通量测序分析技术之一.常见设计是不同样品之间比较,寻找差异基因.标志基因.协同变化基因.差异剪接和新转录本,并进行结果可视化.功能注释和网络分析等. 转录组的测序分析也相对 ...

  2. 2021年最后一期 | 转录组分析的正确姿势你了解了吗?

    转录组分析是目前应用最广的高通量测序分析技术之一.常见设计是不同样品之间比较,寻找差异基因.标志基因.协同变化基因.差异剪接和新转录本,并进行结果可视化.功能注释和网络分析等. 转录组的测序分析也相对 ...

  3. 转录组分析的正确姿势你了解了吗?

    转录组分析是目前应用最广的高通量测序分析技术之一.常见设计是不同样品之间比较,寻找差异基因.标志基因.协同变化基因.差异剪接和新转录本,并进行结果可视化.功能注释和网络分析等. 转录组的测序分析也相对 ...

  4. 节后开课 | 转录组分析的正确姿势你了解了吗?

    转录组分析是目前应用最广的高通量测序分析技术之一.常见设计是不同样品之间比较,寻找差异基因.标志基因.协同变化基因.差异剪接和新转录本,并进行结果可视化.功能注释和网络分析等. 转录组的测序分析也相对 ...

  5. 使用R语言的正确姿势,R包干货奉献

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.在线绘图.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞 ...

  6. 开发函数计算的正确姿势 —— 爬虫

    2019独角兽企业重金招聘Python工程师标准>>> 在 <函数计算本地运行与调试 - Fun Local 基本用法> 中,我们介绍了利用 Fun Local 本地运行 ...

  7. 自学python需要买书吗-学习Python的正确姿势—基础教学,教科书该怎么买?

    学习Python的正确姿势-基础教学,教科书该怎么买? 2019-05-07 18:52:46 23点赞 377收藏 4评论 写在前面: 四月读书季,京东图书大促销,赶上优惠的尾巴,抢购了几本心水很久 ...

  8. 如何自学python数据分析-良心整理!学习Python数据分析的正确姿势

    学习 Python 数据分析的正确姿势 如果你是通过学习给程序员设计的 Python 课程来学习 Python 数据分析,那就大错特错了.很多数据分析师在开始学习 Python 数据分析之前就被引导学 ...

  9. 在副业刚需的时代,如何掌握副业的正确姿势?

    前言 近期,伴随着"副业刚需"这个词语的流行,关于"职场人要不要发展副业"的话题再一次被炒得沸沸扬扬. 有人认为副业是刚需,是抵御中年危机的锦囊妙计,甚至是中年 ...

最新文章

  1. FetchType.LAZY和FetchType.EAGER什么区别
  2. Docker入门 - 005 Docker 容器连接
  3. CDH集群异常处理ERROR  Failure due to stall on seeded torrent.、重装时hdfs提示目录已存在、CDH重启不正常
  4. 记录一次docker项目连接不上docker mysql的问题
  5. Xilinx Zynq-7000 嵌入式系统设计与实现
  6. 根据条件控制参数控件是否显示(可用)
  7. 7的整除特征 三位一截_「每周一课」数字和除号握手言和,来攻克整除问题
  8. utf8转gb2312 c语言,UTF-8, Unicode, GB2312格式串转换之C语言版
  9. Hammer.js分析(四)——recognizer.js
  10. 关于URL大小写问题
  11. 21天学通C语言-学习笔记(11)
  12. 玩游戏显示计算机内存不足怎么办,电脑魔兽世界内存不足怎么办
  13. iOS开发,第三方应用微信授权登录,获取微信unionid
  14. matlab生成范德蒙矩阵
  15. 全栈工程师需要了解掌握的技术栈
  16. Oracle11g64位安装教程
  17. 计算机三级网络技术最全知识点总结六
  18. 重庆电信助力新一代物联网商用平台
  19. nacos启动报错解决方法
  20. RestFul简介和使用

热门文章

  1. bootstrap再抽样_【机器学习】Bootstrap详解
  2. python 02随笔
  3. 2014网络最有实力的十大红人与网络十大红人资料(全网公正)全网转载!
  4. 王伦便起身把盏 加密软件
  5. 各类自编码器的区别(未完)
  6. 可替代角雷达,这款纯固态补盲激光雷达什么来头?
  7. 通俗易懂的理解 python 装饰器
  8. 【重磅】AlphaZero炼成最强通用棋类AI,DeepMind强化学习算法8小时完爆人类棋类游戏...
  9. android6如何支持NFC,小米6有NFC吗?小米6支持NFC功能吗?
  10. 有人用苹果吗?20个出色的 Safari 插件