3分和30分文章差距在哪里?
好的分析和可视化,可以提供大量的信息,同时兼顾简洁优雅。
今天我们抛开实验设计、方法和工作量等因素,仅从文章最吸引人的图片来讨论3分和30分(顶级)文章差距在哪里?
以2017年8月25日发表在Sciences杂志上的封面文章为例,简介顶级文章的图版设计、组合、展示方式,再顺便回想一下您读过的其它文章,尤其是3分级别文章,那差异不言而喻。
此篇Science正文仅有3幅图,但却准确传达了作者多年研究的精华成果,让我们带大家解读一下顶级文章中一图顶千字的妙用。
图 1. 哈扎人肠道菌群随季节变化
本图主要基于16S扩增子测序结果,从组间整体差异,不同时间点各分类学、OTUs种类角度,展示哈扎人肠道菌群随季节变化的特性。
本图有13个子图分为6组,从6个不同的研究角度、分析方法和展示方式来对本图主题进行说明。
(A) PCoA散点图+箱线图:基于无权重UniFrac距离的PCoA展示5个季节间样品的差异,可以看出不同季节间菌群在 PCoA2 轴存在变化,且随时间周期循环,颜色选用蓝、绿、紫即柔和又容易区分,并添加组主体置信椭圆背景色和95%置信区间虚线方便读者观察各组全貌和比较组间主体区别;右侧添加箱线图展示在PCo2轴上旱季和雨季分布存在显著差异,而两个旱季间无显著差异,同时添加拟合曲线突出周期变化的规律;
(B) PCoA+时间序列散点图:B图上部从科水平基于Bray-Curtis距离
进行PCoA分析,展示哈扎人和现代人区别;下部在PCoA1轴上再按季节时间顺序分组展示哈扎人菌肠随季节每年周期变化的规律;
(C) 流图 (一种堆叠面积图):各菌门中OTUs累计数量随季节变化(至少在10%样品中检测到的OTUs才用于分析)
(D) 桑基图:拟杆菌门、厚壁菌门OTUs在不同季节中物种动态变化;随着时间变化 ,哪些OTUs保留或消失,哪些新来的,以及在每个阶段中的变化。
(E) 线性判别分析 (LDA,一种限制性排序分析)展示按季节分组最大贡献的OTUs;
(F) 热图展示所有样品在不同季节不同科中OTUs丰度变化,即体现组内样品间重复性,又展示组间的周期变化的差异和规律。
点评:B图上部PCoA中为什么选择科不是OTUs,我估计作者应该是目、科、属、种、OTUs级别都分析过,只是科分类结果更好;PCoA下部时间序列散点图添加拟合,这种展示方式都是根据结果总结归纳,再选择合适的图形展示方式突出结论;C/D图把工业的stream graph
和sankey diagram
都使用上了,将艺术与生物规律完美结合,可见参与本文可视化的同行绝对是本领域中的顶级团队。很多优秀的顶级文章,一般也是由两、三个顶级团队优势互补的结果。
图2. 哈扎人肠道菌群功能随季节周期循环
本图主要基于宏基因组测序碳水化合物代谢基因的种类、丰度进行分析,揭示哈扎人菌群功能周期的变化和与现代人的差别。
本图有8个子图分为5组,从5个不同的角度主题进行说明。
(A) 箱线图展示宏基因组CAZYome
基因Shannon多样性按季节变化和与现代人比较;
(B) PCA分析CAZYome表明哈扎人与现代间此类基因显著差异即为样品间主要差异;
(C) 动植物碳水化合物/粘多糖占CAZYome中比例在哈扎人和现代人间存在显著差异;
(D) 几种CAZymes丰度在哈扎人中周期变化,以及与现代人比较
(E) 抗生素抗性基因多样性,哈扎人低于现代人,且存在季节周期变化
点评:宏基因组中从整体到类别,可分析的结果很多,但结果是用于服务科学问题和故事主线的。其中饮食的不同,主要影响碳水化合物的比例和组成,以及抗性基因的种类和丰度。因此选定好的逻辑出发点和故事主线是高水平文章的重点,这个别人很难帮你。但你有了好思路,找技术达人合作或与课题负责分析的朋友沟通,那是水到渠成和锦上添花的事,即使花费大量时间去美化都是值得的。当然也可自学差异箱线图绘制。
图3. 不同地区人肠道菌群样式与生活方式相关
哈扎人与HMP 16S扩增子公共大数据的比较,进一步强调大尺度上的国家、年龄与菌群的关系。
一张PCoA结合国家、年龄和主要细菌科在1/2轴上分布关系的讨论,证明想要表达的环境因素与菌群结构间的相关程度。
(A) 主图为基于Bray-Curtis距离的PCoA;上图为PCoA1轴坐标按地理分组绘制箱线图并排序,展示地区不同生活方式是菌群差异的最主要因素;左图为PCoA2轴坐标按年龄分组,尤其是存在有婴儿数据与成人差异较大要特别注意。
(B) 密度图展示7大菌门在PCoA1轴上样品的累计密度,可以观察数据分布模式,如单峰,双峰等,用于指导分型和进一步挖掘规律。
点评:(A) PCoA和箱线图在本领域最常用,想要展示传递丰富信息得靠你的科学问题和实验设计,具体绘图和组合的技术障碍,可以在培训班中解决。(B) 分布密度图在转录组、表观组学中极常用,但在微生物组中很少使用,本文将其巧妙的用于展示分类学沿PCoA1轴上分布,与上图顶部中地区分布相遥相呼应,设计之精巧让令我们这群十年生信老司机都十分佩服。
点评
其实此文的样本量并不大,作为时间序列研究仅有一年五个时间点共350个样品,时间点和样本量都比较少;科学问题也不够新颖,因为哈扎人肠道菌群与现代人的差异,早在2014年《Nature Communication》上己经发表,而且当时还测了代谢组。本文特点是研究时间跨度更大,主要发现是肠道菌群随季节的变化,这在现代人中也是很难观察到的(可能多年前北方冬季纯靠储存土豆白菜过冬时,我的肠道菌群季节变化也很明显)。更大的亮点在于,作者在结果的呈现上也是蛮拼的,在逻辑的框架上与图形艺术组合,使简单的结果瞬间B格满满,让广大同行清醒认识到自己离顶级文章的差距有多大。
样品都是13年3月至14年9月采集的,直到17年4月19日投稿,项目从采样至投稿历时超过5年,其中样品测序和数据分析也近4年,现在呈现在我们面前的结果一定是经历上百次反复计算和优化而来的,可以想像作者们为这个项目花费了多少精力了心血。
Reference
Samuel A. Smits, Jeff Leach, Erica D. Sonnenburg, et al. Seasonal cycling in the gut microbiome of the Hadza hunter-gatherers of Tanzania. Science 25 Aug 2017:http://science.sciencemag.org/content/357/6353/802
Schnorr, Stephanie L., Marco Candela, Simone Rampelli, Manuela Centanni, Clarissa Consolandi, Giulia Basaglia, Silvia Turroni et al. “Gut microbiome of the Hadza hunter-gatherers.” Nature communications 5 (2014). https://www.nature.com/articles/ncomms4654?WT.ec_
福利
如果您的文章结果,也能用上文这么清楚的思路和和高大上的展示方式呈现,还愁不能在众多高分文章中轻松脱颖而出吗?
如果你还不会分析,可以参加我们与2019年1月和3月在北京鼓楼举办的《扩增子/宏基因组分析专题培训》,助力你把握分析思路,亲自实战分析,学会自己动手在大数据中挖掘科学问题的答案。
同时保证你十几种常见统计绘图轻松上手,即有我们开发的在线平台绘制,鼠标点选即出图;更提供R语言绘图实例和代码,让你轻松活学活用,进一步随心所欲,满足你绝大多数结果展示需求。
为什么要参加生信培训
学知识,更学经验;解决问题,更会如何解决问题。
自己科研项目有需要
公司分析虽然简单,但有时总不能对自己的胃口,一来定制分析费用贵,二来知识信息不对称,沟通成本高。不如自己学一下,无论是自己处理数据,还是跟跟公司沟通都会更方便,更有效率,合作也会更愉快。想要快速生信入门
生信之所以入门难,是因为涉及知识面广。自学周期长,老板又催的紧,远不能满足课题进度。培训跟着老司机走干道,3天学会自己需要半年摸索的经验,这个投入相比节省的时间,是很划算的。成为团队中不可或缺的人
无论是升学、出国、找工作,生物人才一抓一大把,但生信分析人才紧缺。多一份能力,多一个机会。而且掌握生信技能展开广泛合作是最容易成为核心成员,与团队粘性增强的重要方式。
我们的优势
实战派专家
讲师主要来自中科院百优博士、海内外博后,目前就职于科技公司CTO、中科院技术平台科学家,一线分析人员,人均30个以上近10年项目经验。真正解决你科研中的技术困难。不要再听那些大牛的讲座和培训了,满满的套路讲自己的文献,而不是怎么操作,结果回来后发现什么也干不了——成功学思路害人不浅: 不经实战的成功学思路对初学者都是耍流氓。强大的助教团队
我们拥有10余名中科院、清华、北大、中大、协和以及海归博士和博后。基础差跟不上,有一对一助教;培训后,有专享视频反复学。真正的售后保证
之前很多的培训班我也参加过,参加就真没有然后了。我们坚持只要认真学,就包教包会的原则,培训一个月内提供随时问题解答,学员终身专享论坛提供技术支持。绝佳的地理位置
培训地点是北京鼓楼——首都的二环里,背靠鼓楼面朝后海,周边无数的历史文化遗迹,对学员来説不仅是自身技术的蜕变,还有文化的洗礼。
我们的课程
转录组和R作图两期培训班已经结束
R培训现场,教室宽敞明亮,每人一张大桌。后台回复培训有惊喜哦。
助教1对1指导,图中两位助教分别为北大本科海归博后和清华博士。
目前可以报名的课程:
微生物多样性扩增子分析
手把手教你分析微生物多样,windows, mac,linux统统可以用起来,结果可视化水平向CNS看齐,宏基因组团队骨干全程参与,即是对本领域系统学习的好机会,更是实战技术交流的盛宴。宏基因组数据分析
海量数据无从下手,依托“宏基因组”公众号十余名核心技术骨干,带你从科学问题出发,在数据中海洋中开启淘金之旅。
更多课程的详细介绍,请扫描下方二维码。
复制以下链接
http://www.ehbio.com/Training/ 或
点击阅读原文跳转报名页。学会数据分析,成为实验中不可或缺的人,赶快报名吧!
3分和30分文章差距在哪里?相关推荐
- 微生物组:3分和30分文章差距在哪里?
好的分析和可视化,可以提供大量的信息,同时兼顾简洁优雅. 今天我们抛开实验设计.方法和工作量等因素,仅从文章最吸引人的图片来讨论3分和30分(顶级)文章差距在哪里? 以2017年8月25日发表在Sci ...
- cron表达式 每天0点10分和30分_“提前2小时下班”:学会这10个函数,办公效率提升了10倍!...
✎ 大家好,我是雅客. 今天给大家分享10个非常好用的函数,这几个函数都是我们精挑细选出来的,掌握这些函数,可以帮你提升10倍的工作效率,从此下班提前2个小时不是梦想! 01 VLOOKUP函数 根据 ...
- cron表达式 每天0点10分和30分_揭开考研阅卷的内幕,注意这些多得20分!
戳上方"云逸未来"↑星标/置顶哦 六大工作组审核流程 考研统考科目实行集中统一阅卷.自命题科目试卷一般由报考院校专业导师命题,也由该院校相关院系老师阅卷:统考科目阅卷工作一般是 ...
- cron表达式 每天0点10分和30分_查找特定时间段cron任务方法
查找特定时间段cron任务方法 今天有个同学问:"如何查找特定时间段的cron调度任务?", 这类问题通常是维护中经常遇到的,例如: 生产系统升级时,比如0点生产业务处理任务停止, ...
- 计算机专业联考335分,联考专业分、文化分达到多少能过本科线(附2019年美术高考分数线汇总...
原标题:联考专业分.文化分达到多少能过本科线(附2019年美术高考分数线汇总 说明:2019年美术高考录取分数线含美术类各批次文化控制线.专业控制线,美术统考合格线. 控制线指的是,您达到了某个批次的 ...
- 高考540分计算机,一线老师告诉你:高三后期这么做,3个月提高30分真不难!
有同学问:高三下学期,文科生想把成绩从540分提升到570分,你觉得可能吗?有什么好建议? 作为一名长期奋战在高考一线的班主任,我可以明确说"完全可能,而且没有难度! 为什么我敢这么肯定的回 ...
- PAT甲级1038 Recover the Smallest Number (30 分):[C++题解]贪心、排列成最小的数、字符串
文章目录 题目分析 题目来源 题目分析 来源:acwing 分析: 贪心: 对于字符串a和b,如果 a+b < b+a (这里+代表字符串中的连接)代表字典序更小.举例 a = 321 , b ...
- PAT甲级1147 Heaps (30 分):[C++题解]堆、树的遍历、dfs、完全二叉树建树
文章目录 题目分析 题目来源 题目分析 来源:acwing 分析:给定完全二叉树,判断是否是堆,需要区分大根堆,小根堆.后面是输出后序遍历. AC代码 #include<bits/stdc++. ...
- PAT甲级1076 Forwards on Weibo (30 分) :[C++题解]图论、bfs
文章目录 题目分析 题目来源 题目分析 来源:acwing 分析: BFS如何搜前k层?统计前k层的点数. ac代码 #include<bits/stdc++.h> using names ...
最新文章
- 免费公开课报名 | 达观数据个性化推荐系统实践
- 十年学术生涯新开端:港中文助理教授周博磊宣布加入UCLA
- python 公钥解密
- 以消费者为中心 第四范式为企业转型准备“专属服务系统”
- SVN学习总结(1)——SVN简介及入门使用
- 为什么乱码:meta http-equiv=content-type前的非ANSI字符
- ASP.NET,IE6下URL中文乱码问题
- 技术思考:也谈知识图谱平台中的数据流程与构建范式思考
- 题解 [SHOI2014]概率充电器
- 小米平板5系列共三款机型:全系搭载2K/120Hz屏幕
- 火柴人小程序linux,火柴人手绘小程序
- ThinkPHP自定义错误页面
- vivo的Android升级包,【原厂固件】vivo y66ia系统升级rom刷机包_卡刷包_PD1621B_A_1.9.6...
- 固定成本、可变成本、沉没成本、机会成本
- Unity Shader - 基础光照之漫反射
- 数据分析之乳腺癌预测
- 从零开始搭建服务器之登录和登出远程服务器
- java @around_解决@Around对静态方法不生效的问题
- 英语磁带与计算机磁带区别,鸡肋一般的英语磁带
- 昨天只搞懂了一点关于模板的冬冬
热门文章
- 计算机计算能力,计算机/电脑为什么拥有计算能力
- Qt rviz 机器人
- Hadoop安装配置,并使用Hadoop计算圆周率测试Hadoop是否安装成功
- 客户机不能看到分配的dhcp_交换机配置DHCP后下挂用户获取不到IP地址或者获取缓慢...
- 04Strategy(策略)模式
- C# 中的Async 和 Await 的用法详解
- C#截取屏幕保存图片
- 免费送书啦!《 OpenCV图像处理入门与实践》一本全搞定
- ​HOG特征也可以作为图像重建的目标!FAIRJHU提出新的one-stage自监督预训练模型MaskFeat!...
- Transformer 眼中世界 Vs. CNN 眼中世界