题目 & 作者

有两篇介绍该软件的论文,一篇是2018年的,第二篇是2022年的。第二篇主要是对软件使用流程的详细介绍。

  1. emClarity: software for high-resolution cryo-electron tomography and subtomogram averaging
    Benjamin A. Himes, Peijun Zhang(通讯)
    2018,Nature methods
  2. High-resolution in situ structure determination by cryo-electron tomography and subtomogram averaging using emClarity
    Peijun Zhang(通讯)
    2022,Nature Protocols

首先是第一篇论文的大致内容:

摘要

大分子复合物本质上是柔性的,通常很难通过单粒子低温电子显微镜(cryo EM)纯化以确定其结构。这种复合物可以通过低温电子层析成像(cryo ET)结合子断层对齐和分类进行研究,在特殊情况下可以达到亚纳米级分辨率,从而深入了解结构-功能关系。然而,将这种方法应用于表现出混杂或成分异质性或丰度较低的样本仍然具有挑战性。

为了解决这个问题,本文开发了emClarity(wiki),这是一个GPU加速的图像处理软件包,其特点是一种迭代层析倾斜序列优化算法该算法使用子断层图作为基准标记,以及一种3D采样函数补偿的多尺度主成分分析分类方法。我们证明,与目前最先进的软件相比,我们的方法在分辨率和大分子复合物不同功能状态的分离方面有了实质性的改进。

本文将精力集中在那些可能产生最大改进的图像处理领域:倾斜序列对齐的准确性,改进的散焦测定和对比度传递函数(CTF)校正,各向异性分辨率的显式处理,以及更稳健的分类。

Results

emClarity workflow

如图所示,新的功能由红色文字标出。

Step 1. input data

原始数据用的是倾斜序列和它的对齐参数的初始估计(使用 IMOD 得到)。

Step 2. tomogram WBP & template matching with 3D interactive editing.

受分辨率限制,用传统的加权背投影足以重建初始tomograms,不需要CTF矫正。

Step 3. 3D-CTF-corrected WBP

为了校正沿光轴的散焦梯度(样本厚度),emClarity使用了一种简单版本的散焦梯度校正反投影。该方法最近得到验证,并更名为3D-CTF correction。为了平衡精度和实际计算时间,emClarity根据当前分辨率和离焦确定可接受的厚度。对于这种厚度的每块板,我们将功率谱变白,乘以确定的CTF,并根据累积电子剂量进行过滤。对于倾斜图像,从全图像的傅里叶逆变换乘以相应的CTF中提取与当前接受的离焦相对应的宽度条带。

Step 4. subtomogram averaging, CTF amplitude correction, and anisotropic spectral SNR weighting.

emClarity 中的迭代对齐过程在使用当前估计方向的子断层图平均和缺失楔约束的互相关网格搜索之间交替。 除了数据量之外,还获得了“3D 采样函数”的平均值,这类似于加权 3D CTF 模型。 另外考虑了在断层图像重建期间应用的 R 加权。 为避免与“3D-CTF correction”混淆,称之为“3D sampling function”。

Step 5: 3D-sampling-function-compensated iterative refinement of subtomogram alignment.

冷冻电镜中常用的迭代细化程序容易出现噪声拟合的错误,称为过拟合。 为了最大限度地减少过度拟合,emClarity 将数据从一开始分成两半,在优化过程中保持分开,采用所谓的黄金标准方法。

此外,约束搜索中使用的参考会经过仔细过滤。 在每个循环中,平均值的光谱 SNR (SSNR) 由 FSC 估计。 然后,通过我们对重建后体积归一化单粒子维纳滤波器的适应,将源自该 FSC 的 figure-of-merit weighting 与 CTF 幅度恢复相结合。 这种适应涉及对信号分布中的方向各向异性的明确说明。

迭代过程是一种局部细化,它改进了在模板匹配期间获得的初始全局对齐。 我们将嘈杂的粒子旋转回显微镜参考框架中,以与参考体积进行互相关; 这允许将对称性应用于粒子,从而提高方向搜索中的 SNR。 这在 SPA 中是不可能的,其中粒子是一个投影,并且参考必须旋转到粒子的方向,据我们所知,它没有在任何其他 subtomogram 平均包中实现。

Step 6: iterative refinement of tilt-series alignment

emClarity 通过使用子断层图作为基准标记来实现倾斜系列对齐的迭代细化,称为tomoCPR 过程。这类似于在 RELION 中 SPA 的“particle polishing”,但有两个主要区别。

首先,为细化原始倾斜系列中子断层图基准标记的位置而生成的参考投影包括来自相邻粒子的信息,以及断层图中存在的非粒子信息。

其次,tomoCPR 约束空间上邻近的粒子,以便它们在给定的投影中表现相似,就像在 SPA 中一样,同时还要求它们作为一个组通过倾斜序列从一个投影到另一个投影平滑变化。一组图像变换(位移、平面内旋转、倾斜角和放大倍数)适合重叠斑块的网格,每个斑块包含固定数量的粒子,由总分子量决定。使用 IMOD 的 Tiltalign 解决了将给定补丁中所有基准点在所有投影上的误差最小化的单组图像转换。由于补丁显着重叠(0.75),图像变换在相邻粒子上平滑变化。

Step 7: 3D-sampling-function-compensated classification

可以通过在平均结构上叠加 3D“方差图”来可视化数据集中存在显着差异的区域。缺失楔会产生特定于样品中每个粒子方向的伪影,但不一定与其身份或构象有关。如果不进行校正,这些伪影会掩盖粒子之间有意义的差异,从而导致整个数据集的扩散方差。
先前展示的一种通过使用称为楔形掩蔽差异的二进制掩码来估计丢失楔形影响的技术被证明是一种很好的一阶校正。然而,当考虑更高分辨率的特征时,该模型的准确性会下降。

为了在分类中提供更高分辨率的信息,我们用 3D 采样函数替换了这个二元楔形掩模,这导致了对缺失楔引入的伪影的更准确估计。值得注意的是,这不会“填充”任何缺失的数据;相反,它通过粒子的 3D 采样函数扭曲当前的子断层图平均值来估计给定粒子的外观,并根据该预期值与观察到的粒子之间的差异进行聚类。

Step 8: multi-scale clustering

我们通过在生物学相关的长度尺度上引入体素间相关性来编码先验生物学信息,例如~10 Å 用于 α-螺旋密度,18-20 Å 用于 RNA 螺旋或小蛋白质结构域,~40 Å 用于较大蛋白质 域。 我们通过使用带通滤波器选择给定长度尺度的特征来实现这一点。 使用原生 MATLAB 函数 SVD 在每个长度尺度上运行奇异值分解,然后将描述每个长度尺度的最大方差的奇异向量连接成特征向量以进行进一步的聚类。 虽然这种方法与其他领域应用的多尺度、多变量统计分析的现有思想相似,但由于 emClarity 同时考虑了每个长度尺度,它能够提供对特征空间的更丰富的描述。

Discussion

我们创建了一套图像处理程序,并将其整合到emClarity程序中,与当前最先进的方法相比,该程序在对齐和图像恢复方面显示出了更高的精度。我们的目标是使 emClarity 尽可能易于使用,将用户指定的参数限制为普通显微镜和数据收集信息,以及粒子半径和质量的估计。用户还必须选择角度搜索范围,这在将来可能会有所改进。

我们通过将楔形差异校正多尺度聚类相结合,展示了一种在缺失楔效应情况下进行图像分类的强大方法,这有助于为聚类算法编码生物相关信息。除了用较小的种群分离出分辨率良好的类平均值,并在能量场中找到附近的最小值外,我们的方法还产生了精确的3D方差图。

因为它突出了动态行为的关键区域,所以对直接分析和互补生物物理实验的设计有用。虽然分类方面的这些进展尚处于预处理和降维阶段,但未来探索模式识别和机器学习中的现代方法的工作可能会使该技术得到实质性的改进。

Methods

Datasets

EMPIAR-10045:80S ribosome
EMPIAR-10064:mammalian 80S ribosome
EMPIAR-10164:HIV-1 immature Gag

Programs

命令行形式运行。
注:emClarity 目前是没有 GUI 的。


下面是第二篇论文的一些改进和补充:

Introduction

emClarity 中实现了几个关键功能。

  1. 估计了倾斜序列内每个倾斜图像的散焦和散光,以计算对比度传递函数 (CTF)。然后在断层图像重建期间校正图像的 CTF 调制效果,考虑景深。
  2. 为了在对齐、重建和分类期间进行准确加权,emClarity 计算 3D 采样函数 (3DSF)。每个子断层图像的 3DSF 解释了丢失的楔形信息,在处理的每个步骤中都会更新并用作权重。
  3. 为了解决样本异质性问题,emClarity 实现了基于多尺度 3DSF 加权、主成分分析 (PCA) 的分类方法,允许用户强调不同长度尺度的特定特征。
  4. 局部标本运动和变形对 STA 重建的质量造成重大限制。 emClarity 实施了断层图像约束投影细化 (tomoCPR),通过使用子断层图像作为基准标记来细化样本中的局部位移、旋转和放大变化。这改善了倾斜系列对齐,特别是对于从低温聚焦离子束研磨薄片记录的原位 cryoET 数据集,其中使用金珠基准没有意义,因为它们会在研磨过程中被移除。

基本流程:

Prerequisite

  1. 了解 Etomo 中的 fiducial based alignment;
  2. 了解 PCA 和常用的聚类算法,对在进行 subtomo 分类时有用;
  3. 提供了一个教程,以 EMPIAR-10303 为例进行分步处理。

limitations:

emClarity 使用了模板匹配的挑颗粒算法,需要用户使用模板,建议使用低通滤波后的模板来减小模板bias。

也可以使用 Dynamo、PEET 生成初始模板。

建议对齐原始倾斜序列时,使用 emClarity autoAlign 或 Etomo、AreTomo,tomoCPR 的结果有时可能不好。

Materials

环境要求

GPU 内存 >12 GB
CUDA > 9

Input data

  1. raw tilt series
    原始图像需要做 motion-correction,但不用曝光加权,这由 emClarity 内部处理。 倾斜系列中的运动校正图像应按倾斜角度的顺序排列,例如,从 -60° 到 60°。 倾斜序列可以使用 Etomo 等外部软件包进行对齐并导入到 emClarity。 用户还可以导入原始倾斜系列并使用 emClarity 自动对齐。
  2. metadata
    显微镜成像条件:电压、像素大小、离焦范围、幅度对比度和 Cs
    数据收集方案(倾斜序列中图像采集的顺序和曝光剂量)使用参数文件来管理输入,通常命名以反映其功能和周期。

References

温馨指路:

The emClarity software :wiki
The tutorial documentation:tutorial


Author:ChierAuthor: ChierAuthor:Chier

【冷冻电镜|论文阅读】emClarity:用于高分辨率冷冻电子断层扫描和子断层平均的软件相关推荐

  1. 【冷冻电镜|论文阅读】子断层平均 M 软件解读:Multi-particle cryo-EM refinement with M

    题目&作者 Multi-particle cryo-EM refinement with M visualizes ribosome-antibiotic complex at 3.5 Å i ...

  2. <论文阅读>用于 3D 点线和平面的视觉惯性里程计框架 A Visual Inertial Odometry Framework for 3D Points, Lines and Planes

    被疫情包围了!在家多看看论文吧- 论文地址:A Visual Inertial Odometry Framework for 3D Points, Lines and Planes [摘要]:恢复连续 ...

  3. 【论文阅读】用于自动中文作文评分的多阶段预训练

    摘要 这篇文章提出了一个基于预训练的中文作品评分方法.方法包含3个成分:弱监督预训练,有监督的交叉提示(cross-prompt)微调 和 有监督的目标提示(target-prompt)微调. 一个文 ...

  4. 【论文阅读】用于代表单个树木的机载LiDAR 3D点云针叶树/落叶分类的深度学习

    Deep learning for conifer/deciduous classification of airborne LiDAR 3D point clouds representing in ...

  5. 【冷冻电镜】RELION4.0之subtomogram对位功能源码分析(自用)

    源码地址 relion源码指路(注意选择4.0版本的branch). 对 subtomo averaging 我也还有很多疑惑,还在摸索期,如有任何问题,欢迎大家私信交流,祝大家科研顺利~ What' ...

  6. 【论文阅读|cryoET】Isotropic reconstruction for electrontomography with deep learning (解决缺失楔问题降噪)

    论文题目 Isotropic reconstruction(各向同性重建)for electron tomography with deep learning 期刊:Nature communicat ...

  7. 【论文阅读】TomoAlign: A novel approach to correcting sample motion and 3D CTF in CryoET

    基本信息 作者:Jose Jesus Fernandez(西班牙一个研究所), Sam Li (美国加利福尼亚大学) 期刊:Journal of Structural Biology, 2021 So ...

  8. [论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms

    [论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms 文章目录 [论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms 一.总体介绍 二.具体作用 3 ...

  9. 肖 清华计算机系 北大生命科学,清华大学生命学院、电子系和计算机系合作提出新型的冷冻电镜三维重构算法...

    清华大学生命学院.电子系和计算机系合作提出新型的冷冻电镜三维重构算法 清华新闻网12月3日电 11月30日,清华大学生命科学学院李雪明研究组,电子工程系沈渊研究组和计算机系杨广文研究组三方合作在< ...

最新文章

  1. html支持了3种类型的按钮即,第3章HTML5.ppt
  2. java session 生命周期_JavaWeb关于session生命周期的几种设置方法
  3. spring的注解开发@Component @Bean @Value @Autowired、@Qualifier @PropertySource @Configuration
  4. 庄小威、陈志坚等9位科学家分享2100万美元奖金:2019年科学突破奖公布
  5. Linux 格式化分区 报错Could not stat --- No such file or directory 和 partprobe 命令
  6. 计算机二级晓云是企业人力,全国计算机二级MsOffice真题试卷wore
  7. Java 获取日期间的日期 根据日期获取星期
  8. Windows下配置QGIS和Python
  9. python 开源项目大全
  10. 发力大数据营销 神马搜索获年度最佳移动广告平台奖
  11. VM+Lamp环境搭建
  12. 360路由器远程连接服务器,360路由器如何开启端口映射?
  13. 比较802.11ac(Wi‑Fi 5)和802.11ax(Wi‑Fi 6)
  14. iOS 框架模式(简述 MVC,MVP,MVVM 和 VIPER CDD)
  15. sql查询不定参数生成where子句不定参数查询
  16. bat命令实现游戏存档自动备份
  17. 第七次人口普查,浙江县城人口怎么增加那么多?
  18. 解决Expected all tensors to be on the same device, but found at least two devices, cuda:0
  19. spss运行脚本 linux,从外部Python脚本运行SPSS会话操作
  20. 「产品社群」话题讨论精华·第1期

热门文章

  1. 关于卸载Nodejs,并且用Nvm管理工具重装nodejs的整合
  2. 什么是堆漏洞挖掘?堆的glibc实现、Arena(main_arena、thread_arena)
  3. 2012年10大科技产品
  4. 从wolai转移到Notion
  5. 计算机职称照图片,全国职称计算机报名如何上传照片。怎么提示你无需上传照片。可以直接进行报名呢...
  6. Android:修改默认音量等级
  7. 模拟ic设计工程师面试总结
  8. python dict是什么意思,python中的字典是什么
  9. VisionMobile 2012年移动开发者经济报告(九) 四 应用市场销售(下)
  10. 程序员老鸟写sql语句的经验之谈