四位专家谈：数字医学中的因果关系

来源：ScienceAI

编译：凯霞

Ben Glocker（伦敦帝国理工学院医学成像机器学习专家）、Mirco Musolesi（伦敦大学学院数据科学和数字健康专家）、Jonathan Richens（诊断机器学习模型专家，Babylon Health）和 Caroline Uhler （麻省理工学院计算生物学专家）与 Nature Communications 讨论了他们在因果推理方面的研究兴趣，以及这如何为不同应用领域的数字医学研究及其实施提供强大的框架。

Ben Glocker, Mirco Musolesi, Jonathan Richens, Caroline Uhler。

什么是因果关系，以及因果关系和数字医学在你所在的领域如何相互作用？

Ben Glocker：因果关系与我们希望分析的数据中潜在因果关系的建模有关。在这里，因果推理的语言使我们能够将关于这些关系的知识，以及我们对所谓的数据生成过程做出的任何假设，其中包括数据获取、数据收集和数据注释等方面。数据生成过程的详细因果描述可用于说明数据是如何生成的，以及哪些因素会影响研究样本的特定特征。例如，使用因果图，我们可以明确传达影响研究人群、采集程序、注释政策或纳入/排除标准的变异因素。对数据生成过程进行建模和交流非常重要，因为这使我们能够识别数据中的潜在缺陷、局限性和偏差，这些可能会影响我们从统计数据分析中得出的结论的普遍性甚至有效性。在医学成像的机器学习领域，我们通常旨在建立以医学扫描（以及可能的其他信息）作为输入的统计模型，以便对患者的疾病状态、病理的存在或治疗的有效性进行预测。在这里，输入和输出之间的潜在因果关系可能对我们可能想要采用的机器学习策略类型产生深远的影响。此外，我们可能对确定以前未知的因果关系感兴趣，例如，成像生物标志物与治疗干预的功效之间的因果关系。

Mirco Musolesi：提供一个定义是非常困难的，在我看来，因果关系的概念本身就具有深刻的哲学意义。考虑到我自己的工作和背景，我会用非常实用的术语来定义因果关系，因果关系分析让我们能够从现实世界的数据开始回答因果关系问题。就数字医学而言，因果分析在某种意义上使我们能够对分析结果进行操作，因为它确实使我们能够使用数据做出明智的选择。一个可能的例子是，根据现有条件和外部环境选择正确的疗法和干预措施。事实上，因果分析使我们能够了解可能对某些行为或医疗结果产生影响的内源性和外源性因素。它是我们推理的基础，对于循证决策至关重要。使用数字技术从大量人群中实时收集数据是不够的；从因果的角度解释数据对于采取明智的行动至关重要。实际的「反馈回路」可能通过相同的数字技术实现。这种推理适用于涉及个人的情况，也适用于公共卫生政策和干预措施，例如政府和地方当局在当前 COVID-19 大流行期间采取的政策和干预措施。

我一直在使用移动传感和通过收集实时数据（例如，来自社交媒体）来实时监测身心健康领域的工作。我对将因果方法应用于此类数据集也很感兴趣，以了解和规划有效的反馈系统。现有的大部分工作都是基于相关性；正如我所说，从这些数据集中推导出因果关系是得出可操作见解的基础。

Jonathan Richens: 临床实践中出现的许多常规问题，例如「我应该推荐什么治疗方法？」或「为什么患者会出现这些症状？」，基本上是关于因果关系的问题。因果关系是一个研究领域，它告诉我们如何回答这类型的问题，以及这样做需要哪些假设和资源。例如，数字医疗保健的一项关键任务是制定个性化的护理计划。这涉及到为单个患者量身定制一系列决策，引导他们实现预期的健康结果，而这又需要估计每个决策最终对患者产生的因果影响。随机对照试验是建立这些因果关系的黄金标准，但在很多情况下，随机化这些决定是不道德的、不可扩展的或对患者造成过度破坏。因此，我们通常必须使用观察性数据集，例如电子健康记录，这些数据集仅捕获关联而不是真正的因果关系。我们使用因果推理方法来弥合这一差距，并通过使用观测数据和建模假设来回答这些因果问题。虽然这是研究最多的应用，但因果关系在临床决策中有着深厚的根源，而不仅仅是估计治疗效果。例如，诊断推理涉及对患者症状的最可能潜在原因生成和测试假设。因此，即使是这个教科书式的临床决策问题，实际上也是变相的因果推理问题。

Caroline Uhler：生物医学科学中的重要问题本质上是因果关系：哪些基因相互调节？干预/扰动（例如药物、过度表达或敲除）如何影响所有基因的表达？哪种干预可以使系统从患病状态恢复到正常状态？节点之间的因果关系，例如基因，可以用有向网络表示，其中从节点 1 到节点 2 的有向边意味着节点 1 直接调节节点 2，从而扰动节点 1 改变节点 2 的值。生物医学科学拥有遗传和化学工具，可以在其他领域无法比拟的规模上进行扰动筛选。这些特点使生物医学科学不仅成为因果关系方法的最大受益者之一，而且成为因果关系领域最大的灵感来源之一。

在临床和生物医学研究方面，与你所在领域的非因果方法相关的最重要问题是什么？

B.G.：医学成像领域最紧迫的挑战之一是数据集偏移，这涉及用于构建预测模型的开发数据与我们在部署后面临的真实世界临床数据之间的（未知）变化问题。我们知道数据集偏移会对模型性能产生不利影响。在这里，重要的是能够识别转移的类型，例如，习得转移 vs 人口转移 vs 注释转移 vs 流行转移。每种类型的转移都需要不同的缓解策略。有些转移更难，有些更容易解决。可以在因果关系的镜头下很好地分析数据集偏移，使用数据生成过程的详细因果映射可以最好地描述偏移类型。数据集偏移也与学习虚假相关性问题密切相关，当输入数据中的信号或模式在模型训练期间被拾取时发生，该信号或模式在开发数据下是可预测的，但在部署后的实际测试数据中是不可预测的。这很容易发生在成像设置中，例如，站点特定的噪声模式在原始数据中表现出来（由特定的成像硬件或图像重建算法引起）。纯关联方法容易受到虚假相关的影响，因为任何有助于在输入和输出之间建立（非因果）关系的信号都可以学习，只要它有助于优化数学目标函数。这可能会导致错误的发现，例如使用成像来预测患者结果，而真正的关系可能是基于混杂因素。

M.M.：就学术研究而言，我认为主要风险与研究结果的报告及其对一般政策和决策的影响有关。通常是不情愿地，这些结果在没有区分相关性和因果关系的情况下传达给公众。让我们考虑一个典型的例子：绿色空间对人们身心健康的影响。你可以在不考虑混杂因素的情况下进行相关研究。问题在于公众和决策者可能会根据因果关系来解释这些结果，而没有考虑重要混杂因素的影响，例如这些领域的财富和教育水平。这是一个简单的例子，但它适用于旨在改善个人福祉和健康的各种研究。

J.R.：非因果方法完全适用于许多任务；只有当它们被误用于从根本上需要因果推理的任务时，它们才会出现问题。一个常见的问题是在任务中使用非因果方法，在某种程度上涉及预测干预的结果。这方面的一个例子是风险预测算法在人口健康管理中的广泛应用，它假设风险最高的患者将从额外的护理中受益最大。显然，这是一个强有力的假设，更谨慎的方法是将资源分配给最能从中受益的人——使用因果「治疗对被治疗者的影响」而不是相关风险预测。另一个例子是使用用户生成的数据来验证和优化数字健康产品。混杂和选择偏差极大地限制了使用非因果方法从这些数据中得出任何见解的有效性。例如，如果我被动地观察到使用新的数字健康产品与住院率降低相关，该产品是否可以防止住院，或者年轻人更可能使用该产品并且不太可能住院？乐观的一个来源是，随着数字技术得到更广泛的采用，这些因果推理问题变得更容易解决。数字健康平台原则上可以捕获患者与其护理提供者之间交换的所有信息，对治疗决策和结果之间未观察到的混淆施加了严格的限制，并且比标准电子健康记录在更大程度上实现了可靠的因果推断。

C.U.：与机器学习 (ML) 和人工智能 (AI) 研究的早期驱动因素（例如推荐系统或在线广告）不同，在生物医学科学中，有待发现的自然规律，现象是可以物理解释的，并且预测准确性通常是不充分，但因果机制是最终目标。考虑下面的例子：虽然在推荐系统中，如果模型能够预测如果有人购买防晒霜，那么这个人可能也对冰淇淋感兴趣就足够了。高预测准确性就足够了，了解潜在的因果机制并不重要。另一方面，考虑生物医学科学中的经典机器学习挑战，例如 ISBI-ISIC 黑色素瘤分类挑战，其目标是区分良性和恶性皮肤病变。我们表明，在用于挑战的 2017 年数据集中，训练用于分类良性和恶性病变的神经网络会将良性病变中的绷带识别为恶性皮肤病变的特征。因此，这些神经网络使用非因果特征进行预测。这对于它在医疗环境中的部署将非常令人担忧，从而证明需要可以识别生物医学数据集中因果特征的方法。

你能否提及一个或多个已经（或将）成功应用因果方法的数字医学研究示例？特别是与更简单的关联框架相比时

B.G.：最近让我们特别兴奋的工作是开发新的机器学习方法来生成所谓的反事实图像。有几个小组致力于将因果关系纳入深度生成模型，以便能够合成现实的、特定主题的假设图像。例如，我们已经可以相当准确地预测特定个人的脑部扫描结果，如果该人年轻或年长 10 岁。这需要超越关联的方法，以预测特定干预对因果模型的影响，因果模型将个人特征（例如，年龄、生理性别等）与医学扫描中可见的大脑解剖学表现相关联。这种干预需要因果推理的数学工具，例如我们最近提出的深层结构因果模型。下一步，我们希望将这项工作扩展到研究阿尔茨海默氏症等疾病的特定主题影响。在这里，生成的反事实图像可用于回答诸如「如果这个人健康的话，他们的大脑会是什么样子？」之类的问题。这与当今基于人群的分析不同，后者主要寻找疾病对患者群体的平均影响。反事实图像可能有用的另一个领域是辅助基于图像的机器学习方法的可解释性。例如，生成的图像可以突出被认为对特定预测很重要的解剖学变化。图像是一种自然的、人类可解释的信息传达方式。

M.M.：我认为最有趣的例子之一是行为干预效果的量化。在实用方法方面，我会说研究人员将从基于因果关系方法的分析中受益。让我们考虑一个例子。假设你想设计一项关于使用移动应用程序改善身心健康的策略的研究。应用程序本身在通知的时间和内容方面应该以允许随机对照试验的方式设计。根据因果关系只分析行为变化之间的相关性而不考虑治疗组和对照组将是非常有限的：它不允许量化不同干预措施的影响，例如在不同背景下发送的不同类型的消息、时间当天等。

J.R.：一个可以应用因果方法的著名例子是匹兹堡大学和卡内基梅隆大学的一项研究，该研究训练了几种机器学习算法来预测死亡风险，并使用它来对肺炎患者进行分类。令人惊讶的是，这些算法学会了将哮喘视为预防死亡的保护因素——这是一个危险的结论，可能导致不那么积极的治疗，尽管哮喘实际上代表了死亡风险的增加。这个错误不是由于算法错误；由于路径特定的因果效应，训练数据确实显示出哮喘患者的死亡风险较低。历史上，哮喘患者比非哮喘患者接受了更积极的治疗，导致死亡率总体下降。相反，该错误源于将因果任务（确定对患者的最佳干预措施）与关联任务（预测患者的风险）混淆。最近，已经提出了可以避免这些陷阱的因果算法。例如，诊断算法历来混淆了因果任务（识别患者症状最可能的根本原因）与关联任务（预测疾病的可能性）。因此，这些关联算法可能会犯违反常识原则的错误，例如建议可能不会引起患者症状的疾病。另一方面，因果诊断算法可以避免这些错误并获得显着更好的性能。

C.U.：当 COVID-19 大流行于 2020 年初爆发时，医生和研究人员急于寻找有效的治疗方法。虽然药物的发现仍然主要是通过实验来完成的，但计算方法已开始被使用，并已导致药物成功。一种流行的方法是基于网络分析。这方面的一个重要资源是蛋白质-蛋白质相互作用数据库。通过在节点上叠加信息，了解基因在患病状态下与正常状态下的差异表达情况，就可以发现与疾病差异表达的许多节点非常核心或连接的节点。这些疾病相互作用的中心节点是药物靶点的候选对象。

蛋白质-蛋白质相互作用网络是一个无向网络，不捕获任何调节或因果关系。虽然流行的基于网络的方法会筛选靶向与许多受疾病影响的节点相连的节点的药物，但如果这些目标节点位于受疾病影响的节点的下游，则药物对疾病节点没有影响。因此，推断因果网络以确定哪些基因和蛋白质是「上游」（即它们对其他基因的表达具有级联效应）和哪些是「下游」（即它们的表达因网络中先前的变化而改变）至关重要。理想的候选药物将靶向疾病差异表达基因上游的基因。通过使用因果结构发现算法将无向蛋白质-蛋白质相互作用网络转变为有向网络，在最近的工作中，我们将蛋白质 RIPK1 确定为 COVID-19 药物的有希望的靶点。有趣的是，已经表明 RIPK1 直接与 SARS-CoV-2 蛋白结合，并且 RIPK1 抑制剂目前正在进行 COVID-19 的临床试验。

从你的角度来看，阻碍因果关系方法更广泛应用的最大障碍是什么？

B.G.：应用因果推理需要对数据中的潜在关系做出某些假设，而其中许多假设仍然无法检验。对因果方法的一个关键批评与未知混淆问题有关，这意味着我们通常无法确定没有其他因素可以解释我们在（观察）数据中看到的影响。做出适当的假设需要领域专业知识，因此因果推理领域自然需要多学科的方法。

M.M.：主要问题之一与目前定量和统计方法的教育和培训结构有关。因果方法通常不会在中学和大学课程中教授，除非在核心统计学、流行病学以及可能在社会科学的某些领域（经济和政治学），至少在本科阶段。有多种因素与当前的形势相关，包括分配给统计方法的模块数量通常非常有限——学生通常在他们的学位中只学习 1 个统计模块。对于没有接受过统计方法训练的学生来说，非因果方法本身并不是微不足道的。我相信，如果统计和数据科学培训能早点开始，最好是在中学，情况可能会有所改善。

因果推理方法在计算机科学的某些社区中也不是主流，因此，在机器学习和相关学科之外看到这些技术的应用并不常见。我个人经历过这样的情况，我们应用因果推理的论文的审稿人似乎对实验设置和分析并不完全满意，因此他们很难支持论文发表。

其他障碍与这样一个事实有关，即为了能够对数据进行因果分析，有必要收集有关潜在大量人口的长期信息。这实际上通常很难，例如当使用移动应用程序收集数据时。事实上，通过让大量用户参与研究相当长的时间来确保合规性可能很困难。

J.R.：虽然机器学习可以成为医学领域的强大工具，但它也可以是一张普洛克路斯忒斯之床。将最新的机器学习方法应用于医学问题是可以理解的，但这些方法中的大多数仅限于进行关联推理。这种尝试将问题与工具相适应的倾向一直是医学人工智能历史上的一个问题，虽然经典医学教科书明确强调了因果推理的重要性，但这在人工智能社区中经常被忽视。然而，这种状况正在迅速改变。近年来，更先进的回归和表示学习技术应用于因果效应估计，这在很大程度上弥合了因果关系和现代机器学习方法之间的差距。尽管如此，与非因果方法相比，这些因果方法需要额外的领域知识和验证，这是进入的进一步障碍。同样，因果关系知识的缺乏限制了因果方法在应用研究中的应用。但这种情况也在迅速改变，大中型科技公司现在都在大力投资因果研究。

C.U.：生物医学应用的主要困难在于不能假设潜在的因果网络是已知的。因果机制往往正是研究人员所追求的。众所周知，仅从观察数据（即通过观察系统而不是对其采取行动而以被动方式收集的数据）中，人们只能部分识别潜在的因果网络，即便如此，也只能在强有力的假设下进行。对系统中因果关系的全面理解需要通过有意和仔细地改变系统的一个或多个组件而获得的干预数据。

与大多数其他学科不同，生物医学科学拥有化学（例如药物）和遗传（例如 knock-out、knock-down、过度表达）工具来故意改变系统的组成部分，以及诸如单细胞等技术。RNA-seq 或成像以获得高通量观察和干预数据。这导致了大规模扰动数据集，包括 CMAP、DepMap 和细胞绘画，其中包含单一药物或基因扰动的测序或成像读数。虽然扰动序列和光学池屏幕允许组合扰动（即一次扰动多个基因），但大规模组合扰动屏幕尚不可用，这对于激发新的因果方法以及验证当前的因果结构发现方法至关重要。

连同新的数据集，该领域还需要一个基于干预数据的因果推理的理论和算法框架。特别是，即使大规模组合扰动屏幕变得容易获得，执行所有扰动组合也是不可行的。因此，数据采集和因果推理方法必须齐头并进，以便识别信息量最大的扰动，最好是使用主动学习方法以迭代方式进行。此外，进行大规模干预的能力不仅提供了学习生物现象背后因果结构的工具包，还提供了控制它们的策略。虽然到目前为止控制理论和因果关系几乎没有相互作用，但在对因果关系采取以干预为中心的方法时，考虑控制理论是很自然的，因为它专注于确定控制系统或将其推向理想状态的最佳行动。

我与 Anthony Philippakis 共同领导博德研究所新成立的埃里克和温迪·施密特中心 (EWSC)，该中心旨在了解生命的程序。认识到因果推理对此类事业的重要性，因果关系是该中心的中心主题。EWSC 的一个关键目标不仅是将现代 ML 的工具引入生物医学科学，而且还要使生物医学科学成为 ML 基础进步的关键驱动力。重要的是，这包括识别和生成关键的生物数据集，这些数据集对于推动因果推理的发展至关重要，然后可以反馈给生物发现。

你能否从数据收集开始，快速介绍如何在你所在领域的数字医学研究中实施因果方法？

B.G.：假设目标是建立一个预测模型，首先要问的问题可能是输入数据和目标预测之间的因果关系。关于数据中的原因和影响，我们知道什么或我们假设什么。然后，我们可以尝试将其映射到因果图中，该因果图可以扩展到包括数据收集的各个方面，例如质量控制、选择标准、标签以及可能影响数据变化的任何其他因素。所有这些甚至可以在收集任何实际数据之前完成，因为它可以为我们的计划提供信息（例如，从单个站点收集数据是否足够，我们的研究人群是否具有代表性等）。数据中的因果关系可能会进一步决定我们可能想要采用哪种类型的机器学习方法。一些学习策略，例如半监督学习，在某些情况下可能不是最佳的。因此，即使我们选择纯粹的关联方法进行数据分析，例如深度卷积神经网络，对我们的研究设置进行因果预分析也可能有助于避免机器学习中的常见陷阱。

M.M.：正如我所说，我通常使用通过移动应用程序收集或使用 API 提取的数据集。当你为数据收集设计（移动）应用程序时，你倾向于收集尽可能多的数据，以考虑所有可能的混杂因素。在这种情况下，作为研究人员，我们可以控制数据收集过程，因此，精心设计的研究使我们能够以很少的限制应用因果分析技术。然而，实践可能与理论大不相同。事实上，通常情况下，不可能收集到「理想研究」所需的所有信息，通常是出于隐私原因。例如，让我们考虑用于提醒用户可能接触 COVID-19 的移动应用程序，即所谓的接触通知应用程序。从理论上讲，这些应用程序本可以设计为收集许多感兴趣的变量，以了解病毒在人群中的传播情况，例如受感染个人的接触网络、他们的时间和发生地点等。在某些国家/地区，情况确实如此，但是对于基于 Apple/Google Exposure Notification API 的应用程序无法进行因果分析（实际上，考虑到 API 的设计限制，相关性分析也很困难）。这是一种极端情况，但在许多情况下，因果分析是不可能的，因为出于法律和/或道德考虑，无法监控关键变量。

另一个有趣的方面与参与者的选择有关。事实上，根据移动应用程序的分发方式，研究人员可能无法完全控制参与者的选择。一个典型的例子是广泛宣传并通过应用程序市场分发的应用程序，例如 Apple App Store 和 Google Play Store。在这些情况下，实验者无法直接控制参与者的选择。从理论上讲，有必要控制人口统计等变量，但这并不总是可行的，因为这些信息可能不可用。例如，如果一项研究的伦理审查不允许收集人口统计信息，则无法通过应用商店推断，因为它们不记录此类信息。

另一种典型情况是因果推理应用于「大数据（集）」的情况，例如通过社交媒体 API 提取的数据。在这些情况下，「参与者集合的实际组成」也不是直接可用的，因为它们是一种「耗尽」，正如一些人所说，来自平台的正常使用，即他们是次要的数据。在这些情况下，谨慎地根据因果关系（以及相关性）得出结论至关重要。同时，幸运的是，我们拥有大量强大的技术来处理这些数据集并提取因果关系（如果存在）。

J.R.：因果诊断算法使用明确的因果模型进行推断，第一步也是最具挑战性的步骤是学习病理生理模型。这些通常是代表症状、疾病和风险因素的大型图形模型，位于对它们的因果关系进行编码的有向无环图 (DAG) 中。DAG 是使用源自医学文献和专家知识的知识图谱构建的，或者可以使用因果发现算法从健康记录和流行病学数据中学习。然后使用专家启发、电子健康记录和流行病学数据的组合来学习模型参数，通常假设参数模块化和独立性以加快学习并提高可解释性。诊断是一个动态的调查过程，涉及许多子任务，例如证据收集、假设生成和演绎推理。因此，下一步是为这些任务中的每一个设计推理算法。例如，关联推理可用于证据收集，而因果推理可用于加权诊断假设。最后，整个系统必须经过验证和广泛测试，以确保准确性和安全性。

C.U.：我的团队在开发因果结构发现的理论和算法框架方面进行了广泛的工作，即从观察和扰动数据的混合中识别因果关系。上文已在 COVID-19 的背景下讨论了如何将此类方法应用于确定候选药物靶点的示例。

鉴于 COVID-19 大流行的紧迫性，确定已经获得 FDA 批准并且对 COVID-19 也有效的药物（这个问题被称为药物再利用）尤为重要。鉴于对其他疾病进行了大规模的药物筛选（例如上述 CMAP，它专注于癌细胞系），那么问题就变成了将药物的作用从一种疾病背景转移到另一种，预测药物 SARS-CoV-2 感染细胞知道它们对癌细胞系的影响。这个问题在因果关系和政策评估文献中被称为因果可移植性或综合控制/干预。或者，这个问题可以看作是机器学习中的风格转移问题，其中风格是药物的作用，目标是将它从一种疾病背景转移到另一种疾病背景。自动编码器和生成对抗网络已经非常成功地应用于计算机视觉应用中的风格迁移，将风格视为潜在空间中的向量，可以附加到图像上以改变其风格。只有当药物的作用在跨疾病背景的潜在空间中保持一致时，这种药物估算方法才能起作用。我们在最近的工作中展示了过度参数化的自动编码器，即潜在空间维度大于输入维度的自动编码器，可用于增强对齐，并将药物的作用从一种疾病背景转移到另一种疾病背景。这种方法可用于有效地虚拟筛选大量药物，然后仅对新疾病背景下的候选药物子集进行实验。

最近发布了基于人工智能的临床试验的新指南。你认为因果关系应该如何适应？

B.G.：因果推理要求我们明确我们的假设。例如，我们可以以直观且易于解释的因果图的形式呈现假设的数据生成过程。这也意味着我们的假设变得更加透明，并且可以被其他人审查。通过这种方式，因果关系工具箱可以支持更好地报告基于人工智能的研究，并帮助识别潜在问题，例如数据集转移、样本选择和其他偏差。

M.M.：作为一名计算机科学家，首先，我在使用人工智能（AI）这个词时总是很小心。对我来说，AI 有一个特定的意义，它与努力构建能够完成需要人类智能的任务的人工系统有关。出于这个原因，我倾向于使用基于 ML 的临床试验这个术语。

总的来说，我欢迎采用因果推理的最新发展，特别是过去十年机器学习社区引入的发展。我会说采用速度很慢，但它肯定会发生。在这方面的另一个基本方面是用于设计试验和分析结果的算法的可解释性。这也是提高研究人员和从业人员在这些领域的信心的重要研究领域。我个人也认为，需要一些工具来指导因果推理，并支持基于这些试验结果的研究的再现性。

J.R.：SPIRIT-AI 和 CONSORT-AI 指南扩展了现有的随机对照试验指南，以处理基于 AI 的干预措施。观察因果推断研究的设计和报告也存在类似的指导方针，鉴于因果推断在开发和监控基于人工智能的数字健康产品中的重要性日益增加，扩展这些指导方针似乎是自然而然的下一步。例如，许多因果推理研究涉及反事实查询，并且没有可用于验证这些预测准确性的反事实数据点。因此，重要的是确保对用于做出这些因果推断的建模假设以及报告敏感性分析进行高质量报告，这些分析用于确定未观察到的混杂对这些研究的潜在影响。

C.U.：在临床试验中使用基于人工智能的方法的激动人心的时刻即将到来。因果关系是药物开发和临床试验各个方面的重要工具，从靶点的识别，到毒性估计和剂量估计，再到选择试验的患者。如上所述，临床应用中基于机器学习的算法可能会造成伤害，特别是当它们在不代表它们所应用的数据集的数据集上进行训练时。在临床试验中使用基于人工智能的方法的一个重要问题是它们可能会延续和加剧潜在的偏见和健康差异。特别是，乍一看似乎与组成员无关的算法可能会产生不同的影响。因果关系最近已成为研究此类算法公平性问题的强大工具。特别是，反事实推理可用于调查如果一个人属于边缘化群体，结果是否与他相同。因此，因果关系可以成为调查临床试验公平性、为试验选择合适患者的重要工具，从而有助于减少健康差异。

论文链接：https://www.nature.com/articles/s41467-021-25743-9

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）大脑研究计划，构建互联网（城市）大脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”