Unveiling causal interactions in complex systems

  • 摘要
  • 引言
  • 结果
    • 监督生态系统的相互依赖性
    • 通过大脑活动诊断疾病
    • 监控衍生品的系统性风险
    • 追踪入侵动态和天气对沙漠生态系统的影响
    • 揭示了酗酒者大脑网络的独特特征
    • 在CDS市场中发现持续的因果关系和有影响力的资产
  • 讨论
  • 方法
    • 符号信息
    • 因果关系评估的框架
    • 吸引子重构
    • 最近的邻居和他们的未来预测
    • 受影响变量的预测模式h提前一步
    • 驱动变量的模式
    • 受影响变量的真实模式(回测过程)
    • 每一时刻t步的影响性质和强度
    • 因果关系的总体性质和强度
    • 因果网络分析
    • 力量中心
    • 链接的持久性
    • 复杂性
    • 方法的模拟验证
    • 数据的可用性

作者:Stavros K. Stavroglou, Athanasios A. Pantelous, H. Eugene Stanley,Konstantin M. Zuev
翻译:Wendy

摘要

  经过时间的演变推移,复杂系统中的操作法和概念已被用来对自然界和社会中的重要方面和相互作用进行定量建模。 然而,预测构成此类系统结构的实际相互依存关系仍然是一项艰巨而艰巨的任务,但仍令人鼓舞,尤其是当在现实世界中观察到的因果相互作用可能被永久隐藏时。 在本文中,我们提出了一种强大的方法来 检测动态复杂系统的潜在和难以捉摸的结构。 我们的检测方法 利用嵌入在重构状态空间中的信息的短期预测。 在这方面,我们使用生态学,神经病学和金融学等广泛的现实世界应用程序,探索并能够证明我们的方法重构这些复杂系统的基本结构的能力和准确性,并同时强调其最基本的操作 。

关键词: 复杂系统;因果关系;生态系统;大脑;CDS市场

引言

  几个世纪以来,哲学阐明了人类最大的努力方向。科学为哲学提供了一种方法论方法,以经验方式检验理论和概念,从而帮助哲学家几乎完全摆脱了迷信,为现象的第一性原理寻求自然机制。例如,迈勒图斯(Thales of Miletus)通过观察天气对橄榄树的长期影响,可以预测下一个丰收年并预先储备橄榄压榨。泰雷兹(Thales)的预测是准确的,因为他能够深刻地证明,对事物起因的阐述会导致人们对自然机制的更高理解。长期以来 对理解现象基本原理的渴望 为本研究提供了最强烈的动力。

  自然定律无可争辩地控制着行星运动到粒子运动。但是,在生态系统,大脑功能和股票市场方面,我们努力推导首要原则,因果关系和驱动因素。缺乏清晰的了解是决策者和决策者的祸害,他们最终将遵循临时规则或最佳实践。不可避免地,如果不能清楚地解释系统的元素和功能,致命的错误就在于等待。如今,幸运的是,数据可用性和计算能力方面的最新进展创造了一块肥沃的土壤,可以在其中开发出精益求精的工具,以加深对此类深不可测的系统的了解。

  在这项工作中,我们开发了一种稳健的方法(请参见方法)以 检测动态复杂系统中的隐藏结构。在实践中,确定动态复杂系统的最重要组成部分及其因果关系为优化性能和确保其操作的稳定性提供了重要的一步。我们的目的是有效地证明和科学地测试该方法的能力和准确性,以重建复杂系统的基本结构,同时强调最重要的操作和组件。尤其是,对于已知先验相关性的时间序列的一步式预测,我们的方法在100,000次仿真中显示出90%的卓越准确性。此外,为了清楚地揭示我们治疗的多学科性质及其稳健性,我们从生态,神经病学和金融学三个高度复杂的系统中进行了研究,这些系统通常在数据中包含很大的噪声。本文扩展了我们对动态复杂系统的理解。

  将我们的方法应用于三个不同的研究领域,我们已经对关键组件和操作有了先验知识,我们重构了最基本的结构,并令人信服地评估了该方法所提供的有效性。在这个方向上,首先对于沙漠生态系统,我们捕获了入侵植物物种Erodium cicutarium的有意义的入侵和随后的同化动力学,从降水和温度图表中可以看出干旱和干旱的影响。其次,对于大脑活动实验,我们探索并能够检测到(从文献中)对照(与酒精性)大脑的额叶区域相比,预期的更强烈的活动,这是额叶与顶叶区域之间的酒精性大脑的阴性状态与运动功能有关,以及在对照大脑的视觉皮层中有较高的活动集中度。最后,对于一组银行信贷违约掉期交易(CDS),我们掌握了北欧银行的驱动力,这一点得到了国际货币基金组织的证实;德国银行在资产负债表中的竞争作用;以及某些银行在2007年至2008年危机期间的核心作用。

  • 意义:自然界和社会中的模式由于其复杂和高度相互关联的特性而被描述为复杂系统。捕捉它们结构的起伏,有助于我们更好地理解自然规则和社会联系。在这种情况下,一种方法被提出,揭示了最重要的操作和复杂系统的组成部分。通过重建沙漠生态系统的基本结构,发现酒精脑的特征,以及在CDS市场上定位关键资产,有效地证明了该方法的有效性。所提议的框架是决策和政策制定者的一个特殊工具,它所证明的有效性为在更广泛的应用领域捕获隐藏的交互奠定了卓越的潜力。

结果

监督生态系统的相互依赖性

  生态系统的特征是反复出现的扰动,在多个平衡之间摇摆和混乱的干扰。 本地物种库的微小变化会对给定生态系统的长期平衡产生不可预测的影响(10)。 环境哨兵与物种入侵以及天气对诸如沙漠生态系统之类的不稳定地区的影响有关。

  因此,我们将我们的方法使用在一个奇瓦瓦沙漠灌木丛网站门户附近成立于1977年,亚利桑纳州的数据集上,其中包含四种类型的测量:天气变量,大量的各种啮齿动物物种,一些植物物种,和一些蚂蚁,一个详细的列表,可以在SI附录中,表S2看到。我们的主要目的是一方面检索以入侵物种Erodium cicutarium为中心的因果关系,另一方面追踪天气对生态系统的可追溯影响。为了推断每个物种之间的影响类型,我们使用了一个充分的回测程序,使我们能够评估相互依赖的类型。最后,我们使用 最大生成树算法 来消除弱相互依赖,从而保留最具影响力的相互依赖。因此,最强的链接也将是在生态系统中最有意义的。

通过大脑活动诊断疾病

  大脑作为一个突触活动系统,受到大部分(如果不是全部)精神障碍的影响。例如,由于对大脑,特别是额叶区域的神经毒性作用,患有酒精中毒的人往往会在他们的社交生活中表现出不良影响。有时,它甚至会导致大脑神经回路的持续功能改变。大规模治疗项目的原则可以受益于工具,能够识别因素,区分受影响的对象与不受影响的人。

  受酒精对大脑明显影响的启发,我们使用了由纽约州立大学布鲁克林健康中心神经动力学实验室的Henri Begleiter公开提供的数据集。我们用脑电图(EEG)测量了10名酗酒者和10名对照者。数据集包含放置在受试者头皮上的64个电极的记录,以256hz (3.9-ms epoch)进行1s的采样。在我们的分析中,我们考虑每个受试者暴露于从一组精心挑选的图片中选择的单一刺激的物体图片。电极位置位于标准位置(根据美国脑电图协会的标准电极位置命名法)。数据收集过程详见参考文献19。此外,SI附录表S3提供了与特定大脑区域对应的电极的概要细节。我们的目的是 重建酒精性脑相对于控制组的至关重要的因果结构。为此,我们执行回测,在每个时间步,推断每对电极的因果类型。

监控衍生品的系统性风险

  自期权、信用违约互换等衍生金融产品问世以来,投资组合的选择和后续管理越来越具有挑战性。此外,所有的市场参与者都有内在的联系,一个人的一个小小的决定可能会对市场产生深远的影响。因此,基金经理需要不断研究不断增长的数据量,优化决策,降低系统风险。

  出于对冲贷款业务风险的动机,以及释放受监管的资本,银行一直是CDS市场的主要参与者。到1998年3月,全球CDS市场估计约为3000亿美元,仅摩根大通一家就占了约500亿美元。从2008年初开始,全球金融危机已经与银行cds的角色交织在一起。自2008年以来,北欧和德国银行一直是全球金融网络的关键组成部分。这促使我们进一步调查银行信用违约互换的相互依赖性,并测试我们的方法是否能够识别全球金融危机和后危机时期的事实上的关键参与者。我们使用从2007年12月14日至2019年5月13日期限为5年的银行业CDS日利差数据集(SI附录,表S4)。时间序列是从汤姆森数据流中检索的。为了评估因果关系的性质,我们执行回测,以在每个时间步上推断每只股票每天如何影响彼此的股票。

追踪入侵动态和天气对沙漠生态系统的影响

  在“入侵前”时期(图1A),外来种玄参(Erodium cicutarium)只占当地植物群的很小比例。我们的方法捕获了这一信息,因为两种蚂蚁和一种植物与入侵者呈负相关,证明了潜在的敌意。在堑壕“突围”时(图1B),入侵者的数量上升到测量到的植物群的25%,这可能与来自一种蚂蚁物种的积极影响以及随后来自某些植物和蚂蚁物种的积极因果关系(图1C)有关。然而,另一种植物物种对入侵者有负面的因果关系,我们在入侵前也可以看到这种模式。后来(图1D),尽管一些坚持认为对入侵者的数量有负面影响,但一种蚂蚁物种被发现与入侵者呈正相关。沿着这条线(图1E),我们再次发现入侵者处于一个混合三角形中,一种植物物种对它产生了积极的影响,而另一种蚂蚁物种对它产生了消极的影响。在最后一个时期(图1F),只有温度影响入侵者,表明即将与生态系统的其他部分同化。这里的主要观点是,入侵物种在入侵后时期(图1 C-F)的零星积极因果关系可能有助于其在生态系统中的成功传播。

图1所示。6个不同时期的累积因果网络(使用公式11):(A) 1993年至1997年,在Erodium cicutarium“侵略”之前;(B-E) 1998年至2007年,利息入侵期;(F) 2008年至2009年,入侵后时期。节点图标代表节点的类型(蚂蚁、植物、啮齿动物、天气)。链接的颜色表示因果关系的类型(蓝色表示正,红色表示负,紫色表示暗)

  就天气的影响而言(图1A),温度和降水都对两种啮齿动物、一种蚂蚁和一种植物产生了负面影响,这证明了这一时期发生的严重干旱(23)。随后(图1B),我们观察到黑暗因果关系的发展,同样涉及温度和降水,其中一个蚂蚁物种在其中心。随后(图1C),温度和降水以积极和消极的方式对生态系统的其余部分发挥持续的驱动作用,随后降水发挥了更多的消极作用(图1D),随后又恢复到更平衡的作用(图1E)。最终(图1F),只有温度在生态系统中保持着中心作用,以积极的方式影响植物物种。然而,这一时期的特征是干旱,这一事实被受温度负因果关系影响的两种蚂蚁捕捉到了(16)。具体种类见SI附录,图s1 - s6。

揭示了酗酒者大脑网络的独特特征

  在图2中,根据我们算法的公式11,我们比较了“平均”酗酒者和对照组的累积邻接矩阵,颜色越深,累积强度越大。显然,平均酗酒者大脑(图2A)的额叶区域的正向相互依赖性比平均控制者大脑(图2B)要弱得多。据称,这一发现与由于酒精的神经毒性作用而导致的额叶衰竭有关。

  然而,在消极结构方面,很明显,酗酒者的平均大脑在邻接矩阵中有两个特定区域(图2C),它们之间的相互依赖性比平均控制者的大脑要强烈得多(图2D)。这两个区域转化为一个负的因果机制,在额叶和顶叶之间。额叶区负责运动功能,而顶叶区负责空间感知和导航。我们的结果表明,在普通的酗酒者的大脑中,这两个区域会引起相反的电波动。这与已知的酒精中毒患者的运动障碍和感觉障碍相一致(24-26)。

  图2所示。酒精者(A、C、E)和对照组(B、D、F)在整个实验期间的平均正/负/暗网络结构的累积邻接矩阵。颜色越深,表示累积的链接强度越高。在实验的所有时间范围内,正的累积相互依赖(用公式11进行聚合)范围在0到70之间。同样,负累积相互依赖的范围是0到25,而暗累积相互依赖的范围是0到50。此外,图框1对应额区,图框2对应中央区,图框3对应顶叶区,图框4对应枕叶区,图框5对应颞区,图框*对应辅助电极。

  在暗型相互作用的微观结构中也发现了独特的特征。最值得注意的是,在普通酒精性大脑中,电极CZ(中央最右侧)的电压测量始终受到所有其他电极的影响(图2E和SI附录,图s11)。这种模式在普通的控制型大脑中是不存在的,控制型大脑在PO7和PO8电极上表现出更强的因果关系(图2F和SI附录,图s12),这两个电极与视觉记忆相关(枕部区域)。有趣的是,枕骨区域参与了图像的处理,这是这个实验中感兴趣的区域。我们的分析表明,控制脑中的所有脑区对枕部的影响都更高,这一事实已经在大脑研究文献中得到了反映(19,27,28)。关于确切电极的详细信息,见SI附录图s7 - s12。

在CDS市场中发现持续的因果关系和有影响力的资产

  对cds对系统投资组合风险的贡献进行评级,最直接的方法是通过施加的影响和接收的影响。实际上,我们可以知道哪些信用违约掉期会影响其他人,同时受到的影响较小。在图3中,我们给出了一个气泡图,其中x轴对应的是累积强度超中心性,y轴对应的是累积强度中心性(两个中心性都是从每个时间步聚合的模式因果网络计算出来的)。

  图3所示。根据施加(x)和接收(y)累积影响(强弱中心性分别)绘制cds泡沫图。强度中心性(坐标轴上的值)的计算方法是将整个时间段内聚合邻接矩阵的累积权重作为权重。颜色的尺度是根据(x−y),因此给更有影响力的cd一个更深的阴影。对于正因果(A)、负因果©和暗因果(E),这个过程是分开进行的。我们还根据上面解释的每种类别(B)(正)(D)(负)和(F)(暗因果关系)的(x)−(y)来关注10个最具影响力的信用违约互换。通过关注,我们可以了解到每一种类型的因果关系中排名靠前的cds。

  我们观察到,在正相关性方面(图3A), CDS因果结构的布局似乎是同质的,这表明,在考虑施加影响和接受影响时,大多数CDS似乎在两者之间表现出一种平衡。值得注意的是,最具影响力的信用违约互换是Svenska Handelsbanken、Nordea Bank AB和Skandinaviska Ensk Banken(图3B;参见SI附录,表S5的前10)。这一结果表明特定的北欧银行的信用违约互换在我们的数据集中对其他信用违约互换具有最高的同向预测能力。这个结果可能与这样一个事实有关:北欧银行的贷存比比其他所有银行都要高得多,这使它们暴露在系统风险之下,从而使它们的CDS息差成为推动市场的主要力量 。此外,Svenska Handelsbanken在其创新的银行模式方面一直是关注的中心 。

  在消极的相互依赖性方面也有类似的结构(图3C),尽管更分散,这意味着施加和接受的影响之间有更明显的差异。其中最有影响力的是巴登符腾堡州银行、德国银行和德国工业银行(图3D;参见SI附录,表S5的前10)。值得注意的是,这些银行都是德国银行,而且在研究期间,他们的资产负债表上被发现持有大量的主权债券,这实际上使他们成为主权衍生品市场的最大参与者。

  最终,考虑到图3E,我们推断出黑暗相互依赖的因果结构与在积极和消极相互依赖中观察到的因果结构不同。与前两种情况(正面和负面)相比,受影响大的信用违约互换施加的影响小得多,而受影响大的信用违约互换受到的影响小得多。在这种情况下,最有影响力的信用违约掉期是桑坦德英国公司、德国工业银行Ikb和第一资本金融(图3F;参见SI附录,表S5的前10)。乍一看,这些银行似乎毫无关联;然而,他们被发现处于2007年至2008年危机的中心(32,33)。关于CDS相互依赖关系的详细信息,请参见SI附录,图。S13-S15和表S5。

讨论

  在这项工作中,我们引入了一个框架来检测在因果网络中的潜在和难以捉摸的结构。我们的方法是基于短期预测,从信息嵌入重构的状态空间。审慎算法设计揭示了三种不同类型的时间序列因果关系,即正面(同方向)、负面(相反方向)和黑暗(混合方向)预测关系。这种有针对性的划分允许对持久的因果结构和主导影响进行独特的识别,否则,这些影响就会消失在完全不同的因果关系的噪音中(如果我们不辨别三种类型的互动)。将这种方法应用到一组来自给定复杂系统的时间序列测量中,可以让我们分别感知这三种类型中每一种的根深蒂固的因果关系。我们展示了我们的方法在辨别最基本的组成部分方面的能力,即驱动三个不同学科中系统进化的“主干”。

  作为第一个挑战,我们在一个沙漠生态系统中测试了我们的方法,在不完善的天气条件以及动物和植物的丰度测量上。通过观察,我们知道这个生态系统经历了一次外来物种入侵和两次严重干旱。我们的方法能够定量地捕获入侵的动态,以及一些额外的信息,关于可能的“内部协助”的入侵物种。此外,无论是在干旱时期还是在其他时期,天气的中心作用都有效地与实证研究结果相一致(23)。接下来,我们在神经病学的背景下测试我们的方法。已有文献指出酒精中毒对额叶的影响。通过我们的方法,我们发现普通酗酒者的大脑额叶区的正相关性要比普通控制者的大脑弱得多。此外,在黑暗因果关系谱下,我们能够确定平均控制大脑在枕叶区域(视觉皮层)的较高活动。最后,意识到特定银行在过去十年中突出的角色,我们想测试我们的方法重构CDS因果网络的能力,同时捕捉最具影响力的组成部分。事实上,我们的方法能够识别出北欧和德国银行对其他银行的cds的高度影响,以及在2007年至2008年金融危机中扮演非常重要角色的银行。在每一个案例中,我们都能够揭示驱动系统其余部分接受审查的最重要因素。

  最后,提出的方法可以在各种复杂系统中捕获一系列因果关系。然而,从这些角度来看,我们希望看到所建议的方法的应用超出所提供的例子,并将其扩展到更广泛的主题类别。

方法

  我们介绍了一种通过时间序列数据揭示复杂系统结构的方法。因此,取一对时间序列并测试它的因果关系,我们检查X是否、多少以及在哪个方向上影响了y。在这方面,首先,我们重建阴影吸引子,即它们在至少一个二维空间上的延时表示。最后,我们测试X预测Y值的能力。预测精度越高,X与Y之间的因果关系越强

符号信息

  在开发揭示因果网络的理论方法论之前,有必要引入以下符号:

变量(符号) 符号描述
X(t)∈R 动态系统ω的状态变量(时间序列),它作为一个函数,从ω的吸引子M映射点到实值标量。X可以对应于笛卡尔坐标
t ∈N 表示t1,t2,t3,…离散步骤测量的时间。X的时间进化。
L∈N 时间序列的长度,也称为时间序列的库。
E∈N 吸引子的嵌入维数。
τ∈N 我们用来重建阴影吸引器的时间延迟。
MX∈REM_X∈R^EMX​∈RE 利用X(t)的时滞重构阴影吸引子。
x(t)∈REx(t)∈R^Ex(t)∈RE mx的点(向量)对应于系统在时刻t的状态。
h∈N 预测范围h比当前时间t提前一步。
L1∈RL_1∈RL1​∈R x(1)与x(2)之间的曼哈顿的距离
L2∈RL_2∈RL2​∈R x(1)与x(2)之间的欧式的距离
DX∈R(E−1)D_X∈R^{(E−1)}DX​∈R(E−1) 度量矩阵L1 或者 L2
NNx(t)∈RENN_{x(t)}∈R^ENNx(t)​∈RE 根据邻接矩阵DX 种x(t)的最近邻居
Sx(t)∈RE−1S_{x(t)}∈R^{E-1}Sx(t)​∈RE−1 连续百分比变化的矢量x(t)
Sx(t+h)^∈RE−1\widehat{S_{x(t+h)}} ∈R^{E-1}Sx(t+h)​​∈RE−1 连续百分比变化的矢量Sx(t+h)S_{x(t+h)}Sx(t+h)​
Px(t)∈℧EP_{x(t)}∈℧^EPx(t)​∈℧E 目前的模式是x(t)
Px(t+h)∈℧EP_{x(t+h)}∈℧^EPx(t+h)​∈℧E 受影响变量的估计预测模式。它被提取为Sx(t+h)^\widehat{S_{x(t+h)}} Sx(t+h)​​
PC[PX,PY,t]∈℧EPC[P_X,P_Y,t]∈℧^EPC[PX​,PY​,t]∈℧E 模式因果关系(PC)矩阵,它是一个三维数组,维度为3E−1,3E−1,L3^{E−1},3^{E−1},L3E−1,3E−1,L用于模拟影响强度。

因果关系评估的框架

  通过建立时间序列之间的因果关系来评估该方法的预测能力。 ref.34,从X到Y只是影响量化通过比较从同状态的MX和我的社区模式,这里我们探讨这种关系进一步使用模式从MX目前的社区来预测我的未来模式(h步骤提前t)。换句话说,我们运用的预测能力强的部署算法制定如下。然而,为了证明我们的贡献的价值,数学形式(即引理、定理和它们的证明)在SI附录第6和第7节中被描述。具体来说,在接下来的内容中,根据SI附录引理1,如果MY的所有值都受到MX的影响,则MX会以绝对的方式强烈地影响MY,每次我们准确地预测MY的未来模式时,即当Eq.4 = Eq.9时,都会对MX进行检验。此外,影响的强度是通过强度比来计算的,见公式10,我们期望SI附录Lemma 3成立,它表明MY的一些(而不是全部)值受到MX的影响。SI附录,引理2和4表明,如果MX影响MY,那么随后X影响Y,有效地允许原始时间序列解释吸引子分析的结论。最后,SI Appendix, theorem 1, 2, and 3将影响的性质分别分为正向, 负向和暗因果,当我们使用PC矩阵(SI Appendix, Tables S6和S7)时,它们被包含在我们方法的最后,以支持我们处理的可视化。

吸引子重构

  通过找到一对最优的(E,τ),我们分别为X和Y创建阴影吸引器MX和MY。特别是,我们首先比较E和τ的合理嵌入值的整个范围的预测精度,然后我们计算距离矩阵DX和DY(例如:在MX和MY中的所有向量中:

我们用类似的方法推导出DY。

  一旦得到阴影吸引子,我们就可以得到复杂系统的重构拓扑。下一步,我们解析吸引子中的局部区域,并为预测和因果推理提取有用的信息。

最近的邻居和他们的未来预测

  对于MX中的每一个x(t),我们找到它的 E+1 最近邻居NNx(t),它是一个有界单纯形在e维空间中所需要的最小点数。 在最近的邻居中,我们需要保持时间指标,在MY上找到相应的点,并提前h步预测它们,以确定未来的状态:

  为了避免任何数据窥探,下面必须为所有最近的邻居的预测:tn<t,where  tn∈{t(x1),t(x2), …,tx(E +1)}在这一步,我们提取x(t)的邻居的投影的投影时间指数,并使用它们来计算其同时间的距离y(txn),其中txn=dtx1,tx2,…,txE+1。

受影响变量的预测模式h提前一步

  我们利用公式2和3中的相关信息估计y(t+h)的预测模式Py(t+h):

备注:tx1, tx2,…,txE+1对应式2计算的值。
在这里,我们使用来自MX的信息来预测MY的未来模式y(t+h)

驱动变量的模式

  那么,我们保持目前的x(t)模式,即Px(t):
Px(t)=signature(Sx(t))P_{x(t)}=signature(S_{x(t)})Px(t)​=signature(Sx(t)​)
其中,符号函数是从向量中提取模式的方法,如SI附录中所述。

  通过持有x(t)的当前函数模式,我们能够评估从X到Y的因果关系的强度和类型。

受影响变量的真实模式(回测过程)

  然后,我们保持真实的模式y(t+h),其中,
Py(t+h)=signature(Sy(t+h))P_{y(t+h)}=signature(S_{y(t+h)})Py(t+h)​=signature(Sy(t+h)​)
  在这里,我们提取了y(t+h)的真实模式,能够检验我们的因果假设。为了实现这一点,Eq. 4的预测模式必须与Eq. 9的真实模式相同。这个过程符合SI附录引理1和3。

每一时刻t步的影响性质和强度

  我们重复这个过程,参见公式2-9,对于阴影流形MX的每个点,并为上述影响有效的每个时间步长t填写PC矩阵(SI附录,表S6和S7)。否则,当前t的PC矩阵为空。当预测有效时,我们通过计算代表模式强度的函数的规范来填充PC矩阵,并将原因的规范||Sx(t)||除以结果的规范||Sy(t+h) ||
PC[PX,PY,t]=∥Sy(t+h)∥∥Sx(t)∥PC[P_X,P_Y,t]=\frac{\left \| S_{y(t+h)} \right \| }{\left \| S_{x(t)} \right \| } PC[PX​,PY​,t]=∥∥​Sx(t)​∥∥​∥∥​Sy(t+h)​∥∥​​
对于归一化输出,我们可以先用高斯误差函数滤波来填充PC矩阵:
PC[PX,PY,t]=erf∥Sy(t+h)∥∥Sx(t)∥PC[P_X,P_Y,t]=erf{\frac{\left \| S_{y(t+h)} \right \| }{\left \| S_{x(t)} \right \| } } PC[PX​,PY​,t]=erf∥∥​Sx(t)​∥∥​∥∥​Sy(t+h)​∥∥​​
其中
erf(x)=1π∫−xxe−t2dterf(x)=\frac{1}{\sqrt{\pi } } \int\limits_{-x}^{x} e^{-t^2}dterf(x)=π​1​−x∫x​e−t2dt

因果关系的总体性质和强度

  在这一点上,产生的结果包含三个时间序列,对每种类型的影响(积极的,消极的,黑暗),称为P(t),N(t), D(t),分别表示在每一个时间步的强度影响(从0到1)。注意,对于一个给定的t,唯一的三个可以不同于零,这就意味着我们不能在同一时间超过一种类型的影响。

因果网络分析

  大数据时代的研究需要分析很多时间序列变量之间的相互依赖性。因此,我们有N个变量,即X1,…,XN,而不仅仅是X和Y。迄今为止,变量被称为网络的“节点”。因此,需要仔细研究的最大因果相互作用数量是N(N−1),不包括循环。现在,我们可以一共有N(N−1)产生的时间序列的每个类型(指P(t),N(t),D(t)),有效地创建三个动态因果网络,一个用于各个方面(正数、负数、阴暗),或象征意义:Pkl(t),指在时间t积极影响的强度,从节点k节点l;Nl k(t),表示从节点k到节点l,在时刻t负向影响的强度;Dlk(t)为t时刻从节点k到节点l的黑暗影响强度。

  最终Pl k(t),Nlk(t),Dlk(t)对所有的k, l分别是积极的,消极的,和黑暗方面,分别在时间t的因果网络,并且可以被视为三个并发网络,相同的节点,但相互排斥的链接(没有链接可以同时存在一个以上的三个方面)。可选地,我们可以通过使用 最小/最大生成树或平面最大过滤图等算法来过滤网络,以只保留最强的关系。

力量中心

  这个度量是指从节点到节点的链接的权重的聚合。输出强度为直接对其他节点施加的加权影响,输入强度为直接从其他节点接收的加权影响。这里的权重是由公式11计算的。

链接的持久性

  它通过累积时间来衡量从节点X到节点Y的给定链接的总体权重,以排序时间序列对强度和持久性的相互依赖性。

复杂性

  该方法是计算有效的长时间序列(大L)。唯一影响我们方法的参数是时间序列长度L和嵌入维E。L和/或E越高,计算距离矩阵DX和DY所需的时间就越长。为了提取点x(t)的候选邻居,我们只需要DX的DX[t,1:(t−1)]部分(对于DY也是一样)。计算DX和DY每一个都需要L^2E,而主要算法的迭代部分是O(L)阶。我们算法的总代价是O(L²E+L)阶,主要的计算是初始距离矩阵的计算。关于复杂性的更多细节可以在SI附录第3节中找到。

方法的模拟验证

  我们的方法已经被验证,使用了100,000个模拟和不同长度的链的三种类型的相互作用,正的,负的,暗的。SI附录第4节详细介绍了这种基于模拟的验证的分析和讨论。特别是对于短链,所得到的结果是相当令人印象深刻的。

数据的可用性

  对于生态系统分析,亚利桑那州Portal附近的奇瓦瓦生态系统数据集可在参考文献中访问。对于脑电图分析,我们使用了20名受试者的数据集,数据集由纽约布鲁克林州立大学健康中心神经动力学实验室的Henri Begleiter公开提供。每个受试者都经历了5次试验,每次试验都有64个电极电压测量值的时间序列记录(L = 256)。最后,银行CDS的数据可以在汤森路透数据流上找到。

  R代码可以访问https://github.com/skstavroglou/pattern_ causalit

Unveiling causal interactions in complex systems(揭示复杂系统中的因果交互作用)相关推荐

  1. 推荐系统的因果推断:Causal Inference for Recommender Systems(RecSys,2020)

    文章目录 说明 1. 推荐和因果 2. 理论做法 2.1. 符号说明 2.2. 潜在结果下的矩阵分解 2.3. 忽略性假设 2.4. 经典因果推断 3. 去混杂因素推荐器 3.1. 曝光模型 3.2. ...

  2. Paper:《Hidden Technical Debt in Machine Learning Systems—机器学习系统中隐藏的技术债》翻译与解读

    Paper:<Hidden Technical Debt in Machine Learning Systems-机器学习系统中隐藏的技术债>翻译与解读 导读:机器学习系统中,隐藏多少技术 ...

  3. 耿直:统计学中的因果推断问题(Causal Inference)

    来源:量化研究方法 本文约3000字,建议阅读5分钟. 数学科学学院耿直老师为你介绍统计学中的因果推断问题. 今天,小编带来了数学科学学院耿直老师关于统计学中因果推断问题的介绍.文中介绍了几种分析因果 ...

  4. 《Cisco Systems, Inc. 思科系统公司》简介

    Cisco Systems, Inc. 思科系统公司是全球领先的互联网设备供应商.它的网络设备和应用方案将世界各地的人.计算设备以及网络联结起来,使人们能够随时随地利用各种设备传送信息.思科公司向客户 ...

  5. 【VINS论文笔记】Online Temporal Calibration for Monocular Visual-Inertial Systems 单目视觉惯性系统在线时间标定

    前言 港科大VINS-Mono目前已集成了IMU和cam的在线时间偏差标定.本人就其相关论文进行了阅读,并进行内容整理. 原文:Online Temporal Calibration for Mono ...

  6. 双树复小波变换Dual-Tree Complex Wavelet Transform在信号处理中的应用

    本文展示了双树复小波变换 (Dual-Tree Complex Wavelet Transforms,DTCWT) 在信号.图像和轴承故障诊断方面的应用. DTCWT 为两个独立的两通道滤波器组,在实 ...

  7. 基于机器学习的自适应超体素分割揭示了人脑中的躯体定位组织

    文章来源于微信公众号(茗创科技),欢迎有兴趣的朋友搜索关注 导读 除了在中央前回和中央后回的成熟的躯体组织外,目前强有力的证据表明躯体组织在感觉运动网络的其他区域也很明显.这就存在几个实验问题:感觉运 ...

  8. 文献解读 | 单细胞转录组图谱揭示了茶叶中儿茶素酯的发育轨迹和新的代谢途径

    题    目:Single-cell transcriptome atlas reveals developmental trajectories and a novel metabolic path ...

  9. Nature:李龙等揭示抑郁症模型中社交压力阻断社交奖赏的神经环路机制

    在人类社会中,社会压力尤其是创伤性社会经历会导致抑郁症.社交焦虑及创伤后应激障碍等多种精神疾病[1].在抑郁症研究领域,有研究表明社会创伤会损害大脑负责奖赏的脑区功能,使社交活动变得不再有奖赏性,从而 ...

最新文章

  1. SAP Spartacus user form页面的css设计重构
  2. 【Makefile】
  3. SAP ABAP打印MM采购发票打印开发
  4. 参数初始化策略中提到的零空间理解
  5. deepin linux 安装packet tracer 7.0
  6. win10 字体 变得模糊 有锯齿
  7. 崩坏3区号+86_86,中国大陆国际区号是“ +86”,还是“ +086”、“ +0086”
  8. Windows系统如何修改Hosts文件
  9. 一篇比较好的高数的学习规划分享
  10. java guardedby_JAVA多线程(五)模式-Guarded Suspension
  11. 进行一个幂的运算(数学)
  12. 网站老是被劫持怎么办、网站被劫持的解决方案有哪些
  13. python chunk模块
  14. linux 韦恩图两个,在线&在R中绘制韦恩图的几种方法 和 一些漂亮的venn图
  15. 博弈论2:学会换位思考(弱劣势策略)
  16. 微信小程序和微信H5有什么区别?
  17. 如何推广微信公众号(快速增加粉丝数量)?
  18. P问题、NP问题、NPC问题的概念及实例证明
  19. c语言编程学生对老师的评教系统,记王宇颖教授和她的“C语言”教学团队
  20. springboot结合Freemarker模板生成docx格式的word文档(附代码)

热门文章

  1. turtle库使用教程 及 绘制 浪漫樱花 五角星 彩虹玫瑰 谢尔宾斯基三角形 实例
  2. Redis的IO模型以及客户端与服务端设计
  3. chrome 有哪些有用的插件
  4. 朗涛任命Juanita Zhang为中国大陆区总经理,Peggy Hon为中国香港区总经理
  5. 服务器操找不见系统,服务器提示找不到操作系统
  6. php 微信模拟登陆给用户发送消息(文字,图片,图文)
  7. Mysql 事务的隔离性(隔离级别)
  8. 微信小程序 js创建Object对象
  9. js实现深拷贝与浅拷贝
  10. buu——girlfriend