• 介绍

时间序列中缺失值的插补在医疗保健和金融领域有许多应用。虽然自回归模型是时间序列插补的自然候选模型,但基于分数的扩散模型最近在许多任务(如图像生成和音频合成)中的表现优于包括自回归模型在内的现有模型,并有望用于时间序列插补。在本文中,我们提出了基于分数的条件扩散插补模型(CSDI),这是一种新的时间序列插补方法,利用以观察数据为条件的基于分数的扩散模型。与现有的基于分数的方法不同,条件扩散模型经过明确的插补训练,可以利用观察值之间的相关性。在医疗和环境数据方面,CSDI在流行的性能指标上比现有的概率插补方法提高了40-65%。此外,与最先进的确定性插补方法相比,CSDI的确定性插补将误差减少5-20%。此外,CSDI还可以应用于时间序列插值和概率预测,并且与现有基线具有竞争力。代码可在https:\/\/github上获得。

在本文中,我们提出了一种新的概率插补方法CSDI,该方法使用基于条件分数的扩散模型直接学习条件分布。与现有的基于分数的方法不同,条件扩散模型设计用于插补,可以利用观察值中的有用信息。我们在中说明了使用CSDI进行时间序列插补的过程。

每个框中的虚线代表观察值,绘制这些观察值是为了显示与生成插补的关系,并且不包括在每个xtat中。即拿噪声去补序列。

从图左侧的随机噪声开始插补,并通过条件扩散模型的反向过程pθ将噪声逐渐转换为合理的时间序列。在每个步骤t,反向过程从上一步骤(t+1)的输出中去除噪声。与现有基于分数的扩散模型不同,反向过程可以将观察值(图左上角)作为条件输入,允许模型利用观察值中的信息进行去噪。我们利用注意力机制来捕捉时间序列的时间和特征依赖性。为了训练条件扩散模型,我们需要观察值(即条件信息)和基本真值缺失值(即插补目标)。然而,在实践中,我们不知道地面真值缺失值,或者训练数据可能根本不包含缺失值。然后,受蒙面语言建模的启发,我们开发了一种自监督训练方法,将观察值分离为条件信息和插补目标。我们注意到,CSDI是为一般插补任务制定的,不限于时间序列插补。

我们提出了基于条件分数的概率插补扩散模型(CSDI),并实现了时间序列插补的CSDI。为了训练条件扩散模型,我们开发了一种自监督训练方法我们的经验表明,与现有的医疗和环境数据概率方法相比,CSDI将连续排序概率分数(CRP)提高了40-65%。此外,与为确定性插补开发的最先进方法相比,使用CSDI的确定性插补将平均绝对误差(MAE)降低5-20%我们证明,CSDI还可以应用于时间序列插值和概率预测,并且与为这些任务设计的现有基线具有竞争力。

  • 引文

[12, 15, 16] 近似条件逆过程pθ(xtat−1 | xtat,xco0),等式(2)中的反向过程。

  • 方法

我们考虑了具有缺失值的N个多元时间序列。让我们将每个时间序列的值表示为X={x1:K,1:L}∈ RK×L,其中K是特征数,L是时间序列的长度。虽然每个时间序列的长度L可能不同,但为了简单起见,我们将所有时间序列的长度视为相同,除非另有说明。我们还将观察掩码表示为M={m1:K,1:L}∈ {0,1}K×L其中,如果缺少xk,L,则mk,L=0,如果观察到xk,L,则mk,L=1。我们假设两个连续数据项之间的时间间隔可以不同,并将时间序列的时间戳定义为s={s1:L}∈ RL。总之,每个时间序列表示为{X,M,s}。概率时间序列插补是通过利用X的观察值来估计X缺失值的分布的任务。我们注意到,插补的定义包括其他相关任务,例如插补,在目标时间点插补所有特征,预测,在未来时间点插补所有特征。

然而,现有的扩散模型通常是为数据生成而设计的,并没有将条件观测xco0作为输入。为了利用扩散模型进行插补,以前的研究[12、15、16]近似条件反向过程pθ(xtat−1 | xtat,xco0),等式(2)中的反向过程。在这种近似下,在相反的过程中,他们向目标和条件观测xco0添加噪声。虽然这种方法可以插补缺失值,但添加的噪声可能会损害观察中的有用信息。这表明建模pθ(xtat−1 | xtat,xco0)无近似可以提高插补质量。此后,我们将第3.2节中定义的模型称为无条件扩散模型。

目函函数:

CSDI的自我监督培训程序。在左中矩形上,绿色和白色区域分别表示观察到的值和缺失的值。观察值分为红色插补目标xta0和蓝色条件观察xco0,并用于训练?θ. 每个矩形中的彩色区域表示存在值。

图3:2D注意力的架构。给定具有K特征、L长度和C通道的张量,时间变换层将具有(1,L,C)形状的张量作为输入,并学习时间依赖性。特征变换层以(K,1,C)形状的张量作为输入,学习特征依赖。每层的输出形状与输入形状相同。

注意机制为了捕捉多元时间序列的时间和特征依赖性,我们在每个剩余层中使用二维注意机制,而不是卷积结构。

  • 结果和评价

  • 启发

可以用于序列预测,并和TineGrad对比了,需要看源码。

【论文精读1】CSDI: Conditional Score-based Diffusion Models for Probabilistic Time Series Imputation相关推荐

  1. 【论文精读】Local-Adaptive Image Alignment Based on Triangular Facet Approximation

    图像拼接系列相关论文精读 Seam Carving for Content-Aware Image Resizing As-Rigid-As-Possible Shape Manipulation A ...

  2. 【论文精读】Parallax-Tolerant Image Stitching Based on Robust Elastic Warping

    图像拼接系列相关论文精读 Seam Carving for Content-Aware Image Resizing As-Rigid-As-Possible Shape Manipulation A ...

  3. 论文笔记High-Resolution Image Synthesis with Latent Diffusion Models

    论文提出了latent diffusion models (LDMs).基于该模型最著名的工作是文本生成图像模型stable-diffusion. 普通的扩散模型在像素空间操作,运算复杂度较高.为了保 ...

  4. 扩散模型:Diffusion models as plug-and-play priors作为即插即用先验的扩散模型

    扩散模型:Diffusion models as plug-and-play priors作为即插即用先验的扩散模型 0.摘要 1.概述 2.方法 2.1.问题设置 2.2.将去噪扩散概率模型作为先验 ...

  5. 2022年11月100篇 diffusion models 扩散模型 汇总!

    在生成图像方面,自从NIPS 2014的一篇开山之作: Generative Adversarial Nets 论文:https://proceedings.neurips.cc/paper/2014 ...

  6. 井喷式爆发!2022年11月100篇 diffusion models 扩散模型 汇总!

    点击上方"摸鱼吧算法工程师"卡片,关注星标 获取有趣.好玩的前沿干货! 001  (2022-11-30) Maximum Likelihood Estimation for a ...

  7. 理解扩散模型:Diffusion Models DDPM

    引言 在前面的博客中,我们讨论了生成模型VAE和GAN,近年来,新的生成模型--扩散模型受到越来越多的关注,因此值得好好去研究一番.扩散模型(Diffusion Models)最早由 [2] 于201 ...

  8. Classifier-Free Diffusion Guidance【论文精读加代码实战】

    Classifier-Free Diffusion Guidance[论文精读加代码实战] 0.前言 1.Classifier-Free Diffusion Guidance介绍 1.1原理介绍 1. ...

  9. 【论文精读】AVP-Loc: Surround View Localization and Relocalization Based on HD VectorMap for AVP

    [论文精读]AVP-Loc: Surround View Localization and Relocalization Based on HD VectorMap for Automated Val ...

最新文章

  1. 浅谈Android组件化
  2. oracle字符串只截取中文,Oracle提取字符串中“汉字”串的解决办法
  3. 云原生数据库 2.0:一站式全链路数据管理与服务
  4. 前端学习(1402):多人管理22验证joi
  5. 【bzoj1704】[Usaco2007 Mar]Face The Right Way 自动转身机 贪心
  6. 【codeforces】【比赛题解】#872 CF Round #440 (Div.2)
  7. mysql负变量_MySQL的变量
  8. P-6002-10PK,P-6002-2PK脂质研究工具解析
  9. linux 查看nas磁盘阵列,NAS(linux)阵列管理
  10. Eric6中使用PYQT5在窗口显示图片
  11. 2-14-Multiple Exemplars-based Hallucination for Face Super-resolution and Editing(ACCV2020)
  12. 计算机论文结束语致谢,论文结束语和致谢
  13. 安装vpn和nat以及使用
  14. pandas.tseries.offset, 获取季度,月度第一天(最后一天)
  15. TRS过期后解决办法
  16. [Visual Studio 2022 C#]使用SplitContainer拆分器让一个Windows窗口秒变多个
  17. 《高等统计物理学》4:量子系综的实际问题
  18. uni-app评估报告
  19. mysql外键查询_MySQL外键使用详解
  20. 赤兔ctcms2.0.9最新破解授权版|修复bug|采集入库规则自定义...

热门文章

  1. android 短信超链接,Android处理网页的短信链接
  2. python中筛选内容_Python中数据筛选代码实现
  3. VxWorks6.6运行简单的ACE/TAO CORBA程序
  4. 程序员必备十款开发工具,会用的可以召唤神龙了!
  5. 文人教你说祝福——古语祝福
  6. php数组竖转横,数组纵向转横向怎么实现
  7. Nginx简单入门与反向代理和负载均衡
  8. Error (0xc0000225) installing Windows 7 on VirtualBox
  9. T-Code (Controlling)
  10. openEuler Summit | 胡欣蔚:全场景欧拉 – 志之所趋,无远弗届