论文笔记:Hankel Matrix Factorization for Tagged Time Series to Recover Missing Values during Blackouts_UQI-LIUWJ的博客-CSDN博客

的后续,故而大致部分和那篇类似,本文只设计/补充一些本论文的部分,可结合上篇一起观看

TKDE 2021

0 前言

这篇论文是之前在 ICDE’19 上发表的工作 的扩展。 这与以前的工作之间的主要区别包括:1)我们方程化了约束和假设;

2)我们解决了将 HKMF-T 应用于高维数据的问题

3)通过对数据集进行下采样,在不显着影响其有效性的情况下提高了算法的效率;

4)对参数对系统性能的影响进行了基准测试

1 trend & tagged information

如果我们用10天的滑动平均 ,可以看到MA(10)提供了一个很是平滑的trend。

与此同时,我们也可以发现,这里的tag信息(天气情况),对自行车结果有着很深的影响:晴天和下雪天,自行车的数量分别比之前多&比之前少

——>实际的时间序列通常由一个内部的光滑trend,以及外部环境的影响组成

用符号表示,比如我们时间序列为,标签序列为

于是我们有 x=s+e,其中s和e分别表示光滑趋势,以及外部影响部分

2 损失函数正则项

2.1 时间正则项

在论文笔记:Hankel Matrix Factorization for Tagged Time Series to Recover Missing Values during Blackouts_UQI-LIUWJ的博客-CSDN博客

中,我们知道正则项是

我们可以用另一种形式表示

其中L1为

的结果就是

2.2 tag正则项

这个在上篇论文中说的不多,这里则更详细

我们希望同一个标签下各个时刻的e值,和这个标签的e值的平均值差距不要太大.同一个标签下的e值之差为:

这里I是单位矩阵

表示了某一时刻属于哪些tag的指示矩阵 ()

是一个对角矩阵,其中,Cm是第m个tag的数量

3 传统MF在blackouts 问题中的局限性

在blackouts问题中,时刻t的所有点的数据全部丢失,在这种情况下,时刻t的时间特征向量无法通过最小化学习 ,因为这一列的值全没有

此外,包括 TRMF 在内的传统基于 MF 的方法不包括有关外部事件或条件如何影响序列中的值的知识,这在分析现实世界数据序列中被证明是重要的

4 将HKMF-T问题应用到多维数据中

原理很简单,就是叠加汉克尔矩阵

5 实验部分

数据集,baseline和前作一样

评价标准相比于之间的RMSE,多了一项DTW distance

DTW 笔记: Dynamic Time Warping 动态时间规整 (&DTW的python实现)_UQI-LIUWJ的博客-CSDN博客

同时多了一些实验(单变量时间序列),

比如正则项参数的影响:

p值的影响(p——汉克尔矩阵的列维度)

trend 矩阵R的维度 (结论是几乎没有影响)

5.1 多维时间序列的实验

在本节中,我们展示了使用 MVCD 数据集将 HKMF-T 应用于高维数据序列的有效性。 我们将 62 个县分为 10 个区域 ,以生成 10 维数据序列,每个区域的天气状况作为我们评估的标签序列。 选择这个数据集是因为它自然地将数据分成空间连接的区域,每个区域对应一个维度

5.1.1 和baseline的比较

在这个实验中,我们将所提出的方法的性能与 DynaMMo 进行比较,因为后者也能够捕获空间相关性和处理blackouts。

此外,我们通过在两种设置下进行实验,比较了 HKMF-T 和 DynaMMo 在捕获不同维度之间的空间相关性方面的能力:

1)具有相关性:算法以整个 10 维数据和标签序列作为输入;

2)无相关性:算法每次执行一维。

比较是在blackouts持续时间为 的情况下进行的,以评估算法的性能。 总体结果总结在表 2 中,详细讨论如下。

捕获空间相关性。从表2可以看出,两种算法都能有效地捕捉到不同维度之间的空间相关性,因为带有空间相关性的HKMF-T和DynaMMo的性能都超过了没有考虑空间相关性的对应算法。

HKMF-T与DynaMMo相比。通过比较HKMF-T和DynaMMo在空间相关性方面的表现,可以看出,当停电时间较短时,即lb=4时,DynaMMo有一定的优势。然而,随着停电规模的扩大,HKMF-T开始显示出它的优势。

论文笔记:HKMF-T: Recover From Blackouts in TaggedTime Series With Hankel Matrix Factorization相关推荐

  1. 论文笔记:Hankel Matrix Factorization for Tagged Time Series to Recover Missing Values during Blackouts

    ICDE 2019 0 摘要 在执行时间序列分析时,恢复时间序列中的缺失值至关重要.而本文研究的blackouts问题,即在一定时期内丢失所有数据,是最紧迫和最具挑战性的问题之一.现有的时间序列缺失值 ...

  2. 论文笔记: BRITS: Bidirectional Recurrent Imputation for Time Series

    2018 NIPS 0 摘要 时间序列在许多分类/回归应用程序中无处不在.但是,实际应用中的时间序列数据可能包含很多缺失值.因此,给定多个(可能相关的)时间序列数据,填充缺失值并同时预测它们的类标签很 ...

  3. 论文笔记目录(ver2.0)

    1 时间序列 1.1 时间序列预测 论文名称 来源 主要内容 论文笔记:DCRNN (Diffusion Convolutional Recurrent Neural Network: Data-Dr ...

  4. 论文笔记:Mind the Gap An Experimental Evaluation of Imputation ofMissing Values Techniques in TimeSeries

    pVLDB 2020 1 abstract & intro 这篇论文横向比较了12种 time-series imputation的方法.作者声称这是第一篇深入讨论这些模型的准确度.效率和参数 ...

  5. ORB-SLAM3 论文笔记

    ORB-SLAM3 论文笔记 这篇博客 ORB-SLAM3系统 相机模型的抽象(Camera Model) 重定位的问题 图片矫正的问题 视觉惯性SLAM的工作原理 相关公式 IMU初始化 跟踪和建图 ...

  6. 【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION

    一.简介 这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...

  7. 最新图神经网络论文笔记汇总(附pdf下载)

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 [导读]近年来,图神经网络变得非常火热,每年顶会在该领域内都会出现大量的研究论文,本文为大家提 ...

  8. [论文笔记] Fast Quality Driven Selection of Composite Web Services (ECOWS, 2006)

    Time: 4.0 hours Jae-Ho Jang, Dong-Hoon Shin, Kyong-Ho Lee, "Fast Quality Driven Selection of Co ...

  9. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

最新文章

  1. javaweb学习总结(六)——Servlet开发(二)
  2. 计算机管理磁盘管理,如何打开磁盘管理?
  3. matlab将字符矩阵,matlab – 将字符串索引输入矩阵
  4. android 如何监听应用前后台切换
  5. lambda 函数式编程_Java 8 Lambda表达式的函数式编程– Monads
  6. NOI数学之提高级:线性方程组的高斯消元法
  7. vtkpolydata图形着色
  8. 手机端html返回顶部,vue实现移动端返回顶部
  9. c++容器之vector
  10. tomcat-1-初识
  11. C风格简易本地log系统
  12. mysql配置命令大全_MySQL常用命令汇总
  13. 项目管理和版本跟踪——Redmine和SVN的结合
  14. myqq框架 python插件
  15. IndentationError: expected an indented block 解决
  16. 软考笔记(九)高级系统架构师/分析师:软件工程与项目管理
  17. 【完结】JQ-从0到1-总结
  18. 什么缩写是mzj_mzjh是什么意思,mzjh缩写代表什么意思,mzjh是什么含义
  19. 手把手教你抄写URP——3——自发光材质
  20. 怎样建立产品体系?(五)- 产品生命周期

热门文章

  1. 这么全的数组去重,你怕不怕?
  2. iptables白名单配置
  3. Oracle将NetBeans交给了Apache基金会
  4. 实验一HSRP与STP结合
  5. HttpWatch是强大的网页数据分析工具
  6. [票据打印]打印走纸控制(1) - 设置纸型
  7. ESP8266_RTOS_SDK 之spi flash驱动小窥
  8. MFC中的InitInstance()函数应该怎样理解
  9. c语言中的运算符和表达式试卷答案,c语言试卷和答案1
  10. django models索引_django-models – Django模型“IndexError:列表索引超出范围”Pydev