时间序列预测问题由来已久,毕竟预测未来是人类永恒的需求。

上世纪以来发展了众多时间序列预测模型,典型的有 ARMA, GARCH, ETS, SSM 等线性模型,在工程控制、金融等领域应用广泛。

预测说白了就是用历史数据预测未来值,即自回归。上述列举的传统方法主要考虑目标值 yty_tyt​ 和 历史值{yt−1,yt−2,…,yt−p,…}\{y_{t-1}, y_{t-2}, \ldots, y_{t-p}, \ldots\}{yt−1​,yt−2​,…,yt−p​,…} 之间存在线性关系,局限性很强。

当考虑非线性自回归模型(NAR)时,假设
yt=f(yt−1,…,yt−p)y_t = f(y_{t-1}, \ldots, y_{t-p}) yt​=f(yt−1​,…,yt−p​)

此时机器学习中的各种回归方法都可以拿来试试,譬如:LR, SVR, CART, GBDT, XGBOOST, GP, ANN, RNN, LSTM, …

模型多如牛毛,哪个才是最强?并无定论。

既然把时间序列预测当做监督学习问题,就要求数据满足如下假设:

对时间序列的自回归模型而言,输入输出分布 P(X,Y)=P(yt,yt−1,…,yt−p)P(X, Y) = P(y_t, y_{t-1}, \ldots, y_{t-p})P(X,Y)=P(yt​,yt−1​,…,yt−p​),即序列片段在整个序列中的分布。

要满足独立同分布假设,测试的时间片段应该在训练集中“出现过”,至少应该可以找到相似的片段,这意味着什么呢?


比如说上图中的混沌时间序列,由于混沌系统具有遍历性,序列的任意一个片段可以在历史中找到相似的片段。另一方面,由于混沌系统具有初值敏感性与非周期性,测试集中的片段绝对不会和训练集中的片段完全重合。所以混沌时间序列作为机器学习模型的数据集再合适不过了。

独立同分布假设实际上对时间序列做了很强的要求,首先序列必须是有界的,如果训练集中的数据分布在 1 到 2 之间, 测试的数据分布在 3 到 4 之间,很大概率会预测不好。

但我们常见的序列一般都是有趋势的,比如持续上涨、下跌,这些单调的序列不就不能用机器学习模型了?确实如此,对于这些具有趋势的序列,应该先做趋势分解,剩下的有界部分就可以使用(非线性)自回归模型了。

时间序列预测的机器学习方法相关推荐

  1. 【论文泛读03】卷积LSTM网络:一种短时降雨量预测的机器学习方法

    贴一下汇总贴:论文阅读记录 论文链接:<Convolutional LSTM Network: A Machine Learning Approach for Precipitation Now ...

  2. Nature子刊:机器学习方法扩展了anti-CRISPR蛋白家族的所有成员

    机器学习方法扩展了anti-CRISPR蛋白家族的成员 Machine-learning approach expands the repertoire of anti-CRISPR protein ...

  3. 【机器学习】R语言进行机器学习方法及实例

    R语言进行机器学习方法及实例 机器学习的研究领域是发明计算机算法,把数据转变为智能行为.机器学习和数据挖掘的区别可能是机器学习侧重于执行一个已知的任务,而数据发掘是在大数据中寻找有价值的东西. 机器学 ...

  4. 用于临床心理学和精神病学的机器学习方法

    用于临床心理学和精神病学的机器学习方法特别着重于从多维数据集学习统计函数,以对个体进行普适性的预测.机器学习方法有可能利用临床和生物学数据来更好地帮助医生做出对精神疾病患者的诊断,预后和治疗相关的决策 ...

  5. 采用支持向量回归(SVR)和随机森林回归预测两种机器学习方法对房价进行预测(附完整代码)

    大家好,我是带我去滑雪,每天教你一个小技巧! 本文分别采用支持向量回归(SVR)和随机森林回归预测两种机器学习方法对房价进行预测.随机将数据分为训练集和测试集,比例为8:2,数据和代码均在文末. 1. ...

  6. 残差平方和ssr的计算公式为_如何为你的回归问题选择最合适的机器学习方法?...

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 转自 | AI算法之心(公众号ID:AIHeartForYou) 作者 | 何从庆 什么是回归呢?回归 ...

  7. 如何为回归问题选择最合适的机器学习方法?

    作者 | 何从庆 本文经授权转载自 AI算法之心(id:AIHeartForYou) 在目前的机器学习领域中,最常见的三种任务就是:回归分析.分类分析.聚类分析.在之前的文章中,我曾写过一篇<1 ...

  8. python平稳性检验_时间序列预测基础教程系列(14)_如何判断时间序列数据是否是平稳的(Python)...

    时间序列预测基础教程系列(14)_如何判断时间序列数据是否是平稳的(Python) 发布时间:2019-01-10 00:02, 浏览次数:620 , 标签: Python 导读: 本文介绍了数据平稳 ...

  9. 序列每天从1开始_时间序列预测一

    什么是时间序列: 时间序列可以看作是普通的二维的无序的特征矩阵向时间空间的拓展,相对来说多了仅仅一个维度但也是非常重要的时间维度: 时间序列是按时间顺序进行的一系列观察,通常包括了连续性时间序列数据和 ...

  10. 做时间序列预测有必要用深度学习吗?事实证明,梯度提升回归树媲美甚至超越多个DNN模型...

    来源:机器之心 本文约2600字,建议阅读9分钟 在时间序列预测任务上,你不妨试试简单的机器学习方法. 在深度学习方法应用广泛的今天,所有领域是不是非它不可呢?其实未必,在时间序列预测任务上,简单的机 ...

最新文章

  1. linux全局变量=多个值,linux errno全局变量各值含义
  2. 浅谈线上德州扑克平台的公平性
  3. 《Cloud Native Infrastructure》CHAPTER 7 (1)
  4. 专家的修炼之路 —— 德雷福斯模型 Dreyfus
  5. 插件化、热补丁中绕不开的Proguard的坑
  6. MYSQL统计行数时到底应该怎么COUNT
  7. tif转双层pdf Java_TIF文件转双层PDF时 内存不足
  8. 用Python做一个证件照制作器
  9. 分享一个Qt的pdf查看器
  10. 判断字符串是否对称 C语言,c语言 判断字符串是否中心对称
  11. java小球落体问题_[Java 编程基本功] (五) 小球落体, 发奖金, 1,2,3,4 可以组成多少个数...
  12. 使用visjs制作网络拓扑图
  13. 时序预测 | python实现仿生算法优化LSTM时间序列预测(全网最全仿生算法)
  14. 使用openssl生成https证书
  15. word2013插入excel对象报错_excel插入对象文件夹 Excel2013中插入对象文件的方法
  16. CSS3 SVG实现可爱的动物哈士奇和狐狸动画
  17. OpenGL ES之三——绘制纯色背景
  18. 英雄联盟英雄信息【python爬虫】
  19. python调用百度网盘开放平台接口上传本地文件
  20. 使用Nginx代理地址

热门文章

  1. 媒体在计算机科学中的两种含义,多媒体技术应用_思考与练习题.doc
  2. 1089. 烽火传递
  3. javascript设计模式--设计原则
  4. SQL 数据库学习路线推荐
  5. Unreal Engine UE4虚幻引擎,生成Cubemap(HDR高动态范围贴图)
  6. shadowgun_SHADOWGUN在Unite上的演讲
  7. 如何快速安装rational rose
  8. mini_sniffer抓包 音乐免费下载 网盘提速下载
  9. python网络测速_网络测速命令--speedtest
  10. 讯飞tts语音引擎_讯飞输入法A.I.语音引擎再升级 更强大更实用!