文章目录

  • 前言
  • 一、异常值检验
  • 二、重复值
  • 三、重新设置索引并进行时间点检测
  • 四、时间序列可视化
  • 五、平稳性检验
  • 六、纯随机性检验

前言

在使用时间序列模型进行预测时,首先需要判断数据是否有异常值,数据是否符合随机性,检查平稳性与周期性


一、异常值检验

data.sort_values("Month",inplace=true)
data.head()

data["Value"].interpolate(inplace=True) #这里填充用的是时间上下的均值进行填充
data.isnull.sum()sns.boxplot(data=data["Value"]) #使用箱线图查看检查

二、重复值

data[data.duplicated(keep=False)]  #检查重复之后删除
data.drop_duplicated(inplace=True)
print(data.shape)

三、重新设置索引并进行时间点检测

'''时间序列上一般使用日期时间类型索引,这样方便操作元素。
因此我们将数据中的时间列转换成日期类型,并将其设置为索引。'''data["Month"]=pd.to_datetime(data["Month"])
data.set_index("Month",inplace=True)
data.head()#检测时间点是否缺失
data=data.asfreq("MS") #MS指月份第一天
data.insull().sum()
#存在缺失点,进行填充插值
data["Value"].interpolate(inplace=True) #这里填充用的是时间上下的均值进行填充
data.isnull.sum()

四、时间序列可视化

data["Value"].plot(figsize=(15,5))

五、平稳性检验

import sys
sys.path.append("../tools")
import tstoolstsools.stationarity_test(data["Value"],m=12)#其中12为周期


六、纯随机性检验

tstools.random_test(data["Value"])

机器学习——时间序列(二)相关推荐

  1. 机器学习——时间序列ARIMA模型(一):差分法详解

    机器学习--时间序列ARIMA模型(一):差分法详解 一.所需数据的性质 平稳性 样本数据需随着时间序列而发生变化,且序列的均值和方差不发生明显变化. 预测出在未来的一段期间内数据顺着现有的" ...

  2. 机器学习(二) 如何做到Kaggle排名前2%

     机器学习(二) 如何做到Kaggle排名前2% 发表于 2017-04-12 | 更新于 2017-05-06 | 分类于 machine learning , 机器学习 , AI | 评论次数 ...

  3. 机器学习(二十八)——Monte-Carlo

    动态规划(续) Value Iteration vk+1(s)=maxa∈A(Ras+γ∑s′∈SPass′vk(s′))vk+1(s)=maxa∈A(Rsa+γ∑s′∈SPss′avk(s′)) v ...

  4. 独家思维导图!让你秒懂李宏毅2020机器学习(二)—— Classification分类

    独家思维导图!让你秒懂李宏毅2020机器学习(二)-- Classification分类 在上一篇文章我总结了李老师Introduction和regression的具体内容,即1-4课的内容,这篇我将 ...

  5. 机器学习之二:回归分析

    机器学习之二:回归分析 如果想了解更多的知识,可以去我的机器学习之路 The Road To Machine Learning通道 1. 基本概念 我们首先了解一下关于回归的基本概念. 因变量(dep ...

  6. 机器学习(二)多元线性回归算法预测房价

    机器学习(二)多元线性回归算法预测房价 本篇文章已作为重庆交通大学19级微课<机器视觉>大作业提交,提前声明,避免抄袭误会 "garbage in garbage out&quo ...

  7. Python机器学习(二):决策树(Decision Tree-DTs)

    Python机器学习(二):决策树(Decision Tree-DTs) 目录: Python机器学习(二):决策树(Decision Tree-DTs) 一.什么是决策树 1.基本概念 2.决策树算 ...

  8. 机器学习(二)概率密度分布之非参数估计

    机器学习(二)概率密度估计之非参数估计 2018/2/19 by ChenjingDing 二.非参数估计 2.1直方图估计 直方图估计概率密度函数基本思想: 将数据空间分成许多个子空间,每一个子空间 ...

  9. 机器学习(二)非参数估计matlab例程

    机器学习(二)非参数估计matlab例程 2018/2/19 by ChenjingDing 问题描述: 分别使用K近邻和核函数的方法.为输入样本xˆx^\widehat{x}估计概率密度函数.xˆx ...

  10. Python机器学习实验二:1.编写代码,实现对iris数据集的KNN算法分类及预测

    Python机器学习实验二:编写代码,实现对iris数据集的KNN算法分类及预测 1.编写代码,实现对iris数据集的KNN算法分类及预测,要求: (1)数据集划分为测试集占20%: (2)n_nei ...

最新文章

  1. ByteCTF 2021(Crypto部分)
  2. 一段时间以来的SEO优化结果
  3. 小技巧:不用任何媒体处理软件进行视频压缩
  4. jdk1.6 改 jdk1.7或jdk1.8(改回也可以)(图文详解)
  5. jpa 查询 列表_终极JPA查询和技巧列表–第3部分
  6. Android多媒体学习八:调用Android自带的音频录制程序,实现录制
  7. MPEG2简单码流分析
  8. Android新增输入设备
  9. ROS与PCL:在setconditionfunciton时,无法使用std::bind
  10. linux ubuntu软件中心,Ubuntu 20.04 将Ubuntu软件中心切换到Snap商店
  11. 可能有用的篡改检测常识
  12. AD9854的工作原理和应用电路图
  13. 3D游戏建模行业门槛高吗
  14. Unity游戏配置存储方案
  15. 【爬虫进行时】手机客户端app爬虫抓包(Fiddler)
  16. python中求合数_python输出100以内的质数与合数实例代码
  17. 深入Android系统(二)Bionic库
  18. 217公斤小伙不堪重负切胃减肥
  19. wshop微信商城数据库结构简要解析
  20. 【C++探索之旅】第一部分第八课:传值引用,文件源头

热门文章

  1. java操作Excel-poi:无法解析符号/方法Cannot resolve symbol ‘‘、Cannot resolve method ‘‘
  2. 使用echarts做词云图
  3. 考研高等数学(数二)知识点整理
  4. 湖南安化云台山风景区,欣赏茶园基地的美景
  5. Layuiadmin+Echarts全国地图数据分布
  6. pmbok中文第六版(含网页在线版、含微信版)
  7. Linux 利用 IP转发使内网连接到公网
  8. 【数模国奖作品解析之一】加拿大各地区温度的时空变化趋势分析
  9. 第七讲(二):三层交换的原理及配置(不同vlan间通信)
  10. 【Oracle】ORA-12518, TNS:listener could not hand off client connection