机器学习——时间序列(二)
文章目录
- 前言
- 一、异常值检验
- 二、重复值
- 三、重新设置索引并进行时间点检测
- 四、时间序列可视化
- 五、平稳性检验
- 六、纯随机性检验
前言
在使用时间序列模型进行预测时,首先需要判断数据是否有异常值,数据是否符合随机性,检查平稳性与周期性
一、异常值检验
data.sort_values("Month",inplace=true)
data.head()
data["Value"].interpolate(inplace=True) #这里填充用的是时间上下的均值进行填充
data.isnull.sum()sns.boxplot(data=data["Value"]) #使用箱线图查看检查
二、重复值
data[data.duplicated(keep=False)] #检查重复之后删除
data.drop_duplicated(inplace=True)
print(data.shape)
三、重新设置索引并进行时间点检测
'''时间序列上一般使用日期时间类型索引,这样方便操作元素。
因此我们将数据中的时间列转换成日期类型,并将其设置为索引。'''data["Month"]=pd.to_datetime(data["Month"])
data.set_index("Month",inplace=True)
data.head()#检测时间点是否缺失
data=data.asfreq("MS") #MS指月份第一天
data.insull().sum()
#存在缺失点,进行填充插值
data["Value"].interpolate(inplace=True) #这里填充用的是时间上下的均值进行填充
data.isnull.sum()
四、时间序列可视化
data["Value"].plot(figsize=(15,5))
五、平稳性检验
import sys
sys.path.append("../tools")
import tstoolstsools.stationarity_test(data["Value"],m=12)#其中12为周期
六、纯随机性检验
tstools.random_test(data["Value"])
机器学习——时间序列(二)相关推荐
- 机器学习——时间序列ARIMA模型(一):差分法详解
机器学习--时间序列ARIMA模型(一):差分法详解 一.所需数据的性质 平稳性 样本数据需随着时间序列而发生变化,且序列的均值和方差不发生明显变化. 预测出在未来的一段期间内数据顺着现有的" ...
- 机器学习(二) 如何做到Kaggle排名前2%
机器学习(二) 如何做到Kaggle排名前2% 发表于 2017-04-12 | 更新于 2017-05-06 | 分类于 machine learning , 机器学习 , AI | 评论次数 ...
- 机器学习(二十八)——Monte-Carlo
动态规划(续) Value Iteration vk+1(s)=maxa∈A(Ras+γ∑s′∈SPass′vk(s′))vk+1(s)=maxa∈A(Rsa+γ∑s′∈SPss′avk(s′)) v ...
- 独家思维导图!让你秒懂李宏毅2020机器学习(二)—— Classification分类
独家思维导图!让你秒懂李宏毅2020机器学习(二)-- Classification分类 在上一篇文章我总结了李老师Introduction和regression的具体内容,即1-4课的内容,这篇我将 ...
- 机器学习之二:回归分析
机器学习之二:回归分析 如果想了解更多的知识,可以去我的机器学习之路 The Road To Machine Learning通道 1. 基本概念 我们首先了解一下关于回归的基本概念. 因变量(dep ...
- 机器学习(二)多元线性回归算法预测房价
机器学习(二)多元线性回归算法预测房价 本篇文章已作为重庆交通大学19级微课<机器视觉>大作业提交,提前声明,避免抄袭误会 "garbage in garbage out&quo ...
- Python机器学习(二):决策树(Decision Tree-DTs)
Python机器学习(二):决策树(Decision Tree-DTs) 目录: Python机器学习(二):决策树(Decision Tree-DTs) 一.什么是决策树 1.基本概念 2.决策树算 ...
- 机器学习(二)概率密度分布之非参数估计
机器学习(二)概率密度估计之非参数估计 2018/2/19 by ChenjingDing 二.非参数估计 2.1直方图估计 直方图估计概率密度函数基本思想: 将数据空间分成许多个子空间,每一个子空间 ...
- 机器学习(二)非参数估计matlab例程
机器学习(二)非参数估计matlab例程 2018/2/19 by ChenjingDing 问题描述: 分别使用K近邻和核函数的方法.为输入样本xˆx^\widehat{x}估计概率密度函数.xˆx ...
- Python机器学习实验二:1.编写代码,实现对iris数据集的KNN算法分类及预测
Python机器学习实验二:编写代码,实现对iris数据集的KNN算法分类及预测 1.编写代码,实现对iris数据集的KNN算法分类及预测,要求: (1)数据集划分为测试集占20%: (2)n_nei ...
最新文章
- ByteCTF 2021(Crypto部分)
- 一段时间以来的SEO优化结果
- 小技巧:不用任何媒体处理软件进行视频压缩
- jdk1.6 改 jdk1.7或jdk1.8(改回也可以)(图文详解)
- jpa 查询 列表_终极JPA查询和技巧列表–第3部分
- Android多媒体学习八:调用Android自带的音频录制程序,实现录制
- MPEG2简单码流分析
- Android新增输入设备
- ROS与PCL:在setconditionfunciton时,无法使用std::bind
- linux ubuntu软件中心,Ubuntu 20.04 将Ubuntu软件中心切换到Snap商店
- 可能有用的篡改检测常识
- AD9854的工作原理和应用电路图
- 3D游戏建模行业门槛高吗
- Unity游戏配置存储方案
- 【爬虫进行时】手机客户端app爬虫抓包(Fiddler)
- python中求合数_python输出100以内的质数与合数实例代码
- 深入Android系统(二)Bionic库
- 217公斤小伙不堪重负切胃减肥
- wshop微信商城数据库结构简要解析
- 【C++探索之旅】第一部分第八课:传值引用,文件源头
热门文章
- java操作Excel-poi:无法解析符号/方法Cannot resolve symbol ‘‘、Cannot resolve method ‘‘
- 使用echarts做词云图
- 考研高等数学(数二)知识点整理
- 湖南安化云台山风景区,欣赏茶园基地的美景
- Layuiadmin+Echarts全国地图数据分布
- pmbok中文第六版(含网页在线版、含微信版)
- Linux 利用 IP转发使内网连接到公网
- 【数模国奖作品解析之一】加拿大各地区温度的时空变化趋势分析
- 第七讲(二):三层交换的原理及配置(不同vlan间通信)
- 【Oracle】ORA-12518, TNS:listener could not hand off client connection