大家好,我是herosunly,从985院校硕士毕业,现担任算法研究员一职。CSDN博客专家,2020年博客之星TOP。曾获得阿里云天池比赛第一名等Top名次,拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。

  根据对已有时间序列比赛的统计研究,发现数据规模不大的比赛任务中,依然使用的是特征工程+梯度提升树模型(XGBoost、LightGBM、CatBoost)。而且特征工程依然是重中之重。所以特意换了一些时间对特征工程进行了详细的总结。主要包括两大类,一类是常用的(大家都使用的)基本特征,还有一类是Top选手使用的高级特征。为了方便比赛选手学习,将其概念代码均进行了详尽的总结,具体如下文介绍。

文章目录

  • 1. 基本特征
  • 2. 高级特征
    • 2.1 峰值因子、裕度因子、波形因子、脉冲因子、重复值的若干个特征
    • 2.2 傅里叶变换的若干个特征
      • 2.2.1 傅里叶系数
      • 2.2.2 傅里叶变换后的统计特征
    • 2.3 差分特征

时间序列统计特征的详细解析相关推荐

  1. 【阅读论文】基于统计特征的无监督时间序列异常检测方法

    文章目录 摘要 1.介绍 2.相关工作 3.问题描述 4.方法 4.1 统计特征 4.2提取特征总结 4.3 学习阶段算法 4.4测试阶段算法 5.结果 5.1 YOB评价:单变量 5.3对合成数据集 ...

  2. 机械故障诊断信号幅域分析- 时域统计特征 | 基于python代码实现,在CWRU和IMF轴承数据集上实战

    最详细的机械故障信号时域特征分析及实战 1.摘要 2.有量纲幅域参数计算公式及物理意义 3.无量纲幅域参数计算公式及物理意义 4.模拟数据代码实战 4.1 导入包 4.2 生成模拟正弦数据 4.3 绘 ...

  3. spark word2vec 源码详细解析

    spark word2vec 源码详细解析 简单介绍spark word2vec skip-gram 层次softmax版本的源码解析 word2vec 的原理 只需要看层次哈弗曼树skip-gram ...

  4. Kaggle Titanic Challenges 生存预测 数据预处理 模型训练 交叉验证 步骤详细解析

    本博客所有内容均整理自<Hands-On Machine Learning with Scikit-Learn & TensorFlow>一书及其GitHub源码. 看<Ha ...

  5. 关于实证类研究的步骤及详细解析(经管)

    导读: 跟随世界主流经济学的研究范式,数量化研究已经成为了中国经济研究的主流.经济学,作为社会科学中数量化程度非常高的一门学科,其本身还是脱离不了社会科学本身的限制,经济学的主要使命是帮助我们认识复杂 ...

  6. 深度学习目标检测详细解析以及Mask R-CNN示例

    深度学习目标检测详细解析以及Mask R-CNN示例 本文详细介绍了R-CNN走到端到端模型的Faster R-CNN的进化流程,以及典型的示例算法Mask R-CNN模型.算法如何变得更快,更强! ...

  7. pandas使用resample进行不同粒度下的时间特征重构实战:构建时间维度统计特征

    pandas使用resample进行不同粒度下的时间特征重构实战:构建时间维度统计特征 Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率 ...

  8. 终端不能联网_详细解析物联网是什么?

    原标题:详细解析物联网是什么? 物联网的英文是Internet of Things,缩写为IoT.这里的"物"指的是我身边一切能与网络联通的物品.例如你带的手表.你骑的共享单车.马 ...

  9. skb详细解析【转】

    skb详细解析[转]  摘自:http://blog.chinaunix.net/uid-30035229-id-4883992.html 在自己的模块发送函数中,需要对skb进行重新构造和别的一些操 ...

最新文章

  1. Django高级管理静态文件和中间件5.1
  2. NeurIPS 2019 | 一种对噪音标注鲁棒的基于信息论的损失函数
  3. 解析#pragma指令
  4. linux开启FTP以及添加用户配置权限,只允许访问自身目录,不能跳转根目录
  5. php 调用 perl,在PHP中使用与Perl兼容的正则表达式
  6. python 栈的压入弹出序列
  7. 机器视觉 · 工业相机
  8. 探秘蚂蚁金服分布式事务 Seata 的AT、Saga和TCC模式
  9. GSK携手学术机构共建健康大数据系统
  10. snowflake改进_分布式SnowFlakeID(雪花ID)原理、改进优化
  11. 记录——《C Primer Plus (第五版)》第九章编程练习第二题
  12. svn 备份恢复【转】
  13. 关于excel数据透视表的数据填充
  14. 通过网页版邮箱的实现“联系我们”
  15. Mac 上有哪些比较有意思的小软件?
  16. 矩阵特征值和特征向量求解——特征值分解
  17. EverBox 能否成为中国的dropbox
  18. 2022焊工(初级)特种作业证考试题库及模拟考试
  19. MySql 不存在则插入,存在则更新或忽略
  20. 当低代码遇上私有化部署,真是赞爆了!

热门文章

  1. 图解最常用的10个机器学习算法
  2. 商业智能2.0?(BI 2.0 from Timo Elliott)
  3. AI同传变革性进展:搜狗同传3.0首创语境引擎,让机器具有理解、推理能力
  4. 绿色荧光素标记硫酸软骨素;FITC-Chondroitin-Sulfate;Chondroitin-Sulfate -Fluorescein
  5. 水库水位-库容曲线线性插值python程序
  6. awk打印除第一列之外的所有列
  7. 开源项目源码阅读方法
  8. 云计算市场价值爆发,两马之战日趋激烈
  9. 9000字深度详解华为绩效管理体系
  10. 先进先出页面置换算法的模拟(c++实现)