文章目录

  • 一、算法介绍
  • 二、算法步骤
  • 三、过程说明

一、算法介绍

MSET(Multivariate State Estimation Technique)是由Singer等提出的一种非线性的多元预测诊断技术,是一种通过分析对比实际监测参数与设备正常运行时的健康数据为基础,对正常运行时的各个参数进行运算并做出估计,以这种正常的状态估计作为标准。当得到实际的运行数据时,同样以健康数据为基础,并找到实际数据与健康数据的关联程度,以此对实际运行状态做出估计,这种"程度"是通过权值向量来决定的,用于衡量实际状态与正常状态的相似性。最终对健康状态与实际运行状态的估计结果进行对比分折,并引入残差的概念,最终进行诊断。目前在核电站传感器校验、设备监测、电子产品寿命预测等方面有成功的应用。

二、算法步骤

假设某一设备的“相关变量集”中共有n个相互关联的变量,将在某一时刻i观测到的这n个变量记为观测向量,即

X(i)=[x1 x2 ⋯xn ]^T (1)

过程记忆矩阵D的构造是MSET建模的第一个步骤。在该过程或设备正常工作的时段内,在不同运行工况下采集m个历史观测向量,组成过程记忆矩阵为

过程记忆矩阵中的每一列观测向量代表设备的一个正常工作状态。经过合理选择的过程记忆矩阵中的m个历史观测向量所张成的子空间(用D代表)能够代表过程或设备正常运行的整个动态过程。因此,过程记忆矩阵的构造实质就是对过程或设备正常运行特性的学习和记忆过程。MSET模型的输入为某一时刻过程或设备的新观测向量Xobs,模型的输出为对该输入向量的预测值Xest。对任何一个输入观测向量Xobs,MSET生成一个m维的权值向量为

W=[w1 w2 ⋯ wm ]^T (3)

使得:

Xest=D∙W=w1∙X(1)+w2∙X(2)+ ⋯+wm∙X(m) (4)

即MSET模型的预测输出为过程记忆矩阵中m个历史观测向量的线性组合。权值向量W采用以下方法确定。构造MSET模型输入观测向量和输出预测向量之间的残差为

ε=Xobs - Xest (5)

选择W使残差的平方和达到最小。残差的平方和为

将S(w)分别对w1, w2, ⋯,wm 求偏导数并令其等于0,得

如仅对相关变量集或观测向量中的某一变量如式(1)中的变量xn 进行预测,则只需取过程记忆矩阵的第n行与m维的权值向量相乘,即

x_est=[x_n (1) x_n (2) ⋯ x_n (m)]∙W

=[x_n (1) x_n (2) ⋯ x_n (m)]∙(DT∙D)(-1)∙(D^T∙X_obs) (12)

从式(12)可看出,对观测向量中任一变量的预测是过程记忆矩阵中该变量的m个历史观测值的线性组合。在组合权值W的计算式(10)中,DT∙D反映了过程记忆矩阵中的历史观测向量两两之间的点乘关系,而DT∙X_obs反映了新的输入观测向量与过程记忆矩阵中历史观测向量两两之间的点乘关系。点乘是数量积,是两向量之间关系的一种反映。为使非线性状态估计方法具有更直观的物理意义,并且避免变量之间相关性造成的点乘之后不可逆的情况出现,本文用欧氏距离来反映两两向量之间的关系,即两两向量之间的相似性。在权值W的计算式(10)中,DT∙D和DT∙X_obs中的点乘运算改为欧氏距离运算,式(10)变为:

式(15)的物理意义如下。新的观测向量X_obs与过程记忆矩阵中的m个历史观测向量两两之间通过计算欧氏距离来反映它们之间的相似性。假设X_obs与过程记忆矩阵中的历史观测向量X(i)最相似,则两者之间的欧氏距离最小,在式(4)或(15)中,X(i)对应的权值wi最大,对预测结果的贡献也最大。

当模型新的输入观测向量是在过程或设备正常工作状态获得的,由于过程记忆矩阵覆盖了过程和设备的正常工作空间,该新观测向量总会和过程记忆矩中某些历史观测向量相似,这些相似历史观测向量的组合可以对输入给出精度很高的预测值。模型预测的精度可以用某变量的预测值和该变量的实际测量值之间的残差来衡量。

ε=x_est - x_n (16)

式中:x_n为MSET模型新输入观测向量的第n个变量的实际测量值;x_est为MSET模型输出的x_n预测值。

当过程或设备工作状态发生变化出现故障隐患时,由于动态特性的改变,输入观测向量将偏离正常工作空间,其与D矩阵中历史观测向量均不相似,通过D矩阵中历史观测向量的组合无法构造其对应的精确预测值,将会导致预测精度下降,残差增大。

三、过程说明

1)用来生成历史观测向量集合K 的历史数据应该满足以下要求:

(1)涵盖了一段足够长的运行时间;

(2)每组数据都表达了设备对象的一个正常状态;

(3)满足每一组采样值中各个变量的同时性,必须是同一时刻的采样值;

(4)涵盖了机组在不同季节、不同负荷下的运行情况。

其中,M表示不同运行工况下M个历史观测向量,n表示设备有n个变量。

2)数据归一化处理

在选用数据库中实时数据构造过程记忆矩阵和预测输出时,由于风电机中某一设备模型相关测点的量纲不同,且不同测点数据绝对值相差很大,为保证使用非线性算子正确衡量不同观测向量之间的距离,需要对各个测点的n个变量分别根据各自的极值进行归一化处理,使实际测量值映射到[0,1] 区间。

3)过程记忆矩阵D的构造

过程记忆矩阵的构造需要使其内部的m个观测向量X(1), X(2),…,X(m)能够尽量覆盖设备正常工作空间。设备正常工作空间的每一个观测向量由n个变量组成,且其观测值已被归一化。对每一个变量,将[0,1]之间等分为100份,以0.01为步距从集合K中查找出若干个观测向量加入矩阵D 中。以变量x_1为例,向过程矩阵D 中添加观测向量的方法如图所示。图中δ为一小的正数。对剩余的n-1个变量,均采用与图示相同的流程以0.01为步距从集合K中选择观测向量添加到D中。采用此方法构造过程记忆矩阵,能够将组成观测向量的n个变量的不同测量值对应的历史记录选入矩阵D中,从而使其能较好地覆盖设备正常工作空间。对于某些重要的变量,选取历史观测向量的步距可以取得更小如0.005(等分为200份)。构造过程记忆矩阵完成后,即可利用式(8)对MSET温度模型新的输入观测向量进行预测。

【数据挖掘算法】(一)MSET 算法相关推荐

  1. 数据挖掘的一些经典算法

    数据挖掘能做以下七种不同事情 (分析方法): 数据挖掘能做以下七种不同事情 · 分类 (Classification) · 估计(Estimation) · 预测(Prediction) · 相关性分 ...

  2. 美国 2006 年机器学习和知识发现年会数据挖掘使用率较高算法排名

    在美国 2006 年机器学习和知识发现年会,数据挖掘(Data Mining)哪些算法使用率较高?现场投票结果可以给我们一点线索.数据挖掘有十大经典算法为:C4.5,K-Means,SVM,Aprio ...

  3. 【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 二维数据的 K-Means 聚类 ) ★

    文章目录 一. K-Means 聚类算法流程 二. 二维数据的 K-Means 聚类 1. 第一次迭代 2. 第二次迭代 参考博客 : [数据挖掘]聚类算法 简介 ( 基于划分的聚类方法 | 基于层次 ...

  4. 数据挖掘十大经典算法之——EM 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  5. 数据挖掘十大经典算法之——Apriori 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  6. 数据挖掘十大经典算法之——PageRank 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  7. 数据挖掘十大经典算法之——Naive Bayes 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  8. 数据挖掘十大经典算法之——KNN 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  9. 数据挖掘十大经典算法之——AdaBoost 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

  10. 数据挖掘十大经典算法之——K-Means 算法

    数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...

最新文章

  1. keras faster物体检测_【开源项目】特斯拉+树莓派实现车牌识别检测系统
  2. 隐马尔科夫模型原理解析
  3. php插入一个自增字段,thinkphp-自增或自减一个字段的值
  4. 彻底理解mysql服务器的字符集转换问题
  5. jquery ajax 跨域解决方案 - CORS
  6. python中breakpoint什么意思_it/breakpoint是什么意思
  7. You have new mail in /var/spool/mail/root 解决方法
  8. [RMAN]使用RMAN删除过期归档日志
  9. NetScaler Active-Active模式
  10. Nginx正确记录post日志的方法
  11. 依码仕喷码机编程指南
  12. c语言程序100例pdf,经典c程序100例源代码(全).pdf
  13. 如何将手机的网络代理给电脑 win10
  14. 用C语言:由键盘输入一个点的坐标,要求编程判断该点是否在单位圆上,如果在单位圆上则输出Y,不在单位圆上则输出N。使用小数点后3位精度进行判断。
  15. Leetcode#183. Customers Who Never Order
  16. Electron 去掉标题栏并设定可拖动
  17. 基于高分辨率影像城市绿地信息提取_[转]ENVI支持下利用高分辨率影像城市绿地信息提取方案...
  18. P1252 马拉松接力赛
  19. Windows - 百度网盘限速下载慢解决方案(官方提速方法)
  20. 如何做一个高级的文本编辑器 textarea,拥有快捷键操作

热门文章

  1. 工业物联网快速解决方案
  2. 与iPhone5国行A1429的故事:越狱、降级刷机、完美电信3G、不完美电信4G、撸油管
  3. iphone型号表_iPhone12各版本有什么区别 苹果12四款机型配置表一览
  4. 基于个性化的电影推荐系统全流程设计
  5. win7安装VisualStudio2017
  6. 仓库温度湿度控制措施_仓库温度的控制要求
  7. Mandriva 2007的下载地址以及安装中可能出现问题的解决办法
  8. excel的IRR函数
  9. Android网速实时显示
  10. 人生最重要的概念:复利