在社会整体安全水平日益提升的大背景下,因工业设备的故障导致的重大事故愈发受到社会的深切关注。以化工行业为例,令人痛心的安全事故屡屡发生,2019年甚至被称为化工行业的“本命年”,自19年年初至19年4月25日,以响水“3•21”爆炸事故为代表的重大事故致使148人死亡或失联。

生产管理学中著名的“海恩法则”指出: 每一起严重事故的背后,必然有29次轻微事故和300起未遂先兆以及1000起事故隐患。经分析,相当多的恶性事故发生前,现场的传感器数据都表现出了明显的异常,完全可以通过监测、报警等方式及时预警并启动预案,防患于未然。本文结合个人实践经验,主要从监督学习与异常检测这两种视角看待问题,尝试在适当的假定下解决之。

监督学习视角

如果数据容易标记,可以标记到时间窗,做有监督学习分类模型。这里分为两种方式:

第一种是传统特征工程设计,将生成的特征输入到机器学习模型中。工业场景中常见的数据不平衡、样本量小、过拟合等问题,都应纳入基本考量。

图 机器学习分类框架

第二种是:用NN模型直接进行序列分类。值得一提的是,LSTM-FCN和ALSTM-FCN在序列信号进行分类的任务中表现出很好的效果。

在许多工业场景中,手工设计特征需要工业领域甚至是特定工艺的深入业务理解,要设计基本统计、功率谱参数、业务衍生等多层次特征。特别是业务衍生特征,如果现场工程师提供了一个超强的特征(即magic feature),例如某真空蒸发器在同时出现负压超过68kPa,温度超过90℃的情况下极易致使损坏,那么该真空蒸发器的预警建模难度就会大大降低。

树模型给出的特征重要度可为特征提供优良的可解释性,对异常追根溯源有很好的指导作用。

图 xgboost的特征重要性排序

深度学习的优点是端到端的快速解决问题,绕过了成本高昂的特征工程,极大降低了业务知识门槛,而缺点是与之俱来的可解释性问题。好消息是机器学习正朝着更高的易用性、更低的技术门槛、更敏捷的开发成本的方向去发展,Auto-ML极大减少了手工工作,其中自动化特征工程旨在自动创建候选特征。在时序数据分类问题上,使用tsfresh可以自动抽取超过100个特征子集(每个特征子集根据参数设置包含一个或多个特征)。

图 tsfresh的时序特征抽取

为了避免提取无关的功能,tsfresh具有内置的过滤过程,这一过程评估每个特征的解释能力和重要性。我们也可使用标准的Filter、Wrapper、Embedded。

有时样本的标记成本高,我们可以使用半监督学习的方法--使用协同学习 (co-training),用有标记的数据迭代生成伪标记。

图 协同学习的标记过程

异常检测视角

接下来让我们从异常检测的视角去审视同样的问题,这里的异常表示广义的故障,即过程中至少一个特征或变量发生异常偏离。我们经常面对样本没有标记或标记主观差异性大的现实,可以说,无监督学习或者基于统计的离群点检测是工作的重点。

一般来说“异常”数据内含2个假定:1.具有某种比例稀少的特征。2.最少在某个隐空间中,与其他数据是A与A-bar(只有落在某区域才正常)或者A、B、C、D(异常数据自成一类)这样的关系。

图 正常数据与异常数据的两种关系

下面介绍几类效果较好的异常检测算法的原理及其适用场景。

一、基于统计的方法

这一类方法最为简单直接,且很多场景中相当有效。

在某个序列不含多个模式的时候,(举例)我们姑且默认某个数据分布近似正态分布,在1、2、3倍标准差内会有68%、95%、99%的数据,我们稍微放宽对分布的假设,可以想到箱线图。考虑把上下触须作为数据分布的边界,任何超过内限(或者外限)数据点都可以认为是离群点或异常值。

图 箱线图与正态分布

在实践中,应当注意“训练数据”的正常性,如果在适用一维GMM的数据(例如有开车、停车两种模式的电流测点数据)上使用该方法,效果应该不会很理想。

二、基于距离的方法

基于距离的方法同样是忽略了时序,只不过对象从单个测量值变成了时窗,在做完特征构建后,每个时窗都投射成了高维空间中的点。

用简单的K近邻就可以很好地进行异常检验,前提是我们构造特征空间的过程是合适的。一个样本点和它的第k个近邻的距离(或平均距离)就可以被当做score,显然异常点的score比较大。同样,具有噪声的基于密度的聚类方法(DBSCAN)和局部离群因子检测方法( LOF)通过计算数据密度来检测异常。当然,这同样要求在特征空间异常点所在空间的数据点少,密度低。孤立森林(IF)的原理也有异曲同工之妙,它假定远离主流样本的点可以被更少的超平面分离。

图 基于KNN的异常检测

除这些方法外,也可以直接对样本的协方差矩阵分析,把样本的马氏距离看作样本点的异常度。

三、基于重建误差

如果我们能标记或取得一些正常样本点,我们可以用“有罪推定”的想法,即“不像好的,那就是坏的”,利用重建误差做异常检测。在工业生产中,取正常样本是较为简单的事。

假设数据在低维空间上有嵌入,那么在低维空间投射后表现不好的数据点就可以认为是异常点。具体来说,PCA找到k个特征向量,计算每个样本再经过这k个特征向量投射后的重建误差,正常点的重建误差应小于异常点。

图 基于PCA的重构数据计算

利用同样的思想,我们也可以用自动编码器(AE)/GAN实现,基本上假设是异常点服从不同的分布。根据正常数据训练出来的AE,能够将正常样本重建还原,但是却无法将异于正常分布的数据点较好地还原,重建误差较大。在LSTM-GAN中,以 LSTM 为基本模型来捕获时间上的依赖关系,并将其嵌入到 GAN 的框架中,利用 GAN 的生成器和判别器来检测异常,利用判别器得到判别损失,利用生成器得到重建的损失。

四、基于时间序列预测

在工业场景中考虑时序的异常检测,与客流量预测、网络KPI异常检测等不太一样,因为很多测点的剧烈升降是客观的操作行为,我们可以结合监督学习过滤掉这些手动操作产生的错误告警。一般来说,考虑时序的异常检测可以分为对比与预测这两大类的方法。

对比方法指的是移动平均、绝对偏差等方法,这类方法用时序上最近的若干数据点做样本,和一个总体序列进行比对,不同的只是比对的对象。计算后常用残差的标准差判定异常。

图 使用滑动平均计算误差

预测方法包含统计上的分解方法、其他可用于时序预测的ML模型。这类方法实际上是预测某个时间点的数值,再衡量这个时间点的真实值与预测值的差值是否超过给定阈值,从而判定异常。

其中,STL会把时间序列分解为趋势项、季节项和余项。这种方法该方法的优点在于其简单性和健壮性。

图 基于STL的残差计算

同样,我们也可使用LSTM等模型得到预测序列,之后可用使用格拉布斯法判断残差值。

图 借助时序预测进行异常检测

五、预警上下限/预警带

在很多工业监测平台上,都标配预警上下限/预警带功能,这一功能直观且具有兜底能力,工厂管理人员与技术人员对此接受程度很高。

图 人工设置的监测预警带

这种方法有一些不足之处:

1.  只能针对一种工况,即使只有“开车/停车”,也只能设置-0.2-9.7这种包含两种模式大部分数据的预警带;

2. 太宽会漏掉异常,太窄会大量误报警。

结合基于距离、时间序列的一些方法,我们优化了预警带的效果。针对不同的工况,模型会给出特定的预警带,实现了更准确的监控,顺便也完成了不同工况生产的数据统计。

图 多工况模型控制的监测预警带

未来展望

故障监测、预测的解决方案与实施路径是很多的,在探索这些问题的同时,还可以结合寿命预测与维修决策共同研究:

1. 通过不同类型异常事件与设备寿命的建模,可以做基于预测信息的细化设备健康管理研究。

2. 工厂中有大量手工填写的维修记录表,如果可以做好基于NLP的粗糙故障信息知识表示与故障信息挖掘研究,有望形成故障树或者其他形式的智能维修决策。

工业场景中,我们探索如何从传感器数据中提取有价值的信息,工厂的数字化使得企业能够将人力聚焦于纯粹的生产。智能化的预知故障能够及时发现早期故障及隐患,减少继发性事故及恶性事故发生,对安全生产具有重要意义。

编辑:文婧
校对:林亦霖

原创 | 工业场景中的预测性维护相关推荐

  1. 工业物联网“杀手级”应用—预测性维护

    一.预测性维护的必要性 随着新一轮科技革命和产业变革的兴起,工业物联网.大数据.人工智能等技术正与经济社会各领域加速渗透融合.由于市场竞争对精细化成本管控的要求,设备的重要性越来越凸显,设备的维护对策 ...

  2. 通过SCADA实现KPI分析和预测性维护远比想象中简单

    一.前言 随着工业发展的不断进步,越来越多的企业开始注重KPI分析和预测性维护.通过数据分析实现智能制造已经成为不可缺少的环节.制定并分析关键绩效指标(KPI)是实现数据分析战略的重要一步,因为只有跟 ...

  3. 预测性维护和预防性维护的区别

    预测性维护和预防性维护是两种不同的设备维护策略,它们在维护时机.方法和效果上存在明显的区别.在工业生产和设备管理中,选择适合的维护方式对于提高设备的可靠性.延长寿命以及降低维护成本至关重要.本文将深入 ...

  4. 工业互联网的关键技术:边缘计算与预测性维护结合

    工业互联网是互联网和新一代信息技术与工业系统全方位深度融合所形成的产业和应用生态,是工业智能化发展的关键综合信息基础设施.智能制造是推进工业互联网工业化与信息化融合的重要方向,其中预测性维护则是智能制 ...

  5. 【智能制造】预测性维护:工业数字化领域潜在爆发点

    读而思 预测性维护对制造业的重要性已被充分认识和广泛接受.预测性维护是保证未来高效.可持续服务的关键.虽然预测性维护所依赖的技术已经取得了快速发展与突破,但在将数据系统地转化成(客户)利益并应用到特定 ...

  6. TDengine 在蓝深远望电机物联网监测预警与预测性维护平台中的应用

    作者:李凯 蓝深远望 小 T 导读:蓝深远望致力于服务政府及大型国有企事业单位的数字化转型,结合大数据.数字孪生.区块链.网络安全等核心技术,为政府运行.社会服务.城市管理.公共安全.基层治理等领域, ...

  7. 预测性维护:工业 4.0下人工智能如何改变机器设备维护方式

    生产设备出问题这种事一定会发生!这是生产领域不可避免的问题.但如何做好提前准备就可以决定故障造成影响的规模.如果能在故障变成绊脚石之前找到它们,可能就会完全消除中断生产的风险. 这正是预测性维护的目的 ...

  8. 机器学习中,什么是预测性维护,常见技术有哪些

    本文要点: 学习预测性维护系统(PMS),监控未来的系统故障并提前安排维护时间表 探讨如何构建机器学习模型进行系统的预测性维护 了解机器学习的处理步骤,如选择模型以及用Auto-Encoder技术去除 ...

  9. 基于工业智能网关的机械手监控与预测性维护解决方案

    如何远程监控机械手运行状态以及预测故障发生?由佰马工业智能物联网关BMG500.工业机器人.云管理平台组成的远程监控与预测性维护系统,可提前预判设备可能出现的问题,做到提前维护和保养. 为了提高生产效 ...

最新文章

  1. 新版CCNP中文版教材--ISCW
  2. android Adapter使用详解
  3. boost::test模块具有自定义初始化测试的共享库使用变体
  4. jQuery 学习笔记之二 (jQuery代码风格)
  5. DataTables怎么给某一列加上click事件
  6. 二叉树相关知识及求深度的代码实现
  7. shell脚本:/bin/sh^M: bad interpreter: No such file or directory。(转)
  8. 删除高频分量matlab,关于FFT之后怎么提出该频率分量
  9. 推特安卓版漏洞可导致攻击者访问用户私信
  10. spark 通过打散热点key解决数据倾斜问题
  11. 轮询机制是什么意思(通俗理解轮询)
  12. Java基础:第5-6章(重点)
  13. 无线路由器关掉dhcp服务器,无线路由器关闭dhcp会好不好
  14. 阿里云-对象存储OSS成本优化
  15. windows开启nfs_win7专业版怎么开启nfs_win7专业版启用nfs步骤
  16. 【题解 图论建模】 航空管制
  17. 【HTML5+CSS】怎样去美化你的页面
  18. Java计算平均成绩
  19. LInux:进程等待之wait() waitpid()
  20. hp打印机计算机无法与设备建立,hp 程序无法安装解决方法,hp打印机安装教程 电脑维修技术网...

热门文章

  1. vue项目中keep-alive的使用,从详情页返回列表时保存浏览位置
  2. 【LeetCode】3Sum Closest 解题报告
  3. 【webpack】-- 模块热替换
  4. iOS 疑难杂症— — 收到推送显示后自动消失的问题
  5. 考研-专业课-数据结构
  6. 支持手机版网站的We7CMS
  7. ASP.NET MVC 表单提交教程
  8. java dagger2_java – Dagger2不生成Daggercomponent类
  9. c语言编程取模运算ppt,c语言的取模运算
  10. 同时用引用和指针 int *a;