基于高斯混合模型和变量重构组合法的故障诊断与分离
基于高斯混合模型和变量重构组合法的故障诊断与分离
摘要:提出了一种将变量重构与高斯混合模型结合的故障诊断与分离的方法。首先建立过程数据的高斯混合模型,解决了监控过程的测量数据不服从单峰的高斯分布所带来的问题,然后进行故障数据变量重构,估计未知参数并采用最大期望算法来估测均值与协方差矩阵。在此基础上建立统计模型进行故障的诊断与分离。与传统的贡献图分离故障的方法比较,通过田纳西一伊斯曼化工过程进行实验验证,本文提出的高斯混合模型与变量重构相结合对多状态过程进行故障的诊断与分离收到较好效果。关键词:控制工程;故障诊断与分离;贡献图;变量重构;高斯混合模型多变量统计过程控制技术已经广泛应用于石油,化工,制药等工业过程中,特别是基于统计方法的PCA与PLS技术近年得到了很大发展,取得了许多研究与应用成果。应用多变量统计过程控制理论进行过程监视与故障诊断通常采用监视得分向量,平方预测误差(SPE)等统计性能指标对过程进行监视,通过贡献图监视对过程故障的贡献进行故障的诊断与定位,确定产生故障的故障源。虽然贡献图能够对产生故障的变量进行辨识,但由于残差空间中变量的线性相关性使其对Q统计的贡献可能产生不准确的诊断,尤其是当降维的得分向量,接近于记录的过程变量时,这种状态体现得更为明显。针对这类问题,本文首先采用变量重构的方法对过程进行故障诊断与分离,但尽管应用变量重构法已经得到了比较理想的诊断结果,但是由于正常的过程数据必须来源于单一的操纵条件而且服从于单峰的高斯分布,这一限制条件使得单纯依靠故障重构来进行故障诊断产生一定的误差。在实际工业过程中,操纵条件由于原料,生产性能,环境变化和生产策略等诸多因素的改变而不断变化,因此应用过程变量直接采用多变量统计方法将产生一系列的问题。本文提出了一种将高斯混合模型与变量重构相结合的方法,以提高故障诊断的可靠性。将正常的过程采样数据分配到多个局部的高斯分布模型中,在每一个局部高斯模型中,采样数据全部服从高斯分布,然后再利用PCA或PLS等方法进行故障诊断,最后,利用贝叶斯推论将不同的局部高斯模型合并成一个全局高斯模型,并且得出相应的统计量进行分析与判断,此方法提高了故障诊断与分离的性能。1 基于过程变量贡献的故障诊断与分离为了确定与定位传感器或过程发生故障的故障源,通常利用Q统计法来进行判断,但Q统计法在故障检测方面效果十分明显,许多情况下却不能准确地对故障进行分离。以TE过程为例进行实验仿真研究,收集过程数据为含有480个采样时刻,52个过程变量,得到Q统计量第47个采样时刻,第220个采样时刻,第301个采样时刻和第400个采样时刻等,都发生了异常。第5~12个变量在第170~230个采样区间内得出一个区间贡献图。第6个变量和第9个变量在170~ --230时刻之间对Q统计的贡献最大,因此不难看出这些变量是产生故障的基本要素所在,但如果进一步明确判断故障源,这两变量的混杂信息的区分却很困难,并且变量间的相关性也使这种判断不十分明确。2 高斯模型与变量重构组合的故障诊断与分离2.1 故障重构应用贡献率能够确定产生故障的若干变量,但由于PCA 的残差空间的变量有很强的相关性,而Q统计量所反映的是残差空间各个变量的变化,是模型外部数据变化的一种测度,所以针对Q统计分布得到的贡献图,很难准确确定故障源。为了避免上述问题的发生,本文研究了变量重构法进行故障诊断与分离[nqz]。应用PCA模型,即z(k)=PPTz(k)=Cz(k),其中,C—PP ,对 (正)和矩阵C进行重新组合。经过变量重构后,得出的变量贡献,比较明显,仅仅第6个变量对Q统计量贡献最大。2.2 高斯模型由于应用多变量统计方法的前提条件是采样数据必须服从单峰的高斯分布,但各种外界因素的干扰与改变,致使很难满足这一条件。然而,在以往的故障诊断中,即使应用变量重构法也往往忽略这一前提条件,即人为假设采样数据都服从单峰高斯分布,这就大大减弱了故障诊断的准确性,针对这个问题,通过构建高斯模型可以改善由于数据本身带来的问题。2.3 高斯模型与变量重构结合的故障诊断与分离将高斯模型与变量重构相结合能够融合变量重构与高斯模型的各自优势来避免过程故障诊断与分离的不可靠性。具体步骤为,首先令z (k),其中,z (k)是由式(2)得到的重构变量,然后,估计未知参数,这里采用最大期望算法来估测均值与协方差矩阵。对于无监督的聚类,首先必须为每一个样本指定一个类别,这一步可以通过其他的聚类方法实现,如K—means法,求出各个类别的中心和每一个样本的类别,然后求出各个类别中样本的协方差阵,可以用每个类别中样本的个数来表示该类别的权重。将新的参数,诸如均值,方差,分类的先验概率进行计算,直到样本集合对各个分类的似然函数不再有明显的变化为止。最终,通过新的参数构建了GMM 模型,再利用贝叶斯推论来确定置信区间。贝叶斯推论表达式。为了说明变量重构与高斯结合法的可用性,在以上的TE过程中,第1OO~190个采样时刻之间,加入1.3的偏差干扰。分析一种新型通信基站方案简介通过将传统的多变量统计方法与变量重构和高斯相结合的方法比较,后者在提高故障诊断可靠性上显示出了更多的优势。因为变量重构能解决残差空间变量相关性带来的问题,而高斯模型能够克服PCA/PLS的过程数据必须服从单峰高斯分布这一局限性,此方法融合了这些优点,大大提高了故障诊断的可靠性。谈谈机床自动化的故障排除技术3 结束语本文深入研究了基于变量贡献进行过程故障诊断与分离的方法。但由于PCA/PLS的残差空间的变量是线性相关而导致的故障诊断与分离的不准确性,通过引入变量重构法,克服了一些贡献率判断所带来的问题,但由于变量重构在多变量统计分析中应满足过程采样数据服从单峰高斯分布的条件,这在实际的工业过程是很难达到的,因此可见依靠变量重构法也不能达到最理想的故障诊断。因此,本文采用了将多变量统计法与变量重构和高斯相结合的方法,通过将此两种方法进行比较,表明了应用高斯模型和变量重构结合法进行故障诊断的可用性与可靠性。