动态故障诊断中的立体因果建模与不确定性推理方法
董春玲 1 , 赵越 2 , 张勤 1,2     
1. 清华大学 计算机科学与技术系, 北京 100084;
2. 清华大学 核能与新能源技术研究院, 北京 100084
摘要:为满足复杂系统的动态、实时和高可靠性的故障诊断需求,克服动态不确定因果图(dynamic uncertain causality graph,DUCG)及其他概率图模型的局限,该文在DUCG理论的基础上扩展其时序因果表达与推理方法,建立了立体DUCG(Cubic DUCG)理论模型。采用动态的手段处理动态问题,以"逐步生长"的立体因果建模取消了时序模型中常见的Markov假设限制,以穿越式因果连接准确地表达动态系统下故障的产生、演变和发展;直观地刻画和处理动态负反馈等复杂故障逻辑因果关系;给出了严谨、高效的动态推理算法。宁德核电站1号机组CPR1000模拟机二回路系统上的故障实验结果表明:Cubic DUCG诊断推理准确、高效,能有效处理负反馈等复杂动态情形。
关键词故障诊断    时序因果建模    概率推理    动态不确定性    动态负反馈    
Cubic causality modeling and uncertain inference method for dynamic fault diagnosis
DONG Chunling1, ZHAO Yue2, ZHANG Qin1,2     
1. Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China;
2. Institute of Nuclear and New Energy Technology, Tsinghua University, Beijing 100084, China
Abstract: Complex systems need dynamic, real-time, reliable fault diagnostics but current methods have some shortcomings. This paper expands the dynamic uncertain causality graph method (DUCG) for temporal causality modeling and reasoning theory to correct the limits of the DUCG method and other probabilistic graphical models. A Cubic DUCG is developed that is characterized by a true dynamic model of dynamic problems. The cubic causality graph abandons the restriction of the Markov assumption usually used in temporal models with the fault formation, evolution, and development in dynamic systems represented by allowing causal connections to penetrate among any number of time-slices. The negative feedback dynamics is modelled intuitively combined with a reliable dynamic inference algorithm. Fault tests on the secondary loop of Ningde Nuclear Power Plant Unit 1 (CPR1000) simulator show that Cubic DUCG is accurate, efficient, and capable of dealing with the complex dynamics including negative feedback.
Key words: fault diagnosis     temporal causality modeling     probabilistic reasoning     dynamics and uncertainties     dynamic negative feedback    

在复杂系统的故障早期,快速、准确地定位故障根源、预测故障发展,可有效避免故障扩散、降低故障损失。但大量存在于现实系统的不确定性、模糊性、随机性等增加了故障建模和诊断推理的难度。而且,故障过程往往是动态演变的,时序观测数据下的知识表达和推理技术十分复杂,要能有效表达动态的不确定性因果关系、逻辑循环等,计算效率也须满足实时性、准确性、鲁棒性等要求,并具备良好的可解释性和工程实用性。

国际上面向诊断应用的不确定性时序建模研究包括隐Markov模型(hidden Markov models, HMMs)及其扩展[1-2]、证据图的时序扩展[3]、模糊逻辑中带时序约束的动态推理算法[4-5]以及其他方法[6-7]。Bayes网络(Bayesian networks,BNs)的时序扩展也是其中一大类,例如时序事件BNs[8]、离散时间概率事件网络[9]、连续时间BNs[10]、无限隐事件模型[11]等,最有代表性的当属动态Bayes网络(dynamical Bayesian networks, DBNs)[12]。DBNs可对变量在时间序列上的状态动态演化过程进行建模与分析,被广泛用于系统故障诊断和可靠性分析[13-14]等。DBNs通常采用一阶Markov假设:t时刻变量集合Xt只与(t-1)时刻有关,而与更多的过去时刻无关,即XtXt-2|Xt-1。DBNs推理算法多是基于静态BNs的扩展,精确推理包括前向后向平滑算法、分解树算法、接触面算法、Islands算法等,近似推理包括边缘算法[12]、Boyen-Koller算法、粒子滤波算法等。DBNs主要局限于大规模系统应用下模型和推理计算的复杂性,且BNs不能处理静态逻辑循环等问题。

综合来看,当前面向诊断推理的时序因果建模方法中很多研究将动态推理问题分解为一系列静态问题的累加求解时,难以准确表达事物的因果演化特征和有效处理动态负反馈等复杂逻辑因果关系。此外,很多模型与推理方法的可解释性较差。并且,对核电站等复杂工业系统而言,往往存在历史故障样本稀缺、模型学习所需训练数据不足等问题。

为解决上述不确定性知识表达和动态推理问题,动态不确定因果图理论(dynamic uncertain causality graph, DUCG)[15-18]被提出。它具有简洁、严谨的知识表达模型和高效、精确的推理方法,可处理静态逻辑循环,允许知识不完备、观测数据有缺失、信号虚假等。近年来,DUCG在核电、化工、航天系统故障诊断和可靠性分析[16-21]、智慧医疗[22]等领域均有应用。

1 DUCG简介及时序因果推理问题

DUCG的核心思想是将不确定因果作用机理用虚拟的独立随机事件来表达,并将不确定性量化为随机事件发生的概率和因果关系存在的概率,从而将基于证据E的诊断推理首先转换为因果图的化简、降低模型规模,然后进行逻辑推理以定性求解E条件下的假设空间,最后进行概率计算[15]

1.1 DUCG不确定性因果表达机制

图 1所示,DUCG因果图中B为基本变量,表达根原因事件,分为初因事件(如B1)和非初因事件(如B7)两类。在过程系统中,初因事件可独立引发系统异常,而非初因事件需受某初因事件触发才起作用。X为结果变量(通常可观测),DX变量的缺省原因事件。逻辑门G表达变量的组合逻辑关系,如图 1G1的1状态表达式为G1, 1=X4, 2B7, 1。这里变量V∈{B, X, D, G}在给定状态时成为事件,记作Vi, jVij,其中i为变量编号,j为状态编号(0状态表示正常,非0表示异常)。图中有向弧表示变量间的权重因果作用事件Fn, k; i, j≡(rn; i/rn)An, k; i, jrn; i>0为父变量Vi与子变量Xn间的因果关系强度,rn$\sum\limits_{i}{{{r}_{n;i}}}$An, k; i, jVi, j导致Xn, k发生的虚拟因果作用事件,以其参数值an, k; i, j=Pr{An, k; i, j}量化因果作用的不确定性。

图 1 DUCG因果图示例

1.2 DUCG动态诊断推理算法

DUCG动态推理是基于证据E(t)=$\prod\limits_{m=1}^{n}{E\left( {{t}_{m}} \right)}$计算假设事件Hk, jSH(t)的后验概率Pr{Hk, j|E(t)},Hk, j通常为Bk, jj≠0,SH(t)称为t时刻的假设空间。采用条件独立性假设——DUCG假设6[17](本文沿用DUCG系列论文中给定的假设编号),将动态诊断推理分解为一系列静态时间片上的推理集成。类似的条件独立性假设也运用在DBNs和HMMs中。

假设6  在给定故障假设Hk, j的前提下,不同时刻tm所收到的证据E(tm)之间彼此独立,即$\Pr \left\{ \prod\limits_{m=1}^{n}{E\left( {{t}_{m}} \right)}|{{H}_{k, j}} \right\}=\prod\limits_{m=1}^{n}{\Pr \left\{ E\left( {{t}_{m}} \right)|{{H}_{k, j}} \right\}}$

此外,为保证推理算法的有效性,DUCG还提出了假设5[17],如图 2所示。

图 2 DUCG假设5

假设5  对于同一故障发展过程中任意时刻tm上所收到的一组证据$E(t_m){\rm{ }} \equiv \prod\limits_{i}{{{E}_{i}}\left( {{t}_{m}} \right)}$,假设事件Hkj均能通过tm时刻的静态因果图解释每一个证据Ei(tm)。

基于假设5和6,DUCG给出动态推理计算公式:

$ h_{k, j}^{s}\left( t \right)=\frac{\prod\limits_{m=1}^{n}{h_{k, j}^{s}\left( {{t}_{m}} \right)/{{\left( h_{k, j}^{s}\left( {{t}_{0}} \right) \right)}^{n-1}}}}{\sum\limits_{j}{{}}\prod\limits_{m=1}^{n}{h_{k, j}^{s}\left( {{t}_{m}} \right)/{{\left( h_{k, j}^{s}\left( {{t}_{0}} \right) \right)}^{n-1}}}}. $

其中:hk, js(t)≡Pr{Hk, j|E(t)},hk, js(tm)为tm时刻Hk, j的状态概率Pr{Hk, j|E(tm)},t0为收到故障证据前的时刻[17]

1.3 处理时序因果关系及负反馈等复杂推理问题

1) 时序因果作用中的延展和延滞。

DUCG的上述假设虽是国际上处理动态推理问题常用的方法,但在一定程度上限制了因果作用可穿越时间片的特征,使得推理无法给出符合时序因果逻辑的解释。动态系统中穿越式因果作用可分为因果作用延展和因果作用延滞两类,分别定义如下:

定义1  因果作用延展:时序因果作用中结果事件在不受其他因素改变的情况下可保持其状态不变至后续时刻,即在tp时刻Vij(tp)导致Xnk(tp)发生,Xnk若无其他因素作用则会保持此状态至后续时刻tq,且后续所有Xnk(tm)的原因都应追溯至 Vij(tp),pmq

图 3a为化简后因果图。变量状态除以其下标来标识之外,各状态还采用不同图形颜色(灰度图中灰度不同)作区分。t1时刻X3, 2(t1)导致X2, 1(t1),且X2, 1保持该状态至t2时刻。此时原因变量X3已在X4, 2(t2)的作用下状态变更为X3, 4(t2),这使得结果事件X2, 1(t2)在t2时刻内的因果图中找不到解释(真实原因应为X3, 2(t1))。这就是因果作用延展的情形。按照原DUCG推理方法,由于t2时刻假设5不满足,就会将X2, 1(t2)视为无法解释的孤立异常证据。

图 3 时序因果关系中的典型情形

定义2  因果作用延滞:时序因果作用下结果事件的出现可存在时滞性,即在tp时刻Vij(tp)应导致Xnk(tp)发生,但Xnk并未在tp时刻内出现,而是直到后续时刻tq才被观测到,pqVij(tp)与Xnk(tq)之间的因果作用可穿越多阶时间片:当q=p+1时,Vij(tp)→Xnk(tq)为一阶穿越式因果关系;当q=p+2时,Vij(tp)→Xnk(tq)为二阶穿越式因果关系,依次类推。后续所有Xnk(tm),pmq,其原因事件都应追溯至Vij(tp)。

图 3b所示,变量X1t1时刻是正常的(不出现在化简图中),假定X2, 1(t1)会导致X1, 2,但由于时间延滞,直到t2时刻X1, 2才出现;X1, 2(t2)的真实原因是X2, 1(t1),但t2时刻X2X3, 2(t2)的作用下其状态已变更为X2, 2(t2),因此X1, 2(t2)在t2时刻内无法被解释。综上,图 3中的两种时序因果作用情形下都应建立穿越式因果连接,DUCG的假设5和6均无法满足。

2) 表达动态负反馈中的复杂逻辑因果关系。

当对象系统中存在负反馈过程时,故障信号会出现高低振荡,此时观测证据Ei(tm)的真实原因往往并不包含在静态DUCG图中(不符合假设5)。如图 4所示,这是文[18]中核电站二回路系统U形管破裂故障实例,选取了其中3个时刻的故障因果图。变量X1X2X3X12X13X15X23X26的信号数据在图 4t2t3时刻出现振荡,呈典型的动态负反馈特征。t2t3时刻内的因果图均不满足假设5,其中都含有异常信号无法由根原因B102, 1(蒸汽发生器U形管破裂)解释。为此,文[18]引入“Technical Treatment机制”来处理动态负反馈问题:若早期观测信号朝某个方向偏离正常值,则该信号所有后期振荡变化中的回归正常或朝反方向偏离的实际观测值均不予考虑,即证据中仅保留故障信号的最初异常偏离值。根据该Treatment机制,图 4t2t3时刻异常信号的真实状态均被依照t1时刻的初始状态更改,最终这2个时刻的诊断推理因果图都被处理为图 5

图 4 U形管破裂故障3个时刻的静态因果图

图 5 图 4t2t3时刻经DUCG处理后的因果图

该Treatment机制的不足:方法的可解释性较差,对DUCG因果图建模的精确性要求较高,此外,故障变量的首个异常信号可能取值很小而未被观测到等。这些问题为Treatment的有效实施带来困难。为此,文[18]提出了立体DUCG的设想并以示例介绍了其理论轮廓,但未详细研究技术方法。本文正是为实现这一构想,取消DUCG的假设5、假设6和Treatment,研究以立体动态因果图建模复杂系统故障的动态演变过程,并建立严谨的诊断推理算法。

2 Cubic DUCG立体因果建模

Cubic DUCG中定义的部分术语:Slice_DG(Bi, tm),tm时刻(下同)故障模式Bi对应的时间片内因果图;Cubic_DG(tm),立体因果总图;Cubic_DG(Bi, tm),故障模式Bi对应的立体因果图;Cubic_DG*(Bi, tm),故障模式Bi对应的推理因果图;CE(Bi, tm)和Cubic_DG(Bi, tm)内所含证据。

2.1 初因故障模式分解及时间片内横向因果化简

依据文[20],对于连续平稳运行的过程系统而言,大规模、复杂、包含多种初因故障假设的DUCG图可被分解为一系列子图,彼此互斥并穷尽所有故障假设,从而降低运算复杂度而不影响诊断推理的精确性。据此,收到证据E(tm)后的Cubic_DG(tm)可分解为多个Cubic_DG(Bi, tm),分别表示由初因事件Bi或其合并非初因事件作为根原因所引发的故障传播因果过程。

时间片内横向因果化简是将Slice_DG(Bi, tm)内不受证据支持的、无意义的、与推理无关的事件删除掉。Cubic DUCG横向因果化简规则基于DUCG原有化简规则[15]进行适应性修改。此外,依据穿越式因果连接的特征,由于在Slice_DG(Bi, tm)内无因果解释的变量可以从前序时间片中追溯到其父变量,因此不保留原DUCG下的规则10:“如果证据显示Xnk成立,但若Xnk由于某种原因并无任何输入变量,则为Xnk增加一个虚拟的父变量Dn,满足ank; nD=rn; D=1。”横向化简完毕后Slice_DG(Bi, tm)所含变量集合为DG_Nodes(Bi, tm)。若有异常证据变量无法解释,暂不处理,留待后续Slice_DG(Bi, tm)与Cubic_DG(Bi, tm-1)连接合并、完成Cubic_DG(Bi, tm)的构建后再做立体因果约简和无效因果图剔除处理,tm=t1时除外。

2.2 立体因果关系建模与动态负反馈因果表达

1) Slice_DG(Bi, tm)与Cubic_DG(Bi, tm-1)的穿越式连接。

穿越式因果连接采用“由子及父”的追溯连接方式:对Slice_DG(Bi, tm)中每个证据Ei(tm),分别判断并建立其与Cubic_DG(Bi, tm-1)内变量间的因果连接。任意变量对Vyg(tp)与Xnk(tq)之间的因果关系存在与否(pq),均以相应作用事件矩阵An; y中的参数为基本依据(ank; yg=0与否)。实施方法为:

步骤1  对于变量Xnk(tm)∈DG_Nodes(Bi, tm),若∃Vyg(tp)∈Cubic_DG(Bi, tm-1),1≤pmV∈{B, G, X},且ank; yg≠0,则建立Vyg(tp)→Xnk(tm)(kg可为已知或未知);

步骤2  当Cubic_DG(Bi, tm-1)中含有与Xnk(tm)同状态的同一变量时(如Xnk(tm-1)),可省略对Xnk(tm)的穿越式因果连接判断,直接继承Xnk(tm-1)的上游因果解释即可;

步骤3  因果作用关系Vyg(tp)→Xnk(tm)和Vyg(tp)→Xnk(tm)不能同时成立(矛盾起效),Vyg(tp)→Xnk(tm)和Vyg(tp)→Xnk(tm)也不能同时成立(冗余起效),1≤pmk′≠kg′≠gp′<pm′<m

若变量Xnk在连续时刻tqtq+1内状态不变,则Xnk(tq+1)的逻辑展开可继承Xnk(tq)处的父变量Vyg(tp)的因果作用,并在立体因果图中以竖向实线连接二者。对于继承过来的因果链,因果作用已延展起效,所以Xnk(tq+1)处不需再重复地与这些因果链中的父变量建立穿越式连接。如图 3a所示情形,在Cubic DUCG下建模为图 6a立体因果图。其中,X1, 1(t1)与X1, 1(t2)以及X2, 1(t1)与X2, 1(t2)均为因果作用延展。X2, 1(t2)从X2, 1(t1)处继承了其父变量的上游因果作用X3, 2(t1)→X2, 1(t1),因此X2, 1(t2)的逻辑展开表达式为:X2, 1(t2)=X2, 1(t1)=F2, 1; 3, 2(t1; t1)F3, 2; 1, 1(t1; t1)F1, 1; 5, 1(t1; t1)B5, 1图 3a中正常证据X4, 0(t1)因与假设事件B5, 1直接相连,预期应当出现由假设事件所致的异常但却观测为正常,故此在t1时刻为“负证据”,因其降低了假设事件的置信度;但至t2时刻已出现异常X4, 2(t2),因而X4, 0(t1)在图 6a中不再作为负证据保留。

图 6图 3时序因果关系建立的立体因果图

此外,对于当前证据变量Xnk(tm)首先判断Slice_DG(Bi, tm)中Vyg(tm)→Xnk(tm)是否已成立,若是,则不需重复地到前序时间片内追溯建立Vy(tm)与Xnk(tm)间的因果连接(1≤m′≤m-1);否则,就应建立用于表达因果作用延滞的穿越式因果连接。结合Cubic_DG(Bi, tm-1)沿时序由近及远向前追溯,从Vy(tm-1)起直至Vy(t1),一旦找到某个Vyg(tm)可满足Vyg(tm)→Xnk(tm)(1≤m′≤m-1,kg′已知或未知),则建立该穿越式因果连接,并停止因果追溯;发现Cubic_DG(Bi, tm-1)中已有Vy(tm)→Xn(tm)成立(1≤m′≤m″≤m-1)时,则中止因果追溯。图 6b是对图 3b因果作用延滞情形所建立的立体因果图。

2) 表达动态负反馈立体因果关系。

图 1原始因果图,假设在连续3个时刻收到异常证据如下,其余变量均为正常。

t1时刻证据E(t1)=X2, 1X4, 2X5, 1X6, 2

t2时刻证据E(t2)=X2, 1X4, 1X5, 1X6, 2

t3时刻证据E(t2)=X2, 1X4, 1X5, 2X6, 2

其中变量X4X5涉及在一个动态负反馈回路中。通过运用上述立体因果关系建模策略,得到立体因果图如图 7。此外,对于图 4中动态负反馈故障传播实例建立立体因果图(图 8)。此二例对照图 3-5中原DUCG的处理来看,Cubic DUCG对于动态负反馈等复杂因果过程中各种信号的异常波动、交互因果作用均可清晰准确地表达。

图 7图 1动态负反馈问题建立的立体因果图

图 8图 4动态负反馈故障建立的立体因果图

3 Cubic DUCG动态推理算法 3.1 立体因果图约简

Cubic DUCG动态推理首先开展立体因果图约简,即将Cubic_DG(Bi, tm)内连续时间片上因果解释链路相同的变量重合,转换为Cubic_DG*(Bi, tm)。“约简”不同于“化简”,不等于删除,约简表示逻辑意义重合的变量及因果关系在立体因果图中约除重复、合而为一,而这些变量和关系在因果图中仍然存在,只是因其逻辑意义等同、推理中可依据幂等律吸收,因此通过因果约简来获得因果图模型的简化。立体因果约简实施策略:对tαtβ时刻的一系列状态不变的Xnk(tp),1≤αpβm,若在故障因果发展过程中其逻辑因果不变,则被重合为一个节点Xnkγ (1≤γm),代表Cubic_DG(Bi, tm)生长过程中Xnk的第γ次重合(每段重合对应一个Xnkγ节点,无法合并的重合点彼此不同),XnkγXnk(tα)。图 7中Cubic_DG(B1, t3)经立体因果图约简后得到Cubic_DG*(B1, t3)如图 9,重合节点包括X2, 11=X2, 1(t1)=X2, 1(t2)=X2, 1(t3),X6, 21=X6, 2(t1)=X6, 2(t2)= X6, 2(t3),X4, 11=X4, 1(t2)=X4, 1(t3),X5, 11=X5, 1(t1)=X5, 1(t2)。Ei(tm)在Cubic_DG*(Bi, tm)和Cubic_DG(Bi, tm)上逻辑展开结果等同。限于篇幅,有关证明将在其他论文中给出。

图 9图 7进行立体因果约简后的Cubic_DG*(B1, t3)

3.2 Cubic DUCG动态推理算法

Cubic DUCG的动态推理基于故障出现以来完整的因果传播关系,推理算法为:在收到故障证据的tm时刻,首先基于Cubic_DG*(Bi, tm)计算证据CE(Bi, tm)的权重逻辑展开表达式得到假设空间SHi(tm)[15-16];然后计算各假设事件Hk, j在CE(Bi, tm)条件下的状态概率hk, js(tm)≡Pr{Hk, j|CE(Bi, tm)};当存在多个有效Cubic_DG(Bi, tm)时,状态概率使用Cubic_DG(Bi, tm)对应的权重因子ξi(tm)作修正:

$ \begin{align} &h_{k, j}^{s}\left( {{t}_{m}} \right)=h_{k, j}^{s}\left( {{t}_{m}} \right)\cdot {{\xi }_{i}}\left( {{t}_{m}} \right), \\ &{{\xi }_{i}}\left( {{t}_{m}} \right)=\frac{\Pr \left\{ \text{CE}\left( {{B}_{i}}, {{t}_{m}} \right) \right\}}{\sum\limits_{i}{\Pr \left\{ \text{CE}\left( {{B}_{i}}, {{t}_{m}} \right) \right\}}}. \\ \end{align} $

最后对SH(tm)=$\bigcup\limits_{i}{{{S}_{{{H}_{i}}}}\left( {{t}_{m}} \right)}$计算所有Hk, jSH(tm)的总排序概率,具有最大排序概率的Hk, j是最可能的故障根原因:$\underset{{{H}_{k, j}}\in {{S}_{H}}\left( {{t}_{m}} \right)}{\mathop{\arg \max }}\, \left( h_{k, j}^{s}\left( {{t}_{m}} \right) \right)$

Cubic DUCG降低推理运算复杂度的策略包括:1)在降低模型复杂度上,立体因果图可依据在线证据动态化简、降维,大量与问题无关、与证据矛盾的变量被排除在推理运算范围之外,使得计算量呈指数规模下降;并通过立体因果图约简,在不损失时序因果信息和逻辑推理精确性的前提下约除重合事件和因果关系,有效降低因果图模型的规模和复杂度。2)在推理运算上,采用权重逻辑推理下的链式因果展开求取故障假设空间,实行权重系数代数运算与因果事件逻辑运算相融并存的推理运算新方法[15-16, 23]。权重逻辑推理可自动实现多连通因果关系的分解,并以逻辑吸收等操作削减逻辑表达式的复杂度,具备有别于常规概率推理方法的高效性和准确性特征[23];并且Cubic DUCG的动态推理不采用DUCG在时序证据间独立性假设下的综合递归推理方式,算法更简洁、严谨;此外提出了“事件级早期逻辑吸收策略”,用于在因果图规模大、多连通因果关系多以及收到大量异常证据等情况下提升推理效率,限于篇幅,此内容将在其他论文中讨论。

4 故障诊断推理实验

本研究针对中国广东核电集团有限公司(简称中广核)宁德核电站1号机组(CPR1000,额定功率1 089 MW),建立了二回路系统典型故障的诊断因果图模型。选取二回路系统中给水管道泄漏、凝结水泵故障、主蒸汽集气管破裂等19类、24种现代核电站压水堆机组典型故障。以中广核仿真技术有限公司为宁德1号机组建造的模拟机作为实时故障诊断测试平台。

实验开展了对Cubic DUCG的全面理论测试,包括模型的有效性、正确性和运算效率,以及对动态负反馈等复杂因果关系的建模与推理求解能力。经反复测试,Cubic DUCG推理算法在这24种故障模式下给出的诊断结果均与专家结论相符,诊断正确率达100%,绝大多数推理均可在1秒以内完成(测试环境:计算机配置为Intel Core i7 1.73 Hz/4 GB),多集中于200 ms左右,可满足工程系统在线运维的效率需求。这里以含动态负反馈问题的低压给水加热器管道泄漏故障(B15)为例介绍测试结果。

4.1 故障描述

低压给水加热器ABP401RE发生管道泄漏故障时,会直接导致蒸汽压力下降、低压加热器蒸汽阀门关闭、A列低压加热器隔离和旁路阀开启,并引起低压加热器水位升高(X55, 2),进而导致水位控制阀开启(X193, 2),低压加热器疏水流量增加(X57, 2),低压加热器稳压器的水位上升(X58, 2),而这又可能导致低压加热器水位降低(X55, 1)、水位控制阀又关闭(X193, 1),于是低压加热器疏水流量减小(X57, 1),低压加热器稳压器水位(X58, 1)下降,又再引起低压加热器水位升高(X55, 2),如此波动。上述故障演变过程是典型的动态负反馈问题,图 10是模拟机输出的两个变量X55X58的信号波动情况。模拟机共生成了212组监测数据,包含有新增异常信号的时间点23个,以下选取t1t3t6t9时刻给出测试结果。

图 10 低压加热器管道泄漏故障中异常监测信号波动

4.2 故障诊断推理实验过程

1) t1时刻诊断结果。

t1时刻观测到首批的3个异常信号(X173, 1X174, 1X47, 1),Cubic DUCG给出的概率推理结果如表 1所示,其中多种故障根源假设均可解释所观测到的异常信号。

表 1 低压加热器管道泄漏故障t1时刻诊断推理结果
故障原因 描述 概率
B22, 1 主蒸汽隔离阀
VVP001VV意外关闭
0.332 1
B23, 1 主蒸汽隔离阀
VVP002VV意外关闭
0.332 1
B24, 1 主蒸汽隔离阀
VVP003VV意外关闭
0.332 1
B19, 1 给水加热器旁路阀
AHP009VL意外关闭
0.003 4
B16, 1 给水加热器旁路阀
AHP011VL意外开启
0.000 2
B15, 1/B18, 1/B26, 1 /B28, 1 低压加热器ABP401RE
管道泄漏等9种假设
0.000 1

2) t3时刻诊断推理因果图。

图 11at3时刻立体诊断因果图,图中变量用绿色、黄色、蓝色分别代表其状态的正常(0状态)、偏高(2状态)和偏低(1状态)。此时构成负反馈过程的3个异常信号X55, 2X57, 2X193, 2均已出现。推理机在t2时刻就已排除了其他故障根源假设,将诊断结论唯一地确定为B15, 1

图 11 (网络版彩图)Cubic DUCG在t3t6t9时刻的立体推理因果图

3) t6时刻诊断推理因果图。

图 11b所示t6时刻立体诊断因果图中,X55X57X58X193的相应信号已陆续出现由前序时间片上的偏高状态(状态2)转向偏低状态(状态1),即呈现动态负反馈及其所致信号高低振荡的现象。该图直观地表达了这一动态负反馈故障的产生和发展过程。

4) t9时刻诊断推理因果图。

图 11c所示Cubic_DG(B15, t9)中,X55X57X58X193等故障信号继续振荡演变、同时伴有其它异常观测信号出现。故障根原因假设B15, 1可构成对该故障因果逻辑关系的完整解释。

4.3 实验结果的对比分析

上述故障诊断实验中若以原DUCG建模和推理方法开展诊断分析、依据“Treatment”机制处理动态负反馈,则t3t6时刻所得静态DUCG诊断因果图如图 12所示。其中,t6时刻的实际观测信号X55, 1X57, 1X58, 1X193, 1均对应被更改为其初始观测状态:X55, 2X57, 2X58, 2X193, 2,这使得DUCG推理方法的可解释性不高。与之相对,Cubic DUCG因果图(图 11b)更清晰准确地表达了故障演变的时序因果特征。

图 12 (网络版彩图)DUCG模型在t3t6时刻的推理因果图局部

5 讨论

由于动态推理的复杂性,原DUCG模型及DBNs等都采用了X57, 2X58, 2时序证据间的条件独立性假设, DBNs中还运用了一阶Markov假设等。然而,跨时刻、多阶的逻辑因果关系在复杂系统中很常见。Cubic DUCG的时序因果建模允许因果关系跨越任意多个时间片,取消了这些假设的限制。此外,DBNs在实际应用中往往受制于精确推理的复杂度问题,随着时间片的累积、节点数目增多,计算量常会呈现爆炸性增长。Cubic DUCG通过因果化简、重合处理、立体因果约简、权重逻辑推理等措施大幅降低了模型和运算的复杂性,可满足大型系统在线运维的效率需求。

此外,BNs和DBNs采用的是隐式(implicit)因果表达方式,参数值的不同可代表逻辑因果关系的不同,其模型对参数值的准确性很敏感;且BNs中条件概率表所含参数众多,需要大量样本数据用于模型的学习训练。但对于本研究所面向的核电站等复杂工业系统而言,高可靠性的运行要求决定了这些系统下历史故障数据缺乏,而同时很多实际应用甚至要求能对从未发生过的故障进行诊断和预测。此时依赖大数据学习的方法就无能为力了,DBNs也难以适用于这类系统。DUCG模型是显式(explicit)因果表达,对参数精度不敏感、有很强的鲁棒性,参数既可取值于主观信度和经验知识,又可通过样本数据学习得出[24];模型中不被关注的数据缺失及参数值的轻微扰动也不影响推理的准确性,这些确保了Cubic DUCG的工程实用性。

6 结论

Cubic DUCG面向大规模复杂系统动态的故障诊断应用,构建立体因果图表达复杂故障的形成和演变过程,探讨了时序因果关系的表达与立体因果图生长策略,解决了因果作用延展、延滞、动态负反馈等复杂逻辑因果建模问题,并给出了精确高效的动态推理算法。本文利用宁德1号核电机组模拟机对Cubic DUCG开展了故障诊断实验,检验了立体因果建模和动态推理算法在实时故障诊断推理中的有效性、正确性和推理效率。未来将针对实际工程应用需要对推理运算效率做进一步的优化提升。

参考文献
[1] HELLER K A, TEH Y W, G R R D, UNIT G. Infinite hierarchical hidden Markov models[J]. Journal of Machine Learning Research, 2009, 5: 224–231.
[2] PETROPOULOS A, CHATZIS S P, XANTHOPOULOS S. A hidden Markov model with dependence jumps for predictive modeling of multidimensional time-series[J]. Information Sciences, 2017, 412-413: 50–66. DOI:10.1016/j.ins.2017.05.038
[3] SERIR L, RAMASSO E, ZERHOUNI N. Time-sliced temporal evidential networks: The case of evidential HMM with application to dynamical system analysis[C]//Proceedings of 2011 IEEE Conference on Prognostics and Health Management (PHM). Montreal, Canada: IEEE, 2011: 1-10. http://ieeexplore.ieee.org/xpls/icp.jsp?arnumber=6024330
[4] SCHOCKAERT S, DE COCK M. Temporal reasoning about fuzzy intervals[J]. Artificial Intelligence, 2008, 172(8-9): 1158–1193. DOI:10.1016/j.artint.2008.01.001
[5] SEZER S, ATALAY A E. Dynamic modeling and fuzzy logic control of vibrations of a railway vehicle for different track irregularities[J]. Simulation Modelling Practice and Theory, 2011, 19(9): 1873–1894. DOI:10.1016/j.simpat.2011.04.009
[6] RUAN S, ZHOU Y K, YU F L, et al. Dynamic multiple-fault diagnosis with imperfect tests[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part A:Systems and Humans, 2009, 39(6): 1224–1236. DOI:10.1109/TSMCA.2009.2025572
[7] SINGH S, KODALI A, CHOI K, et al. Dynamic multiple fault diagnosis:Mathematical formulations and solution techniques[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part A:Systems and Humans, 2009, 39(1): 160–176. DOI:10.1109/TSMCA.2008.2007986
[8] ARROYO-FIGUEROA G, SUCAR L E. Temporal Bayesian network of events for diagnosis and prediction in dynamic domains[J]. Applied Intelligence, 2005, 23(2): 77–86. DOI:10.1007/s10489-005-3413-x
[9] GALAN S F, ARROYO-FIGUEROA G, DIEZ F J, SUCAR L E. Comparison of two types of event Bayesian networks:A case study[J]. Applied Artificial Intelligence, 2007, 21(3): 185–209. DOI:10.1080/08839510601170754
[10] NODELMAN U. Continuous time Bayesian networks[D]. Palo Alto: Stanford University, 2007. http://dl.acm.org/citation.cfm?id=2073921
[11] WINGATE D, GOODMAN N D, ROY D M, et al. The infinite latent events model[C]//Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence. Montreal, Canada: AUAI Press, 2009: 607-614. http://dl.acm.org/citation.cfm?id=1795114.1795185
[12] MURPHY K P. Dynamic Bayesian networks: Representation, inference and learning[D]. Berkeley: University of California, 2002. http://dl.acm.org/citation.cfm?id=937223
[13] CAI B P, LIU Y, XIE M. A dynamic-Bayesian-network-based fault diagnosis methodology considering transient and intermittent faults[J]. IEEE Transactions on Automation Science and Engineering, 2017, 14(1): 276–285. DOI:10.1109/TASE.2016.2574875
[14] CODETTA-RAITERI D, PORTINALE L. Dynamic Bayesian networks for fault detection, identification, and recovery in autonomous spacecraft[J]. IEEE Transactions on Systems, Man, and Cybernetics:Systems, 2015, 45(1): 13–24. DOI:10.1109/TSMC.2014.2323212
[15] ZHANG Q. Dynamic uncertain causal graph for knowledge representation and reasoning:Discrete DAG cases[J]. Journal of Computer Science and Technology, 2012, 27(1): 1–23. DOI:10.1007/s11390-012-1202-7
[16] ZHANG Q, DONG C L, CUI Y, et al. Dynamic uncertain causality graph for knowledge representation and probabilistic reasoning:Statistics base, matrix, and application[J]. IEEE Transactions on Neural Networks and Learning Systems, 2014, 25(4): 645–663. DOI:10.1109/TNNLS.2013.2279320
[17] ZHANG Q, GENG S C. Dynamic uncertain causality graph applied to dynamic fault diagnoses of large and complex systems[J]. IEEE Transactions on Reliability, 2015, 64(3): 910–927. DOI:10.1109/TR.2015.2416332
[18] ZHANG Q, ZHANG Z. Dynamic uncertain causality graph applied to dynamic fault diagnoses and predictions with negative feedbacks[J]. IEEE Transactions on Reliability, 2016, 65(2): 1030–1044. DOI:10.1109/TR.2015.2503759
[19] DONG C L, ZHAO Y, ZHANG Q. Assessing the influence of an individual event in complex fault spreading network based on dynamic uncertain causality graph[J]. IEEE Transactions on Neural Networks and learning systems, 2016, 27(8): 1615–1630.
[20] ZHANG Q. Dynamic uncertain causality graph for knowledge representation and reasoning:continuous variable, uncertain evidence, and failure forecast[J]. IEEE Transactions on Systems, Man, and Cybernetics:Systems, 2015, 45(7): 990–1003. DOI:10.1109/TSMC.2015.2392711
[21] ZHOU Z X, ZHANG Q. Model event/fault trees with dynamic uncertain causality graph for better probabilistic safety assessment[J]. IEEE Transactions on Reliability, 2017, 66(1): 178–188. DOI:10.1109/TR.2017.2647845
[22] DONG C L, WANG Y J, ZHANG Q, et al. The methodology of dynamic uncertain causality graph for intelligent diagnosis of vertigo[J]. Computer Methods and Programs in Biomedicine, 2014, 113(1): 162–174. DOI:10.1016/j.cmpb.2013.10.002
[23] 董春玲, 张勤. 用于不确定性故障诊断的权重逻辑推理算法研究[J]. 自动化学报, 2014, 40(12): 2766–2781.
[24] ZHANG Q, YAO Q Y. Dynamic uncertain causality graph for knowledge representation and reasoning:Utilization of statistical data and domain knowledge in complex cases[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 99: 1–15.