基于声音识别的多阀门泄漏检测系统(2)

2010-02-25 李明霞 大连工业大学信息科学与工程学院

  定义从状态ωi (t-1) 转移到状态ωj (t) 的概率γij (t)

  其中P(V T | θ) 是模型用任意的隐状态路径产生序列V T 的概率。

  (1) N :模型中Markov 链的状态数目。记N个状态为θ1 ,θ2 , ⋯,θN , 记t 时刻Markov 链所处的状态为q ,显然q ∈(θ1 ,θ2 , ⋯,θN ) 。

  (2) M :每个状态对应的可能的观测值数目。记M 个观测值为v1 , v2 , ⋯, vM ,记t 时刻的观测值为o1 ,其中o1 ∈ ( v1 , v2 , ⋯, vM ) 。

  (3) π:初始概率分布矢量,π = (π1 ,π2 , ⋯,πN ) ,其中πi = P( qi =θi ) ,1 ≤i ≤ N 。

  (4) A :状态转移概率矩阵, A = ( aij ) N ×N , 其中, aij = P( qi +1 =θj | q t =θi ) ,1 ≤i , j ≤ N 。

  (5) B :观测值概率矩阵, B = ( bjk ) N ×M , 其中bjk = P(θt = vk | qt =θj ) ,1 ≤j ≤N ,1 ≤k ≤M。记一个DHMM 为:λ = ( N , M ,π, A , B) 。

2.3.1、HMM 模型训练

  隐马尔可夫模型训练的目的是建立模型的参数,即从一组训练样本中确定转移概率。到目前为止,还没有能够根据训练样本确定最优参数集合的方法, 本文采用前向后向算法( forward backward algorit hm) 。

  训练之前,首先对模型参数进行初始化设置,π和A 在遵循归一化条件下随机化选取; 参数B对系统的影响非常大,如果随机选取不当,不仅会大幅度增加训练时间, 也会降低最后识别的正确率,本文根据矢量量化的码本初始化B 。定义αi ( t) 为使系统在t 时刻位于状态ωi ,并且已产生了到t 时刻为止的目标序列的概率; 定义βi ( t) 为在t时刻位于状态ωi ,并且将产生t时刻之后的目标序列(时间范围为t + 1 → T) 的概率:

  这样,可以使用任意的关于aij 和bij 的估计,根据公式(7) 和公式(8) 进行逐步的修正,直到达到收敛为止。

  为了增加HMM 故障诊断系统的稳健性和提高故障诊断系统的准确率,本文选取多个样本进行训练,以建立阀门故障状态和正常状态的HMM 参数模型。本文针对阀门泄漏故障状态和正常状态,各选取若干样本进行训练,建立故障状态的HMM 模型库和正常状态的HMM 模型库。

2.3.2、模式识别

  训练完成之后将模型参数存储,此时,系统就具备了诊断的能力,即根据给定的HMM 和它所产生的观测序列,决定最有可能产生这个可见观测序列的隐状态序列。诊断过程中,输入待检测阀门音频信号,经过预处理、特征参数提取和矢量量化后,得到观察值序列,然后,快速有效地计算出观察值序列在各HMM 模型下的输出概率。通常情况下,概率最大的模型即为识别结果。

2.4、结果处理

  由于原油中含有大量的泥沙等杂质,在阀门关闭过程中,可能会有泥沙附着在阀门上导致阀门关闭不严等情况,从而产生类似阀门损坏泄露的声音,而下一次输送材料进入的时候,这些附着在阀门上的泥沙等杂质可能被冲走,从而使得阀门恢复正常工作。因此本系统对于单独的一次异常不做报警处理,如果连续的五个工作周期中有三次以上的异常发生,系统才判定是阀门泄漏异常,产生报警。这样既保证了系统的灵敏度,又保证了系统识别异常的准确性。

3、实验结果

  本系统的特征参数提取、HMM 模型训练和模式识别部分是在MA TLAB 7. 1 下完成的,采样频率为11 025 Hz ,采样大小为16 bit ,数据帧长256 ,帧移128 ,通过特征提取,将每帧信号都转换为12 维MFCC 的特征矢量,作为观测序列。各选泄漏和正常状态下的20 个样本用于识别测试,实验结果如表1 所示,总识别率为87. 5 % ,结果较为理想。

表1  实验结果

4、结束语

  本系统根据声学原理,使用声音传感器对多输油通道的阀门泄漏进行检测。对声音传感器采集到的声音信号进行预加重、加窗等预处理,提取出音频信号的MFCC 特征参数组成观测序列,并利用隐马尔可夫模型对观测序列进行建模,建立故障状态HMM 模型库和正常状态HMM 模型库。根据建立的HMM 模型库对输入的待检测信号进行状态识别。试验结果表明,模型对阀门的工作状态的平均识别率为87.5 % ,再辅以系统的识别结果后期处理,可以使系统的识别率提高到90%以上,能有效地识别阀门泄漏故障,具有良好的应用前景。