패턴학습 기법을 적용한 원자력발전소 운전상태 조기경보 모델 개발
Abstract
Early warning technology has been introduced to prevent a failure of the equipment by pre-detecting minute abnormalities between normal operating ranges and set points to reduce the loss from unplanned maintenance costs by pre-identifying the failure and making provision for it. As computing capacity and data storage space has been rapidly developed in recent years, the development of early warning technique for abnormality of equipments based on artificial intelligence algorithm and pattern learning has been active. In this paper, we describe a method for pattern learning in major equipments of the power plant and a way to detect abnormalities of the equipment while applying the early warning technique. We also show early warning system based on pattern learning is superior to the currently applied set point-based state monitoring. When a deviation from a learned pattern takes place, the alarm goes off immediately. Therefore, prompt handling of minute abnormalities is possible. It is useful in eliminating potential causes for equipment breakdown.
Keywords:
Early Warning, Artificial Intelligence, Pattern Learning, Pattern Grouping, Kernel Regression1. 서 론
원자력발전소에서 운전되고 있는 터빈, 펌프, 밸브 등 주요기기들은 주제어실(main control room, MCR)에서 온라인으로 실시간 감시되고 있다. 주요 감시 방법은 기기들을 감시하는 주요 변수(온도, 압력, 유량 등)의 측정값을 실시간 감시하면서 각 감시변수의 측정값이 정상값 대비 비정상적으로 벗어나는 정도에 따라 설정치(set point)를 정해놓고, 측정값이 그 설정치에 도달하면 경보가 발생하도록 하였다. 이러한 설정치 기반 감시 방법은 아주 오래되고 신뢰성이 검증된 발전소의 고유감시 방법이긴 하지만, 감시변수의 정상운전구간과 MCR경보가 발생하는 설정치(set point) 사이에서 발생되는 기기의 미소한 변화나 이상 징후는 감지하기가 어렵다. 기기의 고장은 미소한 이상상태에서부터 발전하기 시작하며, 비정상 상태가 지속적으로 축적되면 경우에 따라서는 기기의 고장이나 발전소 정지에 영향을 미치는 심각한 사고로 진행되기기도 한다. 조기경보 기술은 정상운전구간과 설정치 구간 사이에서 기기의 미소한 이상 징후를 사전에 감지하여 Fig. 1 의 조기경보 구역에서 기기 고장을 예방하거나 기기 고장을 사전에 인지하고 대비함으로써 비계획 정비 손실을 감소시키기 위해 도입된 시스템이다.1) 최근에는 컴퓨터 계산 능력과 데이터 저장 용량이 급속 발전함에 따라 인공지능 알고리즘을 기반으로 기기 이상징후를 사전에 감지하거나 수명을 예측하여 효과적인 정비를 수행하고자 하는 연구들이 다양하게 수행되고 있다.2,3,7) 본 논문에서는 발전소의 주요기기에 대한 조기경보 모델 개발 및 개발 모델 적용시의 경보 발생 현상에 관한 연구 결과를 기술하였다.
2. 패턴학습 기반 조기경보
Fig. 2는 패턴학습 기반의 조기경보 원리를 보여주고 있다. 발전소 기기(펌프, 밸브 등)의 계측기로부터 취득된 수천 개의 각종 감시 변수(온도, 압력 등)는 자료수집장치에 수집되고 각 변수들의 과거 한주기(18개월) 동안 운전된 history data는 패턴학습을 통해 패턴모델을 생성한다. 패턴모델은 기기나 변수의 종류에 관계없이 18개월운전기간 동안 정상운전 유형이 유사한 것은 동일 패턴모델로 분류할 수 있으며, 패턴이 유사하다는 것은 변수들이 상호 연관성이 있으며, 한 개의 변수가 변하면 그 값이 동일 패턴모델에 속한 다른변수에도 영향을 준다는 것을 의미한다. 현장에서 측정된 실측정값(actual value)이 실시간으로 예측값 계산 엔진에 입력되면 패턴학습 모델에서 가장 유사한 패턴을 찾아내고, 가중치를 부여하여 예측값을 생성한 다음, [실측정값 – 예측값] 계산을 통해 두 값의 잔차(residual)를 발생시키고 잔차의 크기가 정상운전 범위를 벗어나면 경보가 발생하도록 알고리즘이 구성되어 있다.
예측값의 생성은 통계 및 경험적 모델에 과거 표본값의 가중 평균을 계산함으로써 예측값을 추정하는 비모수 회귀분석(non-parametric regression)방법이 주로 사용되며, 패턴학습 및 데이터 처리 기법은 주로 AAKR(Auto Associative Kernel Regression), AANN(Auto Associative Neural Network), MSET(Multivariate State Estimation Technique) 등이 사용된다.4,5)
본 연구에서는 AAKR 기법을 적용하고 있는데, 정상상태 운전 동안 수집된 시간이력 데이터(historical data)를 이용하여 파라미터를 추정하는 비모수적 경험 모델(non-parametric empirical modeling) 알고리즘이다.9) 이 기법은 입력된 실측정값에 대해 패턴학습 모델에서 가장 유사한 패턴은 가중치를 높게 주고 유사성이 낮은 패턴은 가중치를 낮게 주어 전체를 가중평균하여 예측값을 계산하는 방식이다. AAKR을 모델을 만들기 위해서는 우선 정상 데이터로부터 선정된 메모리 벡터(X)가 저장된다.
(1) |
측정 벡터 x = [x1x2 ⋯ xp] 가 수집되고 메모리 벡터 X와의 유사성을 평가하기 위해 유클리디안 거리(d)를 계산한다.
(2) |
계산된 거리에 대한 가중치를 부여하기 위해 주로 가우시안 커널(Gaussian kernel)을 사용한다.
(3) |
여기서, h는 kernel 밴드폭, w는 n개의 메모리 벡터에 대한 가중치, 마지막으로 가중치 w는 메모리 벡터와 결합하여 값을 추정한다.
(4) |
이때 h는 커널폭 파라미터이며 거리함수와 Gaussian의 결합으로 거리가 가까울수록 가중치가 높고 거리가 멀수록 가중치가 낮아지게 되는데 h=0.1이면 패턴학습 모델들에 대해 전반적으로 가중치가 낮게 부여되고, h=1이면 유사성이 높은 패턴은 가중치를 매우 높게 주고 그 반대의 경우는 가중치가 매우 낮게 부여되는 효과가 있다.
3. 감시변수 선정 및 패턴학습 결과
3.1 감시변수 선정
온라인 실시간 감시를 통해 기기의 상태변화와 이상징후를 효과적으로 감지하기 위해서는 감시 대상 변수들의 선정이 매우 중요하다. 펌프, 터빈, 발전기 등 지속 운전되는 기기들의 온도, 압력, 유량, 전류, 전압 등과 같이 기기의 상태 변화에 따라 그 값도 변하는 변수는 좋은 조기경보 대상이다. 반면 기기의 on/off 접점 신호나 제어카드의 급작스런 손상처럼 사전 징후없이 순간적으로 발생되는 변수는 사전에 그 값의 변화 추세를 알기 어렵고 특정 패턴을 가지고 있지 않기 때문에 조기경보 감시변수로서는 적당하지 않다.8)Table 1은 국내 원자력발전소를 대상으로 조기경보 감시대상으로 선정된 기기와 변수를 나타내고 있으며, Table 2와 Table 3은 선정된 변수들의 물리량별 분포와 기기별 선정된 감시변수의 샘플을 보여주고 있다.
3.2 패턴학습 결과
패턴학습은 1,424개의 감시변수에 대해 18개월간의 운전 데이터 중 정상운전시의 데이터를 학습하였으며, 비정상상태의 데이터는 학습에서 제외하여 패턴학습 모델을 개발하였다.6) 각 감시변수들의 패턴학습 모델은 신호 패턴에 대한 상호 상관성 분석(correlation analysis)을 수행하고 패턴간의 상관계수가 높은 변수들끼리(상관계수 0.8 이상) 유사 패턴 그룹핑을 하였다.6) 동일 그룹 내 감시변수 tag들은 예측값 계산시 상호 영향을 받으므로 그룹핑 결과는 조기경보 정확도에 상당히 중요한 역할을 차지한다. 따라서 상관계수에 의해 분류된 그룹핑 결과의 적절성에 대한 검증을 수행하였다. 그룹핑 적절성 검증은 그룹내 각 tag들이 실제 운전시 상호 영향을 받는지 및 영향을 받아 움직이는 패턴이 실제 현상과 유사한지를 발전소 운전전문가 및 기기 전문가들이 참여하여 적절성을 판단하고 최종 그룹핑을 확정하였다.
(5) |
x = 임의의 tag(x), y = tag(y)
x = x의평균, y = y의평균
유사패턴 감시변수 tag에 대한 그룹핑 결과 1,424개 tag에서 259개의 패턴 그룹이 생성되었으며 Fig. 3과 Fig. 4는 동일 패턴그룹의 대표적 샘플을 보여주고 있다. Fig. 3과 Table 4는 냉각수계통의 출구 온도와 원자로냉각재펌프의 모터 냉각수 온도 등 총 7개의 감시변수들이 동일 패턴그룹으로 나타난 경우로 200일간의 운전 데이터 패턴이 매우 유사하게 나타나고 있으며, correlation factor는 0.98로 상관성이 높은 그룹이다. Fig. 4와 Table 5는 냉각수계통의 surge tank level과 원자로냉각재펌프의 seal 냉각수 온도 등 총 6개의 감시변수들이 동일 패턴그룹으로 나타난 경우로 420일 간의 운전 데이터 패턴이 매우 유사하게 나타나고 있으며, 상관계수는 0.8로 비교적 높다.
4. 조기경보 결과
4.1 계측기 헌팅 감지
계측기의 순간 이상 상태 또는 노이즈에 의해 계측기 신호가 정상범위를 벗어나 튀어 오르는 현상을 헌팅이라고 하며, 계측기의 헌팅 발생으로 측정된 데이터가 학습된 정상운전 패턴을 벗어나는 경우 조기경보가 발생한다. 헌팅 신호의 발생 원인은 노후화된 계측기에서 발생하는 불특정 일시적 오신호발생 또는 계측기 노이즈의 peak가 높은 경우, 계측기의 정비 불량 등이 있다. 어떤 기기의 경우 계측기의 일시적인 헌팅이라도 헌팅값이 높게 오르거나, 상당 기간 유지될 경우 오신호로 입력되어 기기의 과도상태 또는 동작 정지를 유발할 수 있으므로 헌팅 발생의 원인분석이 필요하며, 잦은 헌팅 발생 신호는 계측기의 교정 및 정비 수행이 필요하다. Fig. 5는 충전펌프 베어링 온도(CVT276)가 2016.7.26일부터 2016.9.20일 사이에 약 11회의 일시적 헌팅이 발생한 것을 보여주고 있다. 이때 동일 그룹에 포함된 충전펌프 모터 고정자 온도(CVT254), 충전펌프 베어링 온도(CVT275) 등은 헌팅이 발생하지 않았고 정상적 운전패턴을 유지하고 있어 충전펌프에 이상 징후가 발생한 것이 아니라 CVT276 계측기 자체에 문제가 있는 것으로 판정하였다. 이처럼 어떤 tag에서 이상신호나 헌팅이 발생할 때 동일 그룹 내 다른 tag들의 상태를 분석하여 다른 tag들은 정상 상태 패턴으로 움직이고 있다면 기기 상태에는 문제가 없고 해당 계측기에만 문제가 있다고 빠르게 판단할 수 있는 장점이 있다.
Fig. 6은 지속적 헌팅에 의한 조기경보 사례를 보여주고 있다. cold leg 1B temp wide range chnnel B(RCT112CB)가 ’16.3.4부터 수개월 동안 지속적으로 헌팅이 발생하였으며, 이때 동일 그룹에 포함된 cold leg 1B temp. wide range (RCT115)는 헌팅이 발생하지 않고 정상적 운전패턴을 유지하고 있어 RCT112CB 계측기의 점검이 필요한 것으로 판단하였다. 실제 계획정비기간 동안 RCT112CB에 대한 점검과 정비가 수행되었으며, 정비 후 RCT112CB에서 헌팅이 발생하지 않는 것을 알 수 있다.
4.2 기기 교체운전에 의한 조기경보 발생
Fig. 7은 복수펌프 교체운전에 의한 조기경보 발생 현상을 보여주고 있다. 복수펌프는 A, B, C 3대의 펌프가 설치되어 있고, 발전소 정상 시 2대가 운전되며, 필요에 따라 1대씩 교체 운전을 수행한다. Fig. 7은 복수펌프 3대(A, B, C) 각각의 모터전압과 펌프 후단 유체 압력을 나타내고 있다. 모터전력이 1,700kw 이상이고, 펌프 후단 압력이 25kgf/cm2 이상이면 펌프는 정상적으로 기동된 상태이며, 모터전력과 펌프 후단 유체압력이 0 kw, 0 kgf/cm2이면 정지상태로 판단할 수 있다. Fig 7의 (a)는 펌프 A의 기동 및 정지시 신호 변화, (b)는 펌프 B의 기동 및 정지시 신호 변화, (c)는 펌프 C의 기동 및 정지시 신호변화를 나타내고 있는데, 각 6개의 신호 변화를 분석하면 최초 A, C 펌프가 운전되고 있다가 C 펌프가 정지되면서 바로 B 펌프가 기동되었으며, 이후 일정시간 경과 후 펌프 A가 정지되면서 바로 펌프 C가 다시 기동되는 것을 알 수 있다. 펌프의 기동 및 정지 직후에 조기경보 발생 시 동일 그룹 내 다른 감시변수들과 비교분석을 통해 펌프의 교체 운전이 발생했음을 인지할 수 있다.
4.3 기기 이상징후에 의한 조기경보 발생
Fig. 8은 발전기 고정자 냉각수의 미세한 전도도 증가를 감지하고 조기경보한 경우이다. 2016년 3월 28일(12시16분48초) 발전기 고정자 냉각수의 전도도가 갑자기 0.03㎲/cm(정상상태)에서 0.09㎲/cm로 증가하였으며, 이때 최초 조기경보가 발생하였다. 이후에도 전도도는 3월 29일까지 0.06㎲/cm~0.1㎲/cm 사이를 유지하고 있었으나, 발전소 주제어실의 경보 설정치는 0.5㎲/cm로 설정되어 있어 주제어실 경보는 발생하지 않은 상태였다.
조기경보 발생에 따라 발전소에서는 발전기 고정자 냉각수계통 점검을 수행하였으며, 그 결과 냉각수관에 매우 미세한 pinhole이 발생한 것을 발견하였다. 발전소에서는 3월 30일 09시04분에 냉각수 누설 부위의 보수를 완료하였으며, 냉각수의 누설이 차단되고, 고정자 냉각수의 전도도는 정상상태로 회복되었다(0.03㎲/cm). 상기 조기경보 경우로 볼 때, 인공지능 조기경보시스템이 아주 미세한 징후를 감지하는데 상당히 효과적이며, 발전소의 출발 감발이나 정지 없이 설비의 보수를 함으로써 발전소의 경제적 손실을 방지에 매우 큰 기여를 함을 알 수 있다.
5. 결 론
상기 조기경보 사례에서 보듯이 발전소에서 현재 적용중인 설정치 기반 상태감시에 비하여 패턴학습을 기반으로 한 조기경보는 학습된 정상 운전 패턴을 벗어나면 바로 경보를 발생하므로 기기의 미세한 이상 징후에도 신속히 반응하며, 특히 발전소 경보설정치에 도달하지 않은 상태에서 장시간 미세한 이상 징후를 보이는 경우 조기에 그 징후를 발견함으로써 기기의 잠재적 고장 원인을 제거하는데 매우 효과적인 기능을 보이는 것으로 판단할 수 있다.
그 외에도 계측기의 헌팅이나 오류 발생을 찾아낼 수 있고, 펌프의 교체 운전 등 발전소 운전 상황도 실시간 모니터링할수 있는 장점들이 있다. 하인리히의 1:29:300 법칙에 의하면 대형사고가 발생하기 전에 그와 관련된 수많은 경미한 사고와 징후들이 반드시 존재한다는 것을 의미함과 동시에 초기에 징후를 신속히 발견하고 대처를 한다면 대형 사고를 막을 수 있다. 이런 의미에서 기기 고장징후를 초기에 감지하고 경보를 발생하는 조기경보시스템은 기기의 고장 및 발전소 불시정지의 잠재적 원인을 사전에 제거함으로써 발전소의 운영 효율성과 안전성 향상에 기여할 것으로 기대된다.
References
- Q. Zhang, M. Basseville, and A. Benveniste, (1994), "Early Warning of Slight Change in System", Automatica, 30(1), p95-113. [https://doi.org/10.1016/0005-1098(94)90231-3]
- J. Ma, and J. Jiang, (2011), "Application of Fault Detection and Diagnosis Methods in Nuclear Power Plants : A review", Progress in Nuclear Energy, 53(3), p255-266. [https://doi.org/10.1016/j.pnucene.2010.12.001]
- G. W. Song, B. S. Kim, and G. W. Choi, (2010), "RCM Based Failure-Prediction System for Equipment", Trans, 34(9), p1281-1286. [https://doi.org/10.3795/ksme-a.2010.34.9.1281]
- G. Kauermann, M. Marlene, and J. C. Raymond, (1998), "The Efficiency of Bias-Corrected Estimator for nonparametric Kernel Estimation Based on Local Estimating Equations", Statistics and Probability Letters, 37, p41-47. [https://doi.org/10.1016/s0167-7152(97)00098-9]
- J. B. Coble, P. Ramualli, L. J. Bond, J. W. Hines, and B. R. Upadhyaya, (2012), "Prognostics and Health Management in Nuclear Power Plants : A Review of Technologies and Applications.", National Technical Information Service. [https://doi.org/10.2172/1047416]
- P. Baraldi, R. Canesi, E. Zio, R. Seraoui, and R. Chevalier, (2011), "Signal Grouping for Condition Monitoring of Nuclear Power Plant Components", Advances in Safety, Reliability and Risk Management : ESREL, p1-13.
- E. Davis, D. Funk, D. Hooten, and R. Rusaw, (2000), "On-Line Monitoring of Instrument Channel Performance", EPRI, Palo Alto, CA, 2000. TR1000604.
- B. Rasmussen, A. Hussey, and E. Davis, (2004), "Equipment Condition Assessment : Vol. 1 : Application of On-Line Monitoring Technology", EPRI, Palo Alto, CA, 2000. TR1000604.
- J. Y. Jung, B. O. Lee, H. K. Kim, and D. W. Kim, (2016), "Performance Analysis on Early Detection of Fault Symptom of a Pump with Abnormal Signals", Journal of the Korean Society for Power System Engineering, 20(2), p66-72. [https://doi.org/10.9726/kspse.2016.20.2.066.]