3.1 해체변압기 데이터 기반 상관관계 분석
실제 해체데이터 기반 푸르푸랄 농도와 절연지 평균중합도의 상관관계를 그림 7의 산점도로 나타내었다. 특히, 본 산점도는 변압기 내 시료 채취 위치에 따른 중합도의 편차를 명확히 보여주기 위해, 각 변압기별로 측정한 중합도
값의 평균(점), 최소-최대 범위(세로선)를 함께 도시하였다. 이를 통해 푸르푸랄 농도가 증가함에 따라 중합도가 감소하는 전반적인 경향성과 더불어,
개별 변압기가 가지는 데이터의 변동성 및 불확실성을 동시에 파악할 수 있다.
그림 7. 푸르푸랄 농도에 따른 중합도의 분포 (평균 및 최소-최대 범위)
Fig. 7. Distribution of the Degree of Polymerization (DP) versus furfural concentration,
showing the mean, minimum, and maximum values for each transformer
그리고 데이터에 가장 적합한 회귀 모델을 선정하기 위해 로그, 선형, 2차 다항, 지수 모델 이상 4가지 함수에 대한 성능을 비교하였으며, 그 결과는
표 4, 그림 8과 같다.
표 4. 모델별 회귀분석 결과 비교
Table 4. Comparison of regression analysis result by model
|
|
결정계수
(R2)
|
RMSE
|
수식
|
|
로그
|
0.884
|
76.24
|
DP = 1111.9 + (-102.4) *
ln(Furfural)
|
|
선형
|
0.625
|
136.87
|
DP = 721.0 + (-0.209) *
Furfural
|
2차
다항*
|
0.821
|
94.41
|
DP = 795.1 + (-0.50)*x +
(0.000107)*x²
|
|
지수
|
0.717
|
118.89
|
DP = 708.0 *
exp(-0.00042 * Furfural)
|
* 2차 다항 수식에서 x 는 푸르푸랄 농도를 의미함
그림 8. 푸르푸랄과 평균중합도(DP)의 산점도 및 회귀분석 모델 비교
Fig. 8. Scatter plot of furfural versus mean Degree of Polymerization (DP) with a
comparison of regression models
비교 결과, 로그 함수 모델이 가장 높은 결정계수(R2=0.884)와 가장 낮은 평균 제곱근 오차(RMSE = 76.24)를 보여 데이터의 상관관계를
가장 잘 설명하는 것으로 판단되어 최적 모델로 선정하였다. 본 논문에서는 보수적인 접근법인 LOD 대체 시나리오를 주요 분석 결과로 제시한다. 선정된
로그 회귀 모델의 상세한 통계 분석 결과는 표 5와 같다.
즉 푸르푸랄 농도가 증가할수록 중합도는 감소하는 기존 문헌의 내용들과 일치하는 결과로 확인되었으며, 회귀분석을 통해 도출된 모델의 통계적 유의성은
최종적으로 다음과 같다.
표 5. 회귀분석 결과(N.D는 LOD값으로 대체)
Table 5. Regression analysis results (N.D = LOD)
|
항목
|
결과
|
|
상관계수(r)
|
-0.94
|
|
결정계수(R2)
|
0.884
|
|
F-비
|
212.7
|
|
P-value
|
1.31e-14
|
상관계수인 r은 -0.94으로 나타났으며 이는 두 변수인 푸르푸랄과 중합도 간에 매우 강력한 음의 상관관계가 있음을 나타낸다.
결정계수 R2은 0.884로, 독립변수인 푸르푸랄 농도가 종속 변수인 중합도의 변동성을 약 88.4% 설명함을 의미한다. 다시 말해 푸르푸랄이 절연지의
열화 정도를 매우 높은 신뢰도를 가지고 반영하는 핵심 지표임을 나타내는 결과라 할 수 있다. 특히 본 연구에서는 실제 해체변압기 데이터를 바탕으로
확인하였기 때문에 큰 의의가 있다.
F-비는 212.7로 나타났으며, 이는 해당 상관관계 수식이 데이터를 얼마나 잘 설명하는지 보여주는 지표이다. 해당 값이 크다는 것은 회귀모델이 잔차(오차)에
비해 유의미한 설명력을 가진다는 것을 의미한다.
마지막으로 P-value 는 1.3E-14로 매우 작은 값이 확인되었는데, 이는 모델이 99.9% 신뢰 수준을 훨씬 넘어서 통계적으로 매우 유의미함을
확인한 것이다. P-value 는 귀무가설(변수 간에 관계가 없다)이 옳다는 가정하에 관측된 결과가 나타날 확률을 의미하는데, 일반적으로 0.05를
기준으로 유의성을 판단하게 된다. 본 연구의 결과는 이보다 훨씬 낮은 값이 확인되었기 때문에 푸르푸랄과 중합도간 상관관계가 표본 데이터만 국한되지
않고 모집단 전체로 일반화 될 수 있는 가능성을 나타낸다는 것을 확인할 수 있다.
추가적으로 회귀모델의 신뢰도를 확보하기 위해, 기본 통계적 가정인 등분산성과 정규성에 대해 잔차 분석을 수행하고 검증을 진행하였다. 그림 9는 잔차와 예측값의 산점도를 분석한 것으로 잔차가 0을 중심으로 특별한 패턴 없이 무작위로 분포하는 것을 확인할 수 있다. 이는 잔차의 등분산성 가정이
대체로 만족되었음을 의미하며, 푸르푸랄 농도값에 관계없이 모델의 예측 오차가 일정함을 보여주는 결과이다.
그림 9. 회귀 모델의 잔차도
Fig. 9. Residual plot of the regression model
잔차의 정규성 여부는 그래프와 Shapiro-Wilk 검정을 통해 확인하였다. 아래 그림 10의 정규확률도에서 잔차들은 정규 분포를 나타내는 직선에 대체로 가깝게 배열되어 잔차가 정규 분포에 근접함을 시각적으로 확인할 수 있다. Shapiro-Wilk
통계량은 회귀 모델의 잔차가 정규 분포를 따르는지 확인할 수 있도록 하는 지표로, 잔차가 정규 분포를 따른다는 가정이 충족되어야 회귀계수의 신뢰구간
추정 등 통계적 추론의 유효성을 확보할 수 있다. 본 분석에서 Shapiro-Wilk 검정결과 P-value 는 0.08으로 유의수준 0.05보다
큰 값이 확인되었기 때문에 잔차가 정규성을 만족한다는 결론을 내릴 수 있다.
그림 10. 회귀 모델 잔차의 정규확률도
Fig. 10. Normal probability plot of the residuals
추가로 Durbin-Watson 통계량 분석을 통해 자기상관성 검정을 진행하였다. 회귀 모델의 잔차 간에 자기상관성이 존재하는지 확인하는 지표로,
자기상관성은 잔차들이 서로 독립적이지 않고, 특정 패턴을 가지는 경우를 의미한다. 앞서 그림 8을 통해 일차적으로 패턴을 가지는지 여부를 확인하였으나 좀 더 객관적인 수치로 이를 확인하고자 진행하였다. 특히 본 연구에서 사용한 해체변압기 데이터는
시계열 데이터가 아니기 때문에 각 데이터에서의 잔차 간 독립성(자기상관성 부재)이 중요하다. 일반적으로 해당값이 2에 가까울수록 잔차 간에 자기상관성이
없음을 의미하며, 0에 가까울수록 양의 자기상관성이 존재함을 의미한다. Durbin-Watson 통계량 값은 1.500으로 확인되었다. 유의수준 5%,
독립변수 1개(k=1), 표본수 30개(n=30)일 때 Durbin-Watson Table의 하한 임계값(dL)은 1.352, 상한 임계값(dU)은
1.489이다. 분석 결과인 1.500은 상한 임계값(dU)보다 크므로 (d > dU), 잔차 간에 자기상관성이 존재하지 않는다는 귀무가설을 채택할
수 있다. 따라서 잔차들이 서로 독립적이라는 가정을 충족하며, 이러한 분석결과는 해체변압기 데이터를 기반으로 분석한 회귀모델이 통계적 가정들을 타당하게
충족함을 보여준다.
표 6. 회귀분석 결과(N.D는 LOD/2로 대체)
Table 6. Regression analysis results (N.D = LOD/2)
|
항목
|
LOD/2
|
|
상관계수(r)
|
-0.92
|
|
결정계수(R2)
|
0.854
|
|
F-비
|
164.2
|
|
P-value
|
3.11e-13
|
마지막으로, LOD 이하 값 처리 방식에 따른 민감도 분석을 위해 LOD/2 대체 시나리오와 비교한 결과, 해당 시나리오의 결정계수(R2)는 0.854로
나타났다. 두 시나리오 모두 높은 설명력을 보여, LOD 이하 불검출 값 처리 방식이 모델의 전반적인 타당성에 미치는 영향은 제한적임을 확인하였다.
3.2 부트스트래핑을 활용한 예측 신뢰성 평가
확보된 푸르푸랄-절연지 중합도 상관관계 모델의 현장 적용 가능성과 예측 불확실성을 정량적으로 평가하기 위해, 부트스트래핑 분석을 수행하였다. 본 연구에서는
변압기 한계수명 기준 중 실제 해체변압기 데이터를 기반으로 한계수명 기준을 사용하는 일본 전력회사의 사례와 IEC 60216을 준용하여, 미사용 신지
절연지 중합도 50% 도달 시점(국내 4개 변압기 제작사에서 사용중인 절연지의 신지 샘플을 토대로 초기 중합도 값 설정)에서의 푸르푸랄 농도를 예측하고,
변압기 한계수명 도달 시점에서의 푸르푸랄 농도를 확인하고자 하였다.
전체 30개 데이터셋에서 5,000회 반복 재추출하여 얻은 평균 푸르푸랄 농도는 약 597.8ppb 로 최종 확인되었다. 이는 변압기 절연지의 중합도가
신지 대비 50% 도달했을 때, 푸르푸랄 농도가 평균적으로 597.8ppb 수준임을 의미한다.
이때 예측값들의 95% 신뢰구간은 [444.8 ppb ~ 834.5 ppb]로 산출되었으며, 이는 실제 운영중인 변압기의 푸르푸랄 농도가 해당 범위에
위치할 경우, 중합도가 신지 대비 50% 지점에 도달했을 가능성을 95% 신뢰도로 예측할 수 있음을 의미한다. 즉, 해당 신뢰구간은 실제 변압기 운영
시 관리자가 유지보수 기준 수립 시 가령 푸르푸랄 농도가 444ppb 부터는 절연지 중합도가 신지 대비 50% 에 가까워졌을 가능성이 높아지기 때문에
변압기 진단 주기를 짧게 적용하여 관리할 수 있는 근거로 활용가능하다.
그림 11. 푸르푸랄 농도 평균값에 대한 부트스트래핑 분포 및 95% 신뢰구간
Fig. 11. Bootstrap distribution and 95% confidence interval for the mean furfural
concentration
참고로, 민감도 분석을 위해 LOD/2 대체 시나리오로 동일한 분석을 수행한 결과, 평균 푸르푸랄 농도는 609.1 ppb, 95% 신뢰구간은 [426.0
ppb ~ 918.6 ppb]로 예측되었다. 이는 주요 분석 모델의 예측값과 약 1.9%의 차이만을 보여, 본 연구의 예측 결과가 LOD 이하 값
처리 방식에 민감하지 않고 안정적임을 뒷받침한다.
향후 실제 현장 활용성 및 유종이 다른 변압기에 대한 유사 연구 수행 시 적용 등을 위해 부트스트래핑을 활용하여 예측 모델의 안정성이 표본 크기(해체
변압기 필요 대수)에 따라 어떻게 변화하는지 분석하였다. 이를 위해 표본 크기(n)를 15개부터 30개까지 변화시키며 푸르푸랄 농도 예측값의 95%
신뢰구간 폭의 변화를 비교하였다.
그림 12. 표본 크기(n)에 따른 95% 신뢰구간 변화
Fig. 12. Change in the 95% confidence interval according to the sample size(n)
표 7. 표본 크기(n)에 따른 푸르푸랄 농도의 95% 신뢰구간
Table 7. The 95% confidence interval for furfural concentration according to the sample
size (n)
|
표본 크기
|
95% 신뢰구간(ppb)
|
평균 푸르푸랄
농도(ppb)
|
|
15
|
401.6 - 1041.3
|
619.9
|
|
16
|
407.9 - 1010.1
|
616.0
|
|
17
|
415.1 - 992.7
|
615.5
|
|
18
|
412.3 - 980.2
|
612.0
|
|
19
|
418.2 - 928.3
|
605.5
|
|
20
|
428.2 - 916.1
|
608.0
|
|
21
|
422.9 - 909.3
|
604.1
|
|
22
|
427.8 - 907.3
|
601.7
|
|
23
|
429.7 - 893.5
|
605.1
|
|
24
|
431.4 - 878.9
|
600.5
|
|
25
|
433.3 - 880.0
|
603.0
|
|
26
|
438.7 - 875.3
|
600.2
|
|
27
|
439.4 - 853.2
|
602.6
|
|
28
|
439.2 - 847.2
|
600.3
|
|
29
|
442.3 - 846.4
|
599.8
|
|
30
|
444.8 - 834.5
|
597.8
|
표 7와 그림 12에서 볼 수 있듯이, 표본 크기가 증가할수록 신뢰구간의 폭이 감소하며, 특히 22개 이상부터는 평균 푸르푸랄 농도 예측값이 수렴하며 안정화되는 것을
관찰할 수 있었다. 이는 신뢰도 있는 예측을 위해 최소 22대 이상의 표본 데이터 확보가 필요함을 시사한다. 다시말해, 절연유중 푸르푸랄 농도를 이용한
절연지 평균중합도 예측 시 최소 22대 이상의 표본 데이터를 확보할 경우, 예측 결과의 신뢰도를 확보할 수 있음을 간접적으로 나타내는 결과이다.
결과적으로 본 연구에서 확보한 푸르푸랄과 절연지 평균중합도 모델 수식에 대해 향후 추가적인 표본 수가 증가하더라도 통게적 추정치에 미치는 영향이 제한적임을
시사하며, 현 수준의 데이터로도 최소한이 통계적 신뢰성은 확보된 것으로 판단 가능하다.
이러한 분석을 통해 본 연구는 해체 변압기 데이터의 활용 가능성을 입증하고, 현장에서 푸르푸랄 분석만으로도 신뢰성 있는 절연지 상태 평가 및 이를
통한 변압기 열화상태 추정이 가능함을 보여주었다.
3.3 실제 운전중인 변압기의 푸르푸랄 진단 통한 교체 우선순위 선정사례
본 연구에서 도출된 푸르푸랄 – 절연지 중합도 회귀모델은 실제 현장 변압기의 상대적인 잔여수명을 추정하고, 교체 우선순위를 선정하는 데에 활용될 수
있다. 실제 몇몇 북미 전력사의 경우 변압기의 평균적인 사용수명(예, 20년)을 부여하고, 푸르푸랄 분석을 통해 얻은 예측 중합도 값을 이용해 상대적인
잔여수명을 산출하는 방식을 적용하고 있다.
즉, 각 변압기의 푸르푸랄 농도를 측정하여 본 연구에서 도출된 모델식을 이용해 예측 중합도를 산출한 다음, 미사용 신지 변압기의 중합도와 한계수명
도달 중합도 값을 기준으로 예측 중합도에 해당되는 상대적 사용년수를 계산한다. 이후 부여된 총 사용수명에서 상대적 사용년수를 빼서 임의의 잔여수명을
구한다. 해당 잔여수명은 실제 변압기의 정확한 남은 수명은 아니지만, 유지보수 관점에서 상대적 지표로 활용가능하다.
이러한 방식을 바탕으로 운전년수 25년 이상인 변압기 중 대표적인 3대에 대해 푸르푸랄 분석을 수행하고 교체 우선순위를 선정한 결과는 표 8과 같다.
표 8. 운전 중인 변압기 3대의 푸르푸랄 농도 및 예측 중합도
Table 8. Furfural concentration and predicted Degree of Polymerization (DP) of three
in-service transformers
변압
기
|
운전년수
(년)
|
푸르푸랄
농도 (ppb)
|
예측
중합도
|
95% 신뢰구간
|
|
A
|
33
|
4177.2
|
258.0
|
[87.5 ~ 428.4]
|
|
B
|
38
|
1325.0
|
375.6
|
[208.8 ~ 542.4]
|
|
C
|
38
|
311.4
|
523.9
|
[359.4 ~ 688.4]
|
푸르푸랄 농도가 제일 높은 변압기 A 는 예측 중합도 또한제일 낮은, 한계수명 중합도 이하로 추정되었다. 이는 가정된 수명을 거의 다 사용했음을 의미하므로
교체 최 우선 순위를 부여하였다. 반면 변압기 A 보다 운전년수는 더 오래되었으나 실제 푸르푸랄 농도가 훨씬 낮게 확인된 C는 예측 중합도가 변압기
A, B에 비해 훨씬 양호한 상태로 추정되었다. 이는 잔여수명이 상대적으로 많이 남아있음을 의미하므로, 가장 낮은 교체 우선순위로 분류하여 기존의
정기 점검 주기를 유지하는 것으로 판단하였다.