송은주
(Eun-Ju Song)
1iD
김상암
(Sang-Ahm Kim)
†iD
-
(Dept. of System Safety Research, Korea Railroad Research Institute, Korea E-mail :
sej22@krri.re.kr)
Copyright © The Korean Institute of Electrical Engineers
Key Words
Railway Safety, Algorithm, AI, Deep Learning, Accident prevention
1. 서 론
2022년 KTX, SRT, 무궁화호 등 탈선 및 빈번한 차량 사고가 연이어 발생하고 있으며 국제철도연맹(UIC)는 국내 철도 안전 수준을 1등급에서
2등급으로 하향 조정하였다. 현재 우리나라는 철도 안전관리 시스템이 부족하며 종합적, 시스템적 안전관리가 필요하다. 국내 철도 안전 예측평가시스템이
부족하며, 철도 안전 데이터 활용 기반이 미흡한 상태이기에 안전관리기술의 패러다임 변화 및 고도화가 필요하다. 철도 안전 관리 분야는 타 산업에 비해
AI, 빅데이터 등 최신 기술 적용이 미흡하고, 미래 환경 대비가 부족한 상태이다. 그렇기에 안전관리의 디지털 전환을 하기 위해 AI기반 플랫폼 및
실시간 대응이 가능한 데이터 수집 및 의사결정 전달체계 구축을 위한 컴퓨팅 환경 구축이 필수적이며 관련 연구가 활발히 이루어져야 한다. 김예진(2016)[1-2]은 철도 종사자의 단독적인 결정은 불확실한 결과물을 초래하며, 근본적인 시스템 개선으로 철도 네트워크의 문제를 꼬집었다. 따라서 효율적이고 안전한
열차운행보장을 위해 데이터 수집·활용한 빅데이터 기반의 철도 정보를 시각화하며 철도 종사자에게 사전에 알리는 연구를 하였다. 또한 과거 열차 사고사례를
‘실시간 철도안전 의사결정 지원시스템’에 적용해 사고 예방 가능성을 확인하였다. 본 연구에서는 철도사고 데이터 기반의 위험요소 분석, 사고 대응 대안
비교, AI 기반 의사결정 지원 등을 통해 다중 사고방어 관점에서 최적의 대안을 도출할 수 있는 알고리즘을 개발하였고 이를 적용한 시작품을 성공적으로
구현하였다.
2. 본 론
2.1 AI 기반 열차 운행안전 최적 의사결정 알고리즘 설계
최근 빅데이터의 사용과 빠른 데이터처리가 활발히 가능해진 시점에서 모델 예측 제어에 딥러닝 연구가 가능해졌다.[3] 따라서 본 연구에서는 철도사고/장애 데이터(2002-2021년, 약 13,000건 이상)을 활용하여 철도 사고 위험 패턴을 분석하는 사고유형 모델
분류, 위험요인 분석모델, 대안추천 알고리즘 3가지로 나누어 개발하였다. Bow-Tie 모델의 사고 인과모델에 기반한 ‘사고 발생 플로우(위험요인→사고발생→조치→대책)’에
따라 분석하고 모델링 하였다. 사고데이터의 각 속성을 해당 분석 모델에 따라 분류하고 재구성함으로써, 사고데이터를 단순 기록이 아닌 인과적 구조로
해석하고자 하였다.
그림 1. 사고데이터 분석 모델(Bow-Tie 모델)
Fig. 1. Accident Data Analysis Model (Bow-Tie Model)
2.1.1 사고유형 분류 모델
사고유형 분류모델은 초기 사고 보고서를 입력받아 신속하게 어떤 유형의 사고인지 판별하며 사고 대응 프로세스에서 첫 번째 의사결정 단계(사고 인식 및
분류)를 자동화한다. 본 연구에서는 사고유형 분류를 위해 딥러닝의 기본 구조인 ANN 구조를 사용하였다. ANN 구조[4]는 입력층, 은닉층, 출력층으로 구성하였으며 그림 2는 ANN 구조 그림이다. 입력층은 사고 개요 텍스트를 사전에 임베딩 모델로 변환한 벡터가 입력으로 들어오는 층이다. 은닉층은 각 은닉 블록을 Linear→LayerNorm→Activation→Dropout
순서로 구성하고, 각 은닉층을 테이퍼드 구조로 구현하였다. 테이퍼드 구조는 층을 지날수록 차원수를 압축하기에 중간단계에서 점진적으로 의미있는 패턴을
잡아내고, 중요하지 않은 차원은 줄여서 일반화 성능을 향상시킨다. 완전연결층(Linear)은 입력 벡터를 새로운 차원공간으로 선형변환하였고, 가중치
학습을 통해 특징을 재조합하고 차원 축소를 수행한다. 정규화층(Layer Normalizatiom)[5]은 각 샘플 단위로 평균과 분산을 계산해 정규화하여, 학습을 안정화시키고 발산 위험을 최소화한다. 활성화 함수(Activation) 비선형을 추가해
복잡한 관계를 학습하였고, 드롭아웃(Dropout)[6]을 적용하여 뉴런일부를 무작위로 비활성화하여 과적합 방지 및 일반화 성능을 향상시킨다. 출력층은 마지막 은닉층의 벡터를 17개 클라스 점수(logic)로
변환하여 최종적으로 각 샘플이 17개의 사고 유형 중 어느 클래스에 속하는지를 예측한다.
그림 2. ANN구조 (입력층, 은닉층, 출력층)
Fig. 2. ANN (input layer, hidden layer, output layer)
2.1.2 위험요인 분석 모델
위험요인 분석 모델은 특정 사고 보고서에서 복합적 위험 요인을 도출하며, 인적, 기계적, 환경적, 관리적 요인을 동시에 분석해 원인구조 파악을 지원한다.
대규모 사고 데이터 패턴을 자동학습하는 딥러닝 구조로 다양한 사고 시나리오 텍스트에서 위험요인을 의미적으로 매칭하고 분석하기 위하여 Dual Encoder+Residual
Projection Head+Multi-Positive Contrastive Learning(MPCL) + Hard Negative + Exponential
Moving Average(EMA) 구조로 구성하였다. 이 구조는 Query와 Label을 임베딩 후 구분·학습 하기 위해 여러 기술을 조합한 모델이다.
즉, 한 문장에서 어떤 위험요인들이 관련 있는지를 정확하게 찾아내는 것이다. Dual Encoder은 Query와 Label 임베딩을 공통 공간에
매핑하고, 유사도 기반 대조 학습을 한다[7]. Residual Projectdual Projection Head구조는 다음 그림 3과 같다.
그림 3. Residual Projection Head 구조
Fig. 3. Residual Projection Head Architecture
완전연결층을 추가하여 더 복잡한 비선형 변환을 표현하고 풍부한 특징을 추출하고, Residual Shortcut을 통해 본래 임베딩 정보와 학습된
변형을 결합하여 기울기 소실을 완화 시킨다. 이 과정에서 요약, 보강되면서 더 풍부하고 안정적인 표현으로 변환된다. Multi-Positive Contrastive
Learning(MPCL)은 하나의 query에 여러 개의 정답(positive labels)을 동시에 고려하여 다중 위험요인을 대응한다. 의미적으로
가까운 쌍(positive)은 가깝게, 다른 쌍(negative)은 멀리하도록 학습하여, Query에 Positive(Label) 여러 쌍을 동시에
학습한다. 예를 들어 기관사 신호 위반으로 인한 열차 추돌 사건의 경우 인적요인, 시스템오류, 기계적 오류 등의 다중 위험 요인을 고려한다. Binary
Cross Entropy(BCE) & Hard Negative Reweighting에서 BCEWithLogits 기반 손실을 추가해 각 위험요인을
독립적으로 예측(멀티라벨 분류)하였다. neg_weight와 hard_neg_weight를 통해 음성 샘플 불균형을 보정하고, 과적합 완화 및 결정
경계를 보다 정밀하게 학습하였다. 정밀한 학습을 위하여 Margin Ranking Loss와 Cross-Batch Memory(XBM)를 같이 사용하였다.
Margin Ranking Loss은 가장 유사한 양성과 가장 유사한 음성 사이의 간격을 margin 이상 벌리도록 학습시켜 의미적으로 비슷한 위험요인
간 구분 성능을 강화시킨다. Cross-Batch Memory(XBM)은 이전 배치의 라벨 임베딩을 저장해두고, 현재 배치와 함께 학습에 사용한다.
Hard negative 샘플을 더 풍부하게 확보할 수 있어, 학습효과를 증가시킨다. Exponential Moving Average(EMA)는 학습
중 파라미터의 지수 이동 평균 가중치를 별도로 추적하며, 평가시 EMA 가중치를 사용하면 진동 억제 및 일반화 성능을 향상시킨다.
2.1.3 최적 대안 추천 알고리즘
대안 추천 알고리즘은 사고 상황에 맞는 실행 가능한 조치 방안을 추천하며, 중복되거나 의미가 약한 조치 대신 핵심적이고 검증된 대응책을 우선 제시한다.
DB에서 사례후보군 조회 → 중심성 점수 계산 → 순위 정렬 → 대안 추천 과정으로 알고리즘을 설계하였다. 특정 사고에 특화된 조치보다, 여러 과거
사례에서 일관되게 나타나는 조치를 우선적으로 추천하도록 알고리즘을 설계하였다.(의미적 중심성 기반 추천) Cross-Encoder(BAAI/bge-reranker-v2-m3)를
활용하여 각 후보를 query로 설정하고 다른 후보들과의 상호 유사도를 평가하여 중심성(centrality) 점수를 계산 후 이 점수를 기준으로 후보군을
정렬하여 점수가 높은 상위 10개를 최종 추천하는 형태이다. Cross-Encoder는 Transformer 내부에서 query와 document가
어떻게 대응되는지 계산하여[8], Dual-Encoder에 비해 의미적 대응 관계를 정밀하게 계산하는 형태이다.
2.2 모델 데이터셋 구성 및 훈련방법
본 연구에서 모델 학습의 일반화 성능을 높이고 과적합을 방지하기 위하여 훈련/평가 데이터 분할 및 교차검증 전략을 적용하였다[9]. 전체 데이터 13,255중 전처리 과정을 거쳐 노이즈 데이터 372건을 제거하여 최종적으로 12,883건으로 데이터셋을 구성하였다. 전체 사고
데이터셋의 80%로 학습을 하고 나머지 20%비율로 데이터로 예측력을 확인하였다. 그림 4는 훈련 데이터 내 5-fold 교차검증 결과값이다. 각 fold 가 한 번씩 검증용으로 사용되며, 나머지 4개 fold는 훈련용으로 사용하였다.
즉, fold1 ~ fold4 데이터셋으로 훈련된 모델의 검증은 fold5 데이터셋을 입력으로 한 예측의 정확도로 수행하고, fold1, fold3
~ fold5 데이터으로 훈련된 모델의 검증은 fold2 데이터셋을 입력으로 한 예측의 정확도로 수행하는 시퀀스로 총 5회의 학습/검증 사이클을 수행하고,
fold별 성능 지표를 평균으로 집계하였다. 클래스 불균형 문제를 완화하기 위해 각 fold 분할 시 StratifiedKFold를 적용하여 사고유형·위험요인
분포가 원본 데이터와 최대한 유사하게 유지되도록 하였다.
그림 4. 훈련 데이터 내 5-fold 교차검증
Fig. 4. 5-Fold Cross-Validation on Training Data
2.3 모델 성능검증
2.3.1 사고유형 분류모델 성능검증 결과
모델 성능 검증 결과, 사고유형 분류모델의 성능 검증 결과 그림 5와 같다. F1-Weighted Score는 얼마나 정확하고 빠짐없이 예측했는가를 나타내는 지표이다. F1-Weighted Score는 클래스별 샘플
수를 가중치로 반영하기 때문에, 실제 환경에서 모델이 마주할 클래스 분포와 유사한 조건에서의 성능을 보여주기에 선정하였다. 5-Fold기반 F1-Weighted
Score 측정결과, 92.4%로 높은 평가가 나온 것을 확인할 수 있었다.
그림 5. 사고유형 분류모델
Fig. 5. Accident Type Classification Model
2.3.2 위험요인 분석모델 성능검증 결과
모델 성능 검증 결과, 위험요인 분석 모델은 그림6과 같다. Recall@K는 과거 데이터에 기반한 매칭/분석 모델을 평가하는데 적합한 지표이다. ‘의사결정에 필요한 중요 후보요인을 놓치지 않고 제시하는가’를
측정 목표로 하기에 선정하였다. fold 성능 차이를 분석하여 모델의 일반화 성능 및 데이터셋 분할 적절성을 검토하였다. 각 fold 모델별 평가
결과를 평균화하여 모델의 전체 성능을 대푯값으로 도출하였다. Recall@5와 5-fold 기반 성능검증 결과, 80.4%로 평가된 것을 확인 할
수 있었다.
그림 6. 위험요인 분석모델
Fig. 6. Risk Factor Analysis Model
2.3.3 대안 추천 알고리즘 성능검증 결과
모델 성능 검증 결과, 대안 추천 알고리즘은 그림7과 같다. Recall@K는 과거 데이터에 기반한 검색 알고리즘을 평가 하는데 적합한 지표이기에 선정하였다. 대안추천 알고리즘이 유사사례에 대한 조치/대책
추천 시, 정답을 얼마나 회수(Recall)하는지를 평가한다. Recall@5기준으로 평가 결과, 84.9%로 평가된 것을 확인 할 수 있었다.
그림 7. 대안 추천 알고리즘
Fig. 7. Countermeasure Recommendation Algorithm
3. 웹 애플리케이션 시작품 제작
상기 설명한 AI 기반 열차운행안전 최적 의사결정 알고리즘을 적용하여 웹 플랫폼 어플리케이션 시작품을 제작하였다. 그림8-그림2은 실제 의사결정 플랫폼
웹 어플리케이션 창을 보여주고 있다. 그림 8페이지에서 파란색 텍스트 입력창에 사고 시나리오를 입력 후, 하단 이동버튼(Step2. 위험요인 분석 실행) 클릭 시 그림 9로 페이지로 넘어간다.
그림 8. 의사결정 플랫폼 ①시나리오 입력
Fig. 8. Decision-Making Platform ① Scenario Input
다음 페이지 진입 시, 그림 9, 그림 10처럼 자동으로 사고유형 분류 및 위험요인 분석 실행 후 결과물을 확인할 수 있다. 그림9에서 어떤 사고유형 분류에 해당하는지와 신뢰도를 확인 할 수 있다. 그림 10에서는 위험요인들을 확인 할 수 있으며 각 요인별 확률도 확인할 수 있다.
그림 9. 의사결정 플랫폼 ②위험요인 분석 – 1. 사고유형 분류
Fig. 9. Decision-Making Platform ② Risk Factor Analysis – 1. Accident Type Classification
그림 10. 의사결정 플랫폼 ②위험요인 분석 – 2. 위험요인 분석
Fig. 10. Decision-Making Platform ② Risk Factor Analysis – 2. Risk Factor Analysis
대안 추천을 위해선 페이지 하단 이동버튼(Step3. 대안추천 실행) 클릭 시 그림11, 그림12와 같이 해당 페이지로 넘어간다. 해당 페이지 진입 시, 자동으로 대안추천 분석을 실행한다. 조치/대책 내용 전환은 조치내용 추천/예방대책 추천 탭
클릭 시 10개의 조치/대책을 추천해 주는 것을 확인할 수 있다.
그림 11. 의사결정 플랫폼 ③추천 대안 분석 – 1. 조치 추천
Fig. 11. Decision-Making Platform ③ Recommended Alternative Analysis – 1. Action Recommendation
그림 12. 의사결정 플랫폼 ③추천 대안 분석 – 2. 대책 추천
Fig. 12. Decision-Making Platform ③ Recommended Alternative Analysis – 2. Countermeasure
Recommendation
4. 결 론
본 연구에서는 디지털 시뮬레이션 및 AI 기반 열차운행안전 최적 대안 선정 및 의사결정 핵심기술로서 관련 알고리즘과 이를 구현한 플랫폼 시작품을 개발하고,
그 성능을 검증하였다. 철도사고/장애 데이터(2002-2021년, 13,255건)를 활용하여 위험 패턴을 분석하였으며, 사고유형 분류모델, 위험요인
분석모델, 대안 추천 모델 등 3가지 모델로 구성된 알고리즘을 제시하였다. 사고유형 분류모델은 입력된 사고 개요 텍스트를 기반으로 17개의 사고 유형
중 하나로 분류하여 초기 사고 보고서를 입력받아 신속하게 어떤 유형의 사고인지 판별하고 사고 대응 프로세스에서 첫 번째 의사결정 단계를 자동화 하였다.
위험요인 분석 모델은 특정 사고 보고서에서 복합적 위험 요인을 도출하고 인적, 기계적, 환경적, 관리적 요인을 동시에 분석해 원인 구조를 파악하는데
지원한다. 대안 추천 알고리즘은 유사한 사고 사례에서 도출된 조치/대책을 의미적으로 비교·평가해 상위 10개를 추천하는 것을 확인하였다. 사고유형
분류모델, 위험요인 분류모델, 최적대안 추천 알고리즘 각성능검증평가 결과 모두 목표치인 80% 이상을 달성하였다. 열차 운행 안전 최적 의사결정 플랫폼을
통해 최적의 대안을 선택하여 의사결정 주체가 철도사고를 예방하거나 잠재적 위험요인에 대한 리스크를 저감할 수 있는 자동화된 조치를 시행하는 것이 가능할
것으로 기대된다. 향후 실제 환경을 고려하여 다양한 사고/장애 데이터를 적용한 플랫폼 개발이 이루어질 경우 철도안전 향상에 기여할 것으로 사료된다.
Acknowledgements
This study was supported by funding from the key project of the Korea Railroad Research
Institute, “Development of Digital Core Technologies for Assessing the Impact of Railway
Accident Risks (PK2502A1),” and from the Ministry of Land, Infrastructure and Transport’s
national R&D program, “Development of Data-Driven Technology for Evaluating and Predicting
the Railway Safety (RS-2025-02222955).”
References
Y. Kim, 2015, Development of Real-time Integrated Support System Using Railway Operating
Data, Transportation Technology and Policy, Vol. 13, No. 6, pp. 10-15

Y. Kim, 2016, Train accident Applies to Real-time railway safety decision support
system, Journal of Korean Society for Urban Railway, Vol. 4, No. 4, pp. 623-627

K. Kim, D. Shim, 2025, Empirical Performance Comparison of Optimization Algorithms
for Machine Learning/Deep Learning, Transaction of KIEE, Vol. 74, No. 8, pp. 1389-1398

D. E. Rumelhart, G. E. Hinton, R. J. Williams, 1986, Learning representations by back-propagating
errors, Computer Science, pp. 533-536

J. Lei Ba, J. R. Kiros, G. E. Hinton, 2016, Layer Normalization, arXiv preprint

N. Srivastava, G. Hinton, A. Krizhevsky, I. Sutskever, R. Salakhutdinov, 2014, Dropout:
A Simple Way to Prevent Neural Networks from Overfitting, Journal of Machine Learning
Research, Vol. 15, pp. 1929-1958

Y Bai, X Wu, T Wei, L He, 2025, A Dual-Encoder Contrastive Learning Model for Knowledge
Tracing, Entropy 2025, Vol. 27, No. 7

S. Mysore, G. Dhanania, K. Patil, S. Kallumadi, A. McCallum, H. Zamani, 2024, Memory
Augmented Cross-encoders for Controllable Personalized Search, arXiv preprint

J. Gorriz, R. M. Clemente, F. Segovia, J. Ramirez, A. Ortiz, J. Suckling, 2024, Is
K-fold cross validation the best model selection method for Machine Learning?, arXiv
preprint

저자소개
She received her bachelor's degree from Korea National University of Transportation
in 2023 and her master's degree from Seoul National University of Science and Technology
in 2025. She is currently pursuing a Ph.D. at Seoul National University of Science
and Technology and working as a researcher at the System Safety Research Laboratory
of the Korea Railroad Research Institute. Her research interests focus on developing
safety technologies for railway workers. E-mail : sej22@krri.re.kr
He Received his B.S., M.S. and Ph.D degree in Dept. of Electrical Engineering from
Korea Univ. Korea. He is currently pricipal researcher in Dept. of railway system
safety research. His research interests are real-time railway safety monitoring and
control technologies and related AI applicaiotns. E-mail : sangahm@krri.re.kr