2025 하계학술대회 수상자 리뷰
화재 확산과 군중 행동을 고려한 강화학습 기반 대피 보조 에이전트 개발
글 : 김군찬 (국립금오공과대학교) / mplngx2@gmail.com
처음 방문하는 건물에서 재난 발생 시 대피는 매우 어렵다. 특히 현대 건물의 구조가 점점 더 복잡해지면서, 재난 상황에서의 대피는 더욱 어려워지고 있다. 이러한 상황에서 초동 대응이 늦어지면 큰 인명 피해로 이어질 수 있다. 대피 안내 표지판은 혼잡한 재난 상황에서 대피 경로를 제시함으로써 인명 피해를 줄이는 데 중요한 역할을 한다. 그러나 기존의 정적인 대피 경로 안내는 실시간으로 변화하는 화재나 연기 확산, 군중 흐름 등 동적인 상황을 반영하지 못해 실제 대피 효과가 떨어진다 (그림 1). 따라서 실시간 재난 정보를 반영한 동적 대피 경로 안내가 필요하다.

그림 1. 기존 정적 대피 경로 안내의 한계
본 연구는 건물 화재 상황에서 재실자에게 대피 경로를 안내하기 위한 강화학습 기반 대피 보조 에이전트를 제안한다 (그림 2). 제안하는 에이전트는 재난 시뮬레이션을 통해 실시간으로 변화하는 군중 밀도, 온도, 가스 농도, 가시 거리 등의 상태 정보를 수집하여 위험 수준을 판단한다. 이를 바탕으로 재실자가 고위험 구역으로 진입하는 것을 방지하기 위해 위험 경로에 대해 안내 표지판의 정보를 동적으로 조정한다.
그림 2. 강화학습 기반 대피 안내 시스템 개요
화재 시뮬레이션은 셀룰러 오토마타 기반으로 건물 내의 화재 및 연기 확산을 모델링하고, 재난 대피 시뮬레이션은 화재 상황에서의 군중의 대피 거동을 예측한다. 본 연구에서는 강화학습을 기반으로 화재 상황 및 군중 밀도에 의한 구역 별 재실자의 이동 제한 여부를 총 3가지 화재 시나리오에 대해 학습하였다. 기존 정적 대피 안내와 비교하여 대피 시간이 평균 56% 감소하였고, 사상자는 평균 66.7% 감소하였다 (그림 3). 이는 일반 안내에서 발생하는 고립 상황과 혼잡 구간을 해결하는 대피 안내 정책을 학습했기 때문인 것으로 분석된다 (그림 4).
그림 3. 대피 보조 에이전트의 효과에 대한 정량 비교
그림 4. 대피 보조 에이전트의 효과에 대한 정성 비교
본 연구는 강화학습 기반 대피 보조 에이전트를 통해 기존 정적 안내 시스템의 한계를 극복하고, 동적 상황에 최적화된 대피 경로 안내의 가능성을 확인하였다. 향후 연구에서는 다양한 유형의 재난 상황(지진, 테러, 폭발 등)으로 확장하여 에이전트의 적용 범위를 넓히고, IoT 센서나 CCTV와 같은 실시간 데이터 수집 인프라와 연계해 더 정교한 상태 인식 및 예측이 가능하도록 발전시킬 필요가 있다. 또한 대규모 건축물이나 다중 이용 시설에서의 실증 실험을 통해 실제 적용 가능성과 사용자 수용성을 검증하는 과정이 요구된다. 궁극적으로는 도시 단위의 통합 재난 관리 시스템과 연계해, 다양한 재난 상황에서도 신속하고 효율적인 인명 보호를 실현할 수 있는 지능형 대피 안내 체계로 발전시킬 수 있을 것이다.
* 본 과제(결과물)는 교육부와 한국연구재단의 재원으로 지원을 받아 수행된 3단계 산학연협력 선도 대학 육성사업(LINC 3.0)의 연구결과입니다.