빈 2022년 8월 8일, 서울 한강 이남 지역을 중심으로 기록적인 폭우가 발생하여 심각한 침수 피해가 발생하였다. 이 사건은 기후변화로 인한 극단적인 강우 사상의 증가와 도시화 로 인한 배수 체계의 한계를 동시에 보여주는 전형적인 재해이다. 이러한 현상은 도시 내 홍수 취약성을 평가하고, 이를 기반으로 효과적인 방재 대책을 수립하는 것이 시급함을 시사한다.
빈 기존의 홍수 취약성 평가 연구는 주로 통계적 방법이나 물리적 모델에 의존해 왔으나, 복잡한 도시 환경과 다양한 변수들을 고려하는 데 한계가 있다. 최근에는 인공지능(AI) 기법, 특히 머신러닝 및 딥러닝 기법이 공간 데이터 분석 및 예측에 우수한 성능을 보이며, 이를 활용한 연구가 증가하고 있다. 특히, RF(Random Forest) 모델은 공간 데이터의 비선 형적 관계를 잘 포착하고, 예측 정확도가 높아 공간 취약성 평가에 적합한 것으로 알려져 있다
빈 AI 기반의 홍수 취약성 평가는 기존 방법론의 한계를 극복하고, 보다 정교하고 실용적 인 평가 결과를 제공할 수 있다. 이를 통해 도시 계획 및 수자원 관리 차원에서 효과적인 방재 대책을 수립할 수 있을 것으로 기대된다. 따라서 본 연구는 AI 기법, 특히 RF 모델을 활용하여 2022년 서울시 홍수 취약성을 정량적으로 평가하고 취약지역을 시각화하였다.
빈 본 연구의 대상 지역은 서울시 전 지역으로[그림 1] 2022년 8월 집중호우로 인해 심각 한 침수 피해를 입은 주요 피해 지역인 동작구, 강남구, 서초구, 관악구 등이 포함된다[그림 2]. 이 지역들은 시간당 100mm 이상의 강우가 집중되었으며, 지하철 침수, 도로 통제, 주 택 침수 등 다양한 피해가 발생하였다. 한강 이남 지역은 비교적 낮은 지대에 위치하여 홍 수에 취약한 지형적 특성을 가지고 있으며, 고밀도 개발이 이루어진 지역으로 불투수 면 적이 높아 자연적인 배수 기능이 약화되어 있다. 또한, 노후화된 하수관거와 복개 하천 등 이 존재하며, 이는 홍수 발생 시 추가적인 취약성을 유발한다
빈 본 연구에서는 종속 변수로 2022년 서울시 침수흔적도를 사용하였으며, 독립 변 수로는 사면 방향(aspect), 고도(Digital Elevation Model, DEM), 흐름 누적(flow accumulation), 흐름 방향(flow direction), 토지 이용 및 토지 피복(Land Use and Land Cover, LULC), 평면 곡률(plan curvature), 단면 곡률(profile curvature), 사면 경사 (slope), 하천 파워 지수(Stream Power Index, SPI), 하천 밀도(stream density), 하천으로 부터 거리(stream distance), 지형 습윤 지수(Topographic Wetness Index, TWI) 등을 활 용하였다[그림 3].
빈 Python 3.8 환경에서 사이킷런(Scikit-learn) 라이브러리를 사용하여 RF와 LR(Logistic Regression) 모델을 구축하고 홍수 취약성을 평가하였다. 각 모델의 성능을 비교하여 최적의 방법론을 도출하고자 하였다. RF는 다수의 의사결정나무(Decision Tree)를 조 합한 앙상블 기법으로, 각 의사결정나무는 독립적으로 학습된 후 다수결(voting)을 통 해 최종 예측을 수행한다. 이 방법은 과적합(overfitting)을 방지하고, 공간 데이터의 비 선형적 관계를 효과적으로 모델링할 수 있는 장점이 있다. LR은 선형 분류 모델로, 독 립 변수와 종속 변수 간의 관계를 로지스틱 함수를 통해 모델링하며, 해석이 간단하고 계산 효율성이 높다는 장점이 있다. 모델 구축 과정에서는 먼저 데이터를 학습 데이터 (70%)와 테스트 데이터(30%)로 무작위 분할하였다. 이후 각 모델을 학습시키기 위해 사이킷런의 RandomForestClassifier, LogisticRegression을 사용하였으며, 하이퍼파라 미터(hyperparameter) 최적화를 위해 그리드 서치(Grid Search)와 교차 검증(CrossValidation)을 적용하였다. 주요 하이퍼파라미터로는 RF의 경우 의사결정나무의 수(n_ estimators), 최대 깊이(max_depth), 최소 샘플 분할(min_samples_split) 등이 포함되었 고, 교차 검증은 5-fold 방식을 사용하여 모델의 일반화 성능을 평가하고 최적의 하이퍼 파라미터 조합을 도출하였다.
빈 모델의 예측 성능은 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1 점수 (F1-Score) 등의 지표를 사용하여 평가하였다[그림 4]. 예측 결과는 GIS(Geographic Information System)를 통해 시각화하여 홍수 취약 지역을 공간적으로 분석하였다. 이를 통해 서울시 내에서 홍수 발생 위험이 높은 지역을 식별하고, 취약성 요인을 심층적으로 분석하였다. RF는 정확도가 82.20%, 정밀도가 81.62%, 재현율은 83.15%이며, F1 점수는 82.38%로 나타났다. 이 지표들은 RF 모델이 매우 효과적이며, 평가된 모든 기준에서 균 형 잡힌 성능을 보여준다는 것을 시사한다. 반면에, LR 모델은 정확도가 73.51%, 정밀도 가 69.67%, 정밀도와 정확도는 다소 낮지만, 이 모델은 RF 모델과 비슷한 수준인 83.31% 의 높은 재현율을 보였다. 로지스틱 회귀의 F1 점수는 75.88%로, 정밀도와 재현율 사이에 합리적인 균형을 보이지만 RF 모델보다는 낮게 나타났다. LR은 해석이 간단하고 계산 효 율성이 높았으나, 비선형 관계를 모델링하기에 한계가 있었으며 많은 지역을 실제 홍수 지 역보다 과다하게 해석되었다[그림 5].
빈 [그림 6]은 RF와 LR 모델의 AUC (Area Under the Curve) 값을 보여주며 값이 높 다는 것은 모델의 성능이 좋다는 것을 의미한다. AUC는 ROC (Receiver Operating Characteristic) 커브 아래의 면적을 측정하며, 분류기의 전반적인 성능을 나타내는 지표 로써 AUC가 1에 가까울수록 모델은 완벽한 성능을 나타내고, 0.5에 가까울수록 성능이 무작위 추측 수준을 의미한다. RF 모델은 LR 모델보다 높은 AUC 값을 보여주어, 더 우 수한 성능을 가진 것으로 평가되었다.
빈 본 연구는 2022년 서울시 집중호우 사례를 바탕으로 RF 모델을 활용하여 홍수 취약 성 평가를 수행하였다. 연구 결과, 서울시 한강 이남 지역은 지형적 특성, 토지 이용 패턴, 하천과의 거리 등 다양한 요인으로 인해 홍수에 특히 취약한 것으로 나타났다. 주요 독 립 변수 중에서는 고도(DEM), 하천 밀도(stream density), 지형 습윤 지수(TWI) 등이 홍수 취약성 예측에 가장 큰 영향을 미치는 것으로 분석되었다. 이러한 결과는 기존의 통계적 방법보다 AI 기반 모델이 복잡한 공간 데이터의 비선형적 관계를 효과적으로 포 착할 수 있음을 보여준다. 또한, 특성 중요도 분석을 통해 도시화로 인한 불투수면적 증 가와 노후화된 하수관거 시스템이 홍수 취약성을 가중시키는 주요 요인임을 확인하였 다. 특히, 반지하 주택 및 저지대 지역은 홍수 발생 시 심각한 피해를 입을 가능성이 높은 것으로 나타나, 이에 대한 즉각적인 대책 마련이 필요함을 시사한다. 본 연구는 AI 기법 을 활용한 홍수 취약성 평가 방법론을 제시함으로써, 기후위기 시대에 효과적인 방재 대 책 수립에 기여할 수 있을 것으로 기대된다. 연구 결과를 바탕으로 다음과 같은 정책적 제언을 제시한다:
빈 이러한 대책들은 단순히 수자원 관리 차원을 넘어 도시계획적 접근을 통해 기후위기 에 대응하는 종합적인 방재 체계를 구축하는 데 기여할 것이다. 본 연구는 AI 기법을 활용 한 홍수 취약성 평가의 가능성을 보여주며, 향후 유사한 연구와 정책 수립에 유용한 기초 자료로 활용될 수 있을 것으로 기대된다