방재정보

방재 관련 기술정보를 전해다립니다.

카카오 데이터센터 화재

글 이영규

위험관리지원센터

  • 2022년 10월 15일 토요일 오후 경기도 성남시 삼평동 데이터센터 건물 내, UPS(무정전전원장치)에 연결된 배터리실 화재로 대중적으로 이용되고 있는 카카오 서비스 장애가 장기간 지속되면서 리튬이온배터리의 위험관리와 카카오 서비스 이중화가 사회적 현안으로 대두되었다. 이 사고로 데이터센터 설계 기준의 문제점이 드러났으며, 카카오 측은 서비스 재발 방지대책을 대국민에 발표해야 했다.

1. 일반사항

  • ■ 소 재 지 : 경기도 성남시 분당구 삼평동
  • ■ 화재일시 : 2022년 10월 15일(토요일) 15시 33분경(소방서 신고시각)
  • ■ 발화장소 : SK판교캠퍼스 A동 지하3층
  • ■ 재산피해 : 조사중
  • ■ 인명피해 : 없음
  • ■ 발화원인 : 전기적 요인 - 조사중

2. 건물현황

○ 이 건물은 지하4층, 지상6층으로 구성되어 있으며, 총 연면적은 67,024.1㎡임.

그림 1. 사고건물 배치도

그림 2. 화재 현장 사진(사진출처=YTN)

3. 화재발생 상황

1) 발화 및 화재진압

  • ○ 신고 시각 : 2022년 10월 15일 15시 33분경
  • ○ 도착 시각 : 2022년 10월 15일 15시 38분경 (신고->도착 5분 소요)
  • ○ 초진 시각 : 2022년 10월 15일 17시 46분경 (도착->초진 128분 소요)
  • ○ 진 시각 : 2022년 10월 15일 23시 45분경 (초진->완진 299분 소요)

2) 지원인력 및 출동 장비

  • ○ 인력 : 총 114명(소방, 의용소방, 경찰 등)
  • ○ 장비 : 총 24대(펌프, 화학, 구조, 구급 등)

3) 화재현장의 연소상황

  • ○ 발화지점
  • - 그림 3과 같이 지하 3층은 발전기실, UPS실, 배터리실로 구획되어 있으며, CCTV에는 배터리실 배터리에서 스파크가 일어나 발화하는 모습(그림 2 참조)이 포착
  • 그림 3. 지하 3층 평면도(사진출처=동아일보)

  • ○ 발화원인
  • - 경찰은 배터리에서 스파크가 일어나는 장면을 CCTV에서 포착하고 발화 원인을 배터리 또는 배터리랙 주변 전기적인 요인으로 추정한다고 밝힘
  • - 경찰 관계자는 감식 결과 지하 3층 배터리실 배터리 랙 5개가 전소된 상태라며 배터리 또는 랙 주변에서 전기적인 요인으로 인해 화재가 시작된 것으로 보인다고 설명
  • - 건축구조물소실면적 : 40㎡
  • ○ 사회적 이슈
  • - 대다수의 스마트폰 사용자가 이용하는 카카오톡을 포함하여 카카오 서비스가 장시간 중단되면서 카카오의 서비스 이중화 문제가 사회적으로 큰 영향을 미침

그림 4. 카카오 장애 타임라인(사진출처=머니투데이)

4. 대형재해 발생 원인 분석

1) 데이터센터 설계 이슈

  • ○ 리튬이온배터리 위험관리 지적
  • - 동아일보(2022) 취재 결과 10월 15일 화재 발생 4시간 전과 1시간 전 데이터센터 내 배터리관리시스템(BMS)이 두 번이나 이상 상황을 감지한 것으로 드러남. 시스템 경고에 담당 직원이 바로 현장을 찾아 조치했지만, 결과적으로 화재를 막지 못함. BMS 이상 신호 시, 실시한 현장 조치가 적절했는가에 대한 검토가 필요함
  • - 사고 건물은 발전기실, UPS실, 배터리실이 모두 같은 층에 있으나, LG유플러스는 각각을 서로 다른 층에 배치하여 위험을 분산하고 있어, SK판교데이터센터와 대조를 보임
  • - KT는 리튬이온배터리를 리튬인산철배터리와 납축전지로 교체했다고 하며, 네이버는 배터리가 필요 없는 Dynamic UPS (Rotary UPS)를 사용하고 있다고 함
  • 그림 5. 리툼이온배터리 위험관리 지적(사진출처=동아일보)

  • ○ 주전원 케이블 설치 위치 지적
  • - SBS(2022)가 지하 3층 설계도면을 입수하여 분석한 결과, 카카오 전산실과 연결되는 주전원 케이블이 그림 6과 같이 배터리실 천장을 지나도록 설계
  • -노컷뉴스(2022) 보도에 따르면 15일 당일 오후 3시 19분쯤 배터리실 내에 설치된 배터리에서 불꽃이 튀며 불길이 시작되자, 1분 만에 방재실 수신기가 화재를 감지했고, 할로겐 성분의 자동소화 설비가 작동함. 지하 3층에는 할로겐 가스가 담긴 1,500kg(50kg, 30기) 상당의 자동소화 설비가 설치돼 있었으며, 할로겐은 불활성 기체로 감전 우려가 적어 주로 전자기기가 설치된 곳에서 사용됨
  • - 1,500kg 상당의 가스가 방사됐음에도 불길을 잡지 못함. 리튬이온배터리 특성상 화재 시 내부에서 가스가 생성되면서 열이 폭주하는데, 배터리 자체도 케이스로 둘러싸여 있어 소화 가스의 진압 효능에는 한계가 있었음
  • - 소방 당국은 화재 발생 18분 만에 현장에 도착해 건물 내부로 진입했으며 물을 뿌리는 형태로 진화해야 한다고 판단함. 또한 주전원 케이블이 배터리실을 지나고 있어, 소방수 살포를 위해서는 주전원 차단이 필요했으며, 주전원 차단은 카카오 서비스 중단의 시발점이 됨

그림 6. 배터리실 천장으로 주전원 케이블이 지나도록 설계(사진출처=SBS)

2) 서비스 이중화 이슈

  • ○ 카카오 서비스 이중화 제대로 안 돼
  • - 카카오 서비스 중단 사태 비상대책위원장인 홍은택 대표는 15일 판교 SK㈜ C&C 데이터센터 화재 후 서비스 복구에 오래 걸린 원인에 대해 “주요 데이터와 서비스 응용프로그램에 대한 이중화 조치는 되어 있었으나 개발자들의 주요 작업 및 운영도구가 이중화되지 못했다”고 말함. 이어서 “서버 자동화 배포 시스템이 작동하지 않아, 32,000대의 서버를 일일이 수동으로 부팅해야 해 복구 시간이 오래 걸렸다”라고 중앙일보(2022)가 전함
  • - 뉴스핌(2022)에 따르면, 카카오가 12월 7일 열린 개발자 컨퍼런스 '이프 카카오 데브 2022(if kakao dev 2022)'에서 지난 10월 15일 판교 SK C&C 데이터센터 화재로 인해 발생한 서비스 장애 원인과 재발방지대책을 밝힘
  • - 남궁훈 비상대책위원회 재발방지대책 공동 소위원장, 이중화를 비롯해 부족했던 모든 부분을 개선하기 위해 원인을 분석하고, 재발 방지 대책을 세우며 미래에 대한 투자를 하도록 하겠으며, 전담 조직을 만들어 안정적인 서비스 환경을 조성하는 데 집중하겠다고 밝힘
  • - 이확영 원인조사 소위원장, 이중화와 위기 대응 과정에 미흡함이 있었음. 하나의 데이터센터에서 장애가 발생하면 다른 데이터센터로 자동 전환해주는 시스템이 작동해야 하는데 이 시스템마저 판교 데이터센터에만 설치돼 있었음. 가용 자원도 부족했음. 회사 차원에서 체계적인 이중화를 준비했어야 했었다고 자성
  • - 이채영 재발방지대책소위원회 부위원장, 데이터센터 전체의 장애가 발생하더라도 모니터링과 장애 탐지가 잘 동작할 수 있도록 모니터링 시스템을 다중화할 예정. 인프라 하드웨어 설비에서 서비스 애플리케이션에 이르는 전체 시스템 레이어에 다중화를 설계하고 구축해 가겠다고 계획을 설명함
  • - 고우찬 재발방지대책 공동 소위원장, 모든 것이 무력화되더라도 꼭 단기간 내에 살려야 할 서비스는 데이터센터를 별도로 구축하는 방안도 검토하겠음. 카카오는 개선 사항들을 추가하기 위해 향후 5년 간은 지난 5년 간 투자 금액의 약 3배 이상 규모로 투자를 확대하겠다고 밝힘

참고문헌

노컷뉴스, [단독]소화 가스 1.5톤 방사됐지만…데이터센터 불 안꺼졌다
https://www.nocutnews.co.kr/news/5834722, 2022.10.18.
동아일보, [단독]SK 데이터센터, 4시간前 ‘위험 경고’에도 배터리 화재 못막아
https://www.donga.com/news/Economy/article/all/20221020/116037488/1, 2022.10.20.
머니투데이, 2년전 좌초된 데이터센터 규제 강화, 다시 주목받나,
https://news.mt.co.kr/mtview.php?no=2022101615002439452, 2022.10.17.
YTN, 카카오 데이터센터 2차 감식..."배터리에서 스파크 발생 뒤 화재“
https://www.ytn.co.kr/_ln/0103_202210171902583150, 2022.10.17.
중앙일보, 카카오 뒤늦은 인정 “이중화 안 됐다…무료도 보상 검토” [일문일답]
https://www.joongang.co.kr/article/25110371#home, 2022.10.19.
뉴스핌, "3배 이상 규모로 투자 확대"...카카오, 데이터센터 장애 재발방지 대책 발표
https://www.newspim.com/news/view/20221207000509, 2022.12.07.
SBS, '판교 데이터센터 설계도' 입수해 전문가에 확인했더니,
https://news.sbs.co.kr/news/endPage.do?news_id=N1006940315, 2022.10.20.