닫기

글로벌이코노믹

[데스크 칼럼] 디지털 대란, 데이터센터 '비상대응 체계' 절실

글로벌이코노믹

오피니언

공유
0

[데스크 칼럼] 디지털 대란, 데이터센터 '비상대응 체계' 절실

김태형IT과학부장이미지 확대보기
김태형IT과학부장
카카오 기반 모든 서비스가 멈추는, 이른바 '카카오 먹통' 사고로 카카오 의존도가 매우 높은 우리 국민 대부분이 30여시간 동안 '디지털 대란'을 경험했다.

지난 15일 주말 오후 3시 30분경 경기 성남시 분당구 삼평동 SK㈜ C&C 판교캠퍼스 A동 지하 3층에서 화재가 발생했고 화재 진압을 위해 메인서버의 전원 차단이 원인이라고 알려졌다.
지상 6층, 지하 4층 규모의 이 건물에는 네이버·카카오·SK통신사 등의 데이터센터 시설이 들어가 있다. 이곳에서 관리하던 카카오의 서버 3만2000대가 정지되면서 대란은 시작됐다.

사건 초기 같은 건물의 네이버도 검색·뉴스·쇼핑·카페·블로그·시리즈온·오픈톡·스마트스토어센터 등에 서비스 장애가 발생했지만 사고발생 3시간 후부터는 서비스가 정상화됐다.
신속한 복구 덕분에 네이버 NOW.(나우)는 이날 BTS콘서트 생중계에는 지장 없이 진행됐고 시청자 650만명, 총 재생수는 1300만회, 최대 동시접속자 수 100만명이 접속했다. 통신장애를 겪은 카카오와는 사뭇 다른 모습이다. 가장 큰 차이점은 '데이터센터 설비 투자'와 '재난대응 체계'라고 할 수 있다.

카카오와 네이버 모두 재난 등 비상상황에 대비해 데이터 이원화를 하고 있었다. 데이터 이원화란 데이터를 물리적으로 떨어진 2개 이상의 데이터센터에 저장하고 데이터센터 안에서도 파일이나 전원 공급장치도 이중화하는 조치를 말한다.

하지만 카카오는 화재가 발생한 판교데이터센터가 메인이었고 네이버는 강원도 춘천시에 위치한 자체 데이터센터 '각'을 메인으로 사용하면서 전국 각지의 데이터센터에 데이터를 분산해놓고 운영한다.

양현서 카카오 부사장은 지난 16일 경기도 성남시 현장에서 "판교데이터센터에 있는 3만2000대의 서버 중 1만2000대가 복구됐다"며 "서버를 증설해서 트래픽을 전환하는데 꽤 많은 시간이 걸리는데 전원 공급이 되면 추가적으로 서버를 재가동할 수 있을 것"이라고 말했다.

또 양 부사장은 "3만2000대의 서버 전체가 다운되는 것은 IT 역사상 유례가 없었던 것"이라며 "앞으로 서버를 증설하는 등의 조치로 이용자 불편이 없도록 할 것"이라고 덧붙였다.

카카오는 판교데이터센터를 포함, 4개의 데이터센터에 데이터를 분산 저장해 운영 중이다. 하지만 이번 화재로 일부 서버는 물리적으로도 훼손되어 화재 현장에 사람이 진입해 조치를 취하기 어려워 복구가 지연됐다고 한다. 이 대목에서 카카오는 데이터센터 비상상황에 대비한 매뉴얼과 대응체계가 미흡했음을 엿볼 수 있다. 비상대응체계가 제대로 작동하지 않은 것이다.

카카오가 아직 자체 데이터센터를 보유하지 못하고 지진·홍수·화재·전쟁 등 최악의 재난상황 대비에 미흡한 것이 화를 더 키운 셈이다.

더불어 데이터센터 등 서비스 운영에 필요한 시설투자 규모에서도 카카오는 네이버에 못 미친다. 최근 3년간의 설비투자(CAPEX) 총액을 비교해 보면 네이버는 1조8609억원, 카카오는 7285억원으로 네이버의 절반도 안되는 수준이다.

2021년 연간 매출(연결기준)은 네이버 6조8176억원, 카카오는 6조1367억원으로 카카오가 사업을 다방면으로 확대하면서 네이버와의 매출차이가 좁혀진 것에 비하면 중요한 시설투자는 훨씬 적었다.

앞으로도 이와 비슷한 사고는 언제든 다시 발생할 수 있다. '카카오 먹통'과 같은 '디지털 대란'을 겪지 않기 위해선 데이터센터 비상시 빠르고 정확한 복구시스템과 대응 매뉴얼, 체계적인 재난대응훈련 등은 매우 절실하다.


김태형 글로벌이코노믹 기자 tadkim@g-enews.com