[국정자원 화재] 국민 앞에선 "전산 장애시 3시간 내 복구"라던 정부, 현실은 먼 미래

27일 대전 유성구 국가정보자원관리원 인근에서 현장 통제가 이뤄지고 있다. 전날 오후 8시 20분께 전산실에서 리튬이온 배터리 폭발로 화재가 발생했다. 소방당국은 9시간 50분 만인 이날 오전 6시 30분께 초진 완료했다. [ⓒ연합뉴스]
[디지털데일리 이상일기자] 정부가 카카오 먹통 사태 이후 고강도 대책을 쏟아내며 “국가 전산망은 다르다”고 강조했지만, 정작 이번 국가정보자원관리원 대전센터 화재에서는 백업 체계의 허점이 드러났다.
국가정보자원관리원은 정부24, 주민등록시스템, 홈택스 등 주요 국가정보시스템을 대전·광주센터 간 실시간으로 상호 백업하고 있다고 밝혀 왔다. 또 대전센터가 소실될 경우 재해복구시스템을 통해 3시간 이내 복구할 수 있다고 설명해 왔다. 그러나 실제 화재 발생 직후 일부 서비스는 차질을 빚었고, 무엇보다 정부가 약속했던 다중지역 동시가동 체계 전환이 여전히 본격 가동되지 못하고 있다는 점에서 비판이 제기된다.
현행 재해복구시스템은 대전과 광주 등 주센터와 별도로 원격지에 유사한 시스템을 구축, 가동되도록 설계돼 있다. 그러나 이 방식은 전체 기능이 아닌 핵심 기능 위주로, 주시스템보다 축소된 규모로 마련되는 경우가 많다. 이 때문에 실제 전환 시에는 많은 기능이 작동하지 않거나 평상시 발생하는 트래픽을 감당하기 어렵다는 문제가 발생한다.
국가정보자원관리원도 27일 오전 서울 종로구 정부서울청사에서 열린 '국가정보자원관리원 정부 서비스 장애 관련 브리핑'에서 “DR 시스템이 구축돼 있지만 일부는 최소한의 규모에 그치고, 스토리지나 데이터 백업 전용 형태로만 마련된 경우가 있어 모든 시스템을 즉시 전환하기는 어렵다”고 인정했다. 결국 재난 상황에서는 최후의 보루로 의미가 있지만, 일반적인 장애에는 대응력이 떨어져 국민이 체감하는 서비스 안정성을 보장하기에는 미흡하다는 한계가 여실히 드러났다.
정부는 이러한 한계를 극복하기 위해 기존의 주센터-재해복구센터 분리 운영 방식을 넘어, 두 개 이상의 센터를 평상시에도 동시에 운영하는 다중지역 동시가동 체계를 준비해 왔다. 실제로 2023년 컨설팅을 거쳐 올해 시범사업에 착수했지만, 이번 화재로 확인된 것은 해당 전환이 아직 초기 단계에 머물러 있다는 점이다.
이재용 국가정보관리원장은 “행정전산 장애 이후에 액티브 스탠바이 형태의 DR이 아니라, 액티브-액티브 형식의 DR을 개발하기로 하고 지난해 컨설팅에 이어 올해 시범사업을 하고 있다”며 “(다만) 앞으로 우리가 미래에 어떤 식으로 DR 시스템을 구축할까에 대한 얘기”라며 방향성만 잡은 상태라고 밝혔다.
정리하면 애초 정부가 장기적으로는 실시간 백업 등을 목표로 했지만, 그 사이에 벌어진 이번 화재는 백업 체계 구축 지연이 갖는 위험성을 단적으로 보여주었다는 지적이다.
정부는 2008년부터 검토해 2019년 착공, 2023년 준공한 백업센터를 통해 재해복구 전용 인프라도 마련해 두었다. 현재 통신망과 보안 등 전산환경 구축 사업이 진행 중이며, 올해 말부터 실시간 데이터 백업과 소산 데이터 보관 기능을 시작할 계획이다. 이후 2026년부터는 다중지역 동시가동 체계를 적용한 재해복구시스템이 본격 입주할 예정이다.

이재용 국가정보자원관리원장(오른쪽)이 27일 오전 서울 종로구 정부서울청사 브리핑실에서 열린 '국가정보자원관리원 정부 서비스 장애 관련 브리핑'에서 취재진 질문에 답하고 있다. [ⓒ연합뉴스]
국가정보자원관리원은 설립 20주년을 맞은 올해 단순한 물리적 통합을 넘어 서비스와 인프라의 통합, 그리고 민간 클라우드와의 시너지 창출을 통해 디지털 행정 서비스의 안정성과 혁신성을 함께 담보하겠다는 방침을 밝힌바 있다. 하지만 이번 화재를 계기로, 기존 재해복구시스템의 한계와 다중지역 동시가동 체계 전환 지연이라는 과제가 다시금 부각됐다.
전문가들은 현재의 재해복구시스템이 대규모 재난 상황에서는 최후의 안전망 역할을 할 수 있지만, 평상시 발생하는 다양한 장애 상황에는 대응력이 떨어진다는 점을 지적한다. 핵심 기능 위주로만 마련된 시스템은 긴급 상황에서 기본 서비스를 살리는 데에는 의미가 있지만, 국민이 일상적으로 이용하는 행정 서비스의 연속성을 완전히 보장하지는 못한다는 것이다. 이런 한계는 곧 안정성과 효율성 사이의 균형 문제로 이어진다.
정부가 추진 중인 액티브-액티브 방식의 다중지역 동시가동 체계는 이러한 문제를 근본적으로 해결하기 위한 시도다. 평상시부터 여러 센터가 동시에 운영되기 때문에 한쪽 센터에 문제가 발생해도 서비스가 중단되지 않고, 장애 상황이 재난으로 확대되는 것을 원천적으로 차단할 수 있다. 다만 이 체계는 막대한 예산과 높은 기술적 난이도를 요구하기 때문에, 재정 효율성과 안정성이라는 두 가지 과제를 동시에 충족시켜야 하는 부담이 따른다.
이 때문에 정부는 단순히 시설을 늘리는 방식이 아니라, 민간 클라우드 인프라를 적극적으로 활용하고 기존 센터를 다중지역 체계에 맞게 전환하는 방안을 함께 모색하고 있다. 민간 클라우드 기업들의 기술 역량을 공공 시스템에 접목해 인프라의 혁신성을 확보하면서, 한정된 예산 안에서 안정성을 극대화하겠다는 전략이다.
결국 국가 전산망의 미래는 장애와 재난에 모두 대응할 수 있는 유연한 구조를 얼마나 효율적으로 구축하느냐에 달려 있으며, 안정성과 효율성의 동시 확보가 앞으로의 가장 큰 과제가 될 전망이다.
한편 2년 전에 정부 전산망 장애가 발생했을 당시, 문제가 발생했을 경우 3시간 이내에 복구할 수 있도록 하겠다고 정부가 발표한 상황에서 이번 화재로 인한 장애는 상당 시간 계속될 것으로 보인다.
국가정보자원관리원 이재영 원장은 “3시간 이내라는 것은 일반적으로 저희가 장애 목표 기한으로 잡고, 내부적으로 서비스 수준으로 정하고 있는 것은 맞다”면서도 “그런데 이번 장애는 화재로 인한 것이고, 화재 진압에 밤새 아침까지 걸렸으며 아직 열기가 다 빠지지 않아 복구 작업에 착수하지 못한 상태다. 이번 경우는 원인이 달랐다”고 밝혔다.
하지만 전문가들은 카카오 전산마비 처럼 화재가 전산장애의 원인으로 지목된 것이 상당한 수에 이름에도 불구하고 화재 후 소화까지를 상정하지 않은 채 복구 시간을 산정했다는 것은 말이 안된다는 지적이다. 데이터센터 업계의 한 관계자는 "장애복구 시점은 장애가 일어난 시점부터 산정되는 것이 맞다. 화재야말로 재해복구 목표 시간에 포함했어야 할 핵심 시나리오"라고 지적했다.
크라우드웍스, 실적 개선 흐름…피지컬·제조 AI 데이터로 반등 모색
2026-05-16 06:03:08플리토, 1분기 매출 13% 성장…“피지컬 AI 데이터 승부수”
2026-05-16 06:02:12곽태헌 대표 “체질 개선에 속도, 종합경쟁력 강화”…디지털데일리 혁신 드라이브
2026-05-16 06:00:00"취약계층에 안내 친절히"…휴대폰 대리점 찾은 방미통위원장
2026-05-15 17:00:00[DD퇴근길] 삼성 파업에 100조원 증발?…정부, 최후 카드 ‘긴급조정권’ 발동하나
2026-05-15 17:00:00