솔루션

내년 공공시스템 SLA 의무화…큐브리드 "HA 내장 엔진으로 추가비 없이 DR 요건 충족"

박재현 기자

장현석 큐브리드 상무가 5월 6일 서울 중구 전국은행연합회 은행회관에서 열린 Digital Continuity 2026에서 '디지털 DR 구축을 위한 큐브리드 활용 방안'을 주제로 발표하고 있다.[사진=디지털데일리]

[디지털데일리 박재현기자] 정부가 내년부터 서비스수준계약(SLA)와 재해복구(DR)체계 구축 기준안을 본격 적용한다.

시스템 등급별로 복구목표시간(RTO)과 복구목표시점(RPO)이 명문화되면서 공공 DB 인프라 전반에 고가용성(HA) 요건이 강화될 전망이다. 큐브리드는 자체 DB 엔진에 레플리케이션 기반 HA 기능을 기본 내장시키면서 본격적인 공공 DR 수요에 적극 대응한다는 계획이다.

장현석 큐브리드 상무는 6일 디지털데일리가 개최한 <Digital Continuity 2026> 행사에서 '디지털 DR 구축을 위한 큐브리드 활용 방안' 발표를 통해 이 같이 공유했다.

장현석 상무에 따르면, 큐브리드 DB 엔진에는 DR 구성과 HA 운영에 필요한 기능이 내장돼 있다. 상용 DBMS가 HA·DR 기능을 별도 라이선스로 판매하거나 서드파티 솔루션을 요구하는 것과 구별된다.

큐브리드 HA의 핵심은 레플리케이션 기반 실시간 데이터 동기화다. DR 구현 방식은 백업 방식과 스냅샷 방식, 레플리케이션 방식 등 세 가지로 구분된다. 백업과 스냅샷은 해당 시점 이후 발생한 데이터가 손실될 수 있다. 반면 레플리케이션은 트랜잭션 단위로 실시간 동기화하기 때문에 데이터 손실이 최소화된다.

DB 관점에서 DR을 구현하기 위한 방식은 레플리케이션이 최적이라는 설명이다.

큐브리드 HA 구조는 마스터, 슬레이브, 레플리카 등 3노드 체계로 운영된다. 마스터(액티브)에 장애가 발생할 시 슬레이브(스탠바이)가 자동으로 역할을 전환하며, 리플리카 노드는 읽기 부하 분산·통계 분석·DR 전용 등 다양한 용도로 활용할 수 있다. 마스터는 반드시 1대여야 하지만 슬레이브와 레플리카는 n대까지 확장 가능한 구조다.

전환 속도도 공공 SLA 요건을 상회한다. 장애 감지 후 오토 페일오버는 CPU 과부하나 메모리·디스크 고갈, 네트워크 단절, 프로세스 종료 등 주요 장애 유형 모두에서 15초 이내에 완료된다.

관리자가 직접 개입하는 스위치오버도 1분 이내다. 정부가 2등급 대국민 시스템에 요구하는 'RTO 3시간 이내' 기준에 비해 크게 단축할 수 있다.

큐브리드 HA의 동기화 방식은 동기(Sync)와 비동기(Async)를 모두 지원한다. 동기 방식은 슬레이브 서버에 데이터가 정확히 기록됐음을 확인한 뒤 마스터가 커밋하는 방식으로, 두 서버 간 데이터 일치성이 항상 보장된다. 비동기 방식은 커밋 속도가 빠르지만 찰나의 동기화 지연이 생길 수 있다.

장현석 상무는 "같은 센터 내 구성엔 동기 방식을, 원격지 DR 센터엔 네트워크 전송 지연을 고려해 비동기 방식을 권장한다"고 설명했다.

큐브리드의 차별점으로는 3티어 아키텍처 기반 '브로커'를 꼽았다. 애플리케이션과 DB 서버 사이에 위치한 브로커는 읽기·쓰기 트래픽 분산, 장애 감지, 접근 제어를 전담한다. 브로커 서버를 물리적으로 분리 구성할 수 있어 대용량 트랜잭션 환경에서 DB 서버 부하를 효과적으로 줄일 수 있다는 게 큐브리드 측 설명이다.

구축사례도 공유했다. 전국에 배포된 정부 온나라 시스템 중 한 지자체는 주 전산실에 액티브-스탠바이를, CCTV 관제센터에 레플리카 노드를 배치해 스냅샷 방식 대비 데이터 손실률을 낮추고 복구 속도를 높였다.

장현석 큐브리드 상무는 "정부는 국가정보자원관리원 광주·대구·공주 3개 센터를 액티브-액티브, 액티브-스탠바이 방식으로 구축하는 ISP를 올해까지 완료하고 본격 구축에 착수할 예정이다. 이 중 큐브리드 DBMS가 다수가 포함됐다"고 말했다.

박재현 기자
crejx@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널