셀렉트스타, EU '개인정보 벤치마크 데이터셋' 구축 착수
[디지털데일리 이건한 기자] 셀렉트스타가 유럽연합 개인정보 벤치마크 데이터셋 구축에 착수했다고 23일 밝혔다. 이번 사업은 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관하는 '2025년도 초거대 AI 확산 생태계 조성사업'의 일환이다.
셀렉트스타는 유럽연합(EU)의 일반개인정보보호법(GDPR)과 인공지능법(AI Act)을 기반으로 한 오픈소스 데이터셋을 구축해, 대형언어모델(LLM)의 개인정보보호 준수 여부를 평가할 수 있는 표준 데이터를 마련하는 것을 목표로 했다. EU 규제가 글로벌 표준으로 확산되는 '브뤼셀 효과'에 대응하기 위한 표준 데이터 구축 필요성에 무게를 뒀다.
프로젝트는 EU 주요 법령과 공공 보고서를 기반으로 데이터를 수집·정제하고, 개인정보 보호 핵심 항목을 분류해 평가 기준을 마련한다. 실제 서비스 환경 적용을 위해 질의응답 데이터와 다국어 평가 자료를 제작해 LLM의 규정 이해·준수 여부를 검증하는 체계를 갖출 계획이다.
셀렉트스타는 주관기관으로 기획·총괄과 데이터 구축·품질 검증을 맡는다. 플리토와 BHSN이 참여기관으로 합류했다. 플리토는 ▲다국어 데이터 정제·검수 ▲번역 품질 관리 ▲용어사전 구축을 수행한다. 리걸 AI 전문기업 BHSN은 ▲개인정보 보호 핵심 항목 정의 ▲시나리오 설계 ▲법적 리스크 검토를 담당해 실제 규제 환경 적합성을 지원한다.
이번 과제는 국내 최초로 EU 규제 준수 여부를 검증하는 LLM 평가용 벤치마크 데이터셋 구축이다. 이를 통해 글로벌 개인정보 규제 대응 역량을 지원하고, 국내 AI 기업의 유럽 시장 진출 시 검증 도구를 제공한다. 구축 데이터셋은 오픈소스로 공개된다.
김세엽 셀렉트스타 대표는 "이번 프로젝트는 국내 기업들이 글로벌 시장 진출에 도움을 줄 수 있는 발판이 될 것"이라며 "셀렉트스타가 자체 개발한 AI 신뢰성 검증 기술력을 바탕으로, LLM의 EU 규제 대응 수준을 정량적으로 측정할 수 있는 체계를 마련하겠다"고 말했다.
머스크 ‘뉴럴링크’ 대항마 키우는 중국…5년 내 ‘뇌-컴퓨터’ 일상화 예고
2026-03-08 13:57:00WBC 한일전 '욱일기 응원' 또 등장… 서경덕 "주최측 강력 조치해야"
2026-03-08 13:05:05[MWC26결산]② 통신사의 축제 옛말…‘네트워크→AI 인프라’ 전환에 흔들리는 입지
2026-03-08 11:29:36