인텔, AI 추론 특화 GPU ‘크레센트 아일랜드·가우디 3 랙스케일’ 공개 [인더AI]

인텔(Intel)이 차세대 AI 추론 시장을 겨냥한 데이터센터용 GPU 신제품 ‘크레센트 아일랜드(Crescent Island)’와 ‘인텔 가우디 3(Intel Gaudi 3)’ 랙스케일 레퍼런스 디자인을 공개했다. [사진=인텔]
[디지털데일리 김문기 기자] 인텔(Intel)은 차세대 AI 추론 시장을 겨냥한 데이터센터용 GPU 신제품 ‘크레센트 아일랜드(Crescent Island)’와 ‘인텔 가우디 3(Intel Gaudi 3)’ 랙스케일 레퍼런스 디자인을 공개했다. 이번 발표는 14일(현지시각) 미국 새너제이에서 열린 ‘2025 OCP 글로벌 서밋(Open Compute Project Global Summit)’에서 진행됐다.
인텔은 이번 신제품을 통해 급증하는 AI 추론 워크로드 수요에 대응하고, 고성능·고효율·확장형 AI 인프라 포트폴리오를 한층 강화한다는 전략이다.
사친 카티(Sachin Katti) 인텔 최고기술책임자(CTO)는 “AI는 정적 학습 단계를 넘어, 에이전트형 AI가 주도하는 실시간·전역 추론 시대로 전환되고 있다”며 “이제는 특정 칩 하나가 아니라, 적절한 실리콘을 적절한 작업에 배치하는 이기종 시스템(hybrid system)이 필요하다”고 밝혔다. 그는 이어 “인텔 Xe 아키텍처 기반 데이터센터 GPU는 폭증하는 토큰 처리량에 대응하면서, 고객에게 효율성과 가치를 모두 제공할 것”이라고 덧붙였다.
코드명 ‘크레센트 아일랜드’(Crescent Island)로 명명된 신형 GPU는 공랭식 엔터프라이즈 서버 환경에 최적화된 전력 효율 설계와 대용량 메모리 구성을 특징으로 한다. AI 추론 워크로드를 위한 Xe3P 마이크로아키텍처를 기반으로 하며, 주요 사양은 △와트당 성능(PPW) 최적화 △160GB LPDDR5X 메모리 △‘서비스형 토큰(Token-as-a-Service)’ 및 다양한 데이터 유형 지원 등이다.
인텔은 자사의 이기종 AI 시스템을 위한 개방형 통합 소프트웨어 스택을 통해 크레센트 아일랜드 GPU를 조기 최적화 중이라고 밝혔다. 해당 스택은 현재 아크 프로(Arc Pro) B 시리즈 GPU에서 테스트 중이며, 고객 샘플링은 2026년 하반기에 제공될 예정이다.
함께 공개된 ‘인텔 가우디 3 랙스케일 레퍼런스 디자인’은 PCIe부터 랙 규모까지 유연한 추론 확장을 가능하게 하는 엔터프라이즈급 설계다. 가우디 3 기반 시스템은 8.2TB의 고대역폭 메모리(HBM)와 액체 냉각(수냉) 솔루션을 채택해, 랙당 최대 64개의 AI 가속기를 지원한다. 이를 통해 대규모 언어모델(LLM) 배포, 실시간 추론, 대용량 AI 애플리케이션 실행에 최적화된 인프라를 구현할 수 있다.
인텔은 제온 6 프로세서, 가우디 3, 데이터센터 GPU를 중심으로 AI PC부터 클라우드, 산업용 엣지까지 이어지는 엔드투엔드(end-to-end) AI 솔루션을 제공하고 있다. 특히 PCIe 유연성과 랙 스케일 설계를 통해 기업 및 클라우드 서비스 제공업체의 배포 지연을 최소화할 수 있다고 설명했다.
또한 인텔은 OCP(Open Compute Project) 등 개방형 커뮤니티와의 협력을 확대해, AI 추론이 필요한 모든 환경에서 인텔 기술이 활용될 수 있도록 지속적으로 지원할 계획이다.
오픈AI, 美 정부에 "AI 인프라, 국가 전략산업 격상 요구…‘연 100GW 전력 확보하라"
2025-11-08 12:46:40퀄컴, ‘2025 서울형 청년인턴 직무캠프’ 수료식 개최
2025-11-08 12:26:44[트렌D] "롱은 지고 하프 뜬다"…패션 플랫폼, 겨울 아우터 판도 바꿨다
2025-11-08 10:51:59삼성, 바클레이즈와 손잡고 美 신용카드 출시 추진… '애플 카드' 모델과 유사
2025-11-08 10:50:24'해킹 은폐 의혹' 휘말린 KT…'채찍과 당근' 고민 빠진 정부
2025-11-08 09:00:00