Home > #새소식 > 대규모 언어 모델 추론 가속기 엔비디아 그록 3 LPU 공개

대규모 언어 모델 추론 가속기 엔비디아 그록 3 LPU 공개


엔비디아가 작년 인수한 그록(Groq)의 지식재산을 활용한 신규 추론 가속기 엔비디아 그록 3(Groq 3) LPU(Language Processor Unit)를 GTC 2026에서 발표했습니다.

이 칩은 HBM 대신 500MB의 고성능 SRAM을 탑재하여 150TB/s에 달하는 압도적인 메모리 대역폭으로 초고속 추론 기능을 제공합니다.

루빈 플랫폼의 일원으로 합류한 그록 3 LPU는 대규모 AI 모델의 모든 레이어와 토큰에서 데이타 처리를 가속화하도록 설계되었습니다.

엔비디아는 256개의 LPU를 결합한 ‘그록 3 LPX 랙’을 통해 총 128GB의 SRAM과 40PB/s의 대역폭을 갖춘 강력한 가속 인프라를 구축했습니다.

해당 시스템은 초당 1,500개 이상의 토큰을 생성할 수 있어, 인간보다 훨씬 빠른 반응 속도를 요구하는 차세대 ‘에이전틱 AI’ 시스템에 최적화되었습니다.

전문가들은 이번 LPU 도입이 저지연 추론 시장에서 경쟁사인 세레브라스(Cerebras) 등의 도전을 방어하는 데 핵심적인 역할을 할 것으로 보고 있습니다.

그록 3 LPU는 GDDR7 메모리 의존도를 낮추면서도 높은 효율성을 제공하며, 올해 하반기 루빈 기반 데이터센터의 핵심 구성 요소로 공급될 예정입니다.

Editor_B
글쓴이 | Editor_B
언제나 기분 좋은 소식을 전하고 싶습니다.

news@techg.kr
You may also like
실사급 게임 그래픽 구현하는 엔비디아 DLSS 5 공개
H100 대비 25배 성능의 우주용 스페이스-1 베라 루빈 공개한 엔비디아
88코어 베라 CPU 및 수냉식 랙 상세 공개한 엔비디아
엔비디아 지포스 나우에 GOG 연동 및 VR 헤드셋 90fps 스트리밍 지원

Leave a Reply

error: Content is protected !!