대규모 언어 모델 추론 가속기 엔비디아 그록 3 LPU 공개

엔비디아가 작년 인수한 그록(Groq)의 지식재산을 활용한 신규 추론 가속기 엔비디아 그록 3(Groq 3) LPU(Language Processor Unit)를 GTC 2026에서 발표했습니다.

이 칩은 HBM 대신 500MB의 고성능 SRAM을 탑재하여 150TB/s에 달하는 압도적인 메모리 대역폭으로 초고속 추론 기능을 제공합니다.

루빈 플랫폼의 일원으로 합류한 그록 3 LPU는 대규모 AI 모델의 모든 레이어와 토큰에서 데이타 처리를 가속화하도록 설계되었습니다.

엔비디아는 256개의 LPU를 결합한 ‘그록 3 LPX 랙’을 통해 총 128GB의 SRAM과 40PB/s의 대역폭을 갖춘 강력한 가속 인프라를 구축했습니다.

해당 시스템은 초당 1,500개 이상의 토큰을 생성할 수 있어, 인간보다 훨씬 빠른 반응 속도를 요구하는 차세대 ‘에이전틱 AI’ 시스템에 최적화되었습니다.

전문가들은 이번 LPU 도입이 저지연 추론 시장에서 경쟁사인 세레브라스(Cerebras) 등의 도전을 방어하는 데 핵심적인 역할을 할 것으로 보고 있습니다.

그록 3 LPU는 GDDR7 메모리 의존도를 낮추면서도 높은 효율성을 제공하며, 올해 하반기 루빈 기반 데이터센터의 핵심 구성 요소로 공급될 예정입니다.

글쓴이 | Editor_B
언제나 기분 좋은 소식을 전하고 싶습니다.

news@techg.kr