
마이크로소프트가 추론 작업에 특화된 2세대 AI 가속기 칩인 마이아 200을 발표했습니다.
마이아 200은 빌드 2024에서 첫 공개했던 5nm 공정의 마이아 100의 후속 제품으로 TSMC 3nm 공정으로 제작됩니다.
초당 7TB의 대역폭을 가진 216GB의 HBM3e 메모리와 272MB의 온칩 SRAM을 지원하는 마이아 200은 네이티브 FP8/FP4 텐서 코어를 탑재했습니다.
또한 확장 가능한 배포를 위한 설계를 중심에 둬 6,144개의 가속기 클러스터 간 통신을 위한 초당 2.8TB의 양방향 대역폭을 제공하는 온칩 NIC도 통합했습니다.

마이크로소프트의 데이터에 따르면 마이아 200의 FP8 성능은 아마존의 3세대 트레이니움(Trainium)보다 거의 두 배 높고, 구글 7세대 TPU보다도 약 10% 높습니다.
이미 마이크로소프트의 미국 중부 데이터센터 및 서부 3 데이터센터에 배포된 마이아 200은 오픈AI GPT-5.2 모델을 기반으로 작동하는 마이크로소프트 365 및 기타 서비스에 걸친 AI 기능을 제공합니다.







