Помимо Trainium3, ориентированного на обучение и инференс крупных ИИ-моделей, Amazon представила на конференции re:Invite новое поколение собственных серверных процессоров — Graviton5. В основе чипа лежит архитектура ARM Neoverse V3. Конфигурация включает 192 ядра, каждое получает 2 МБ L2, а весь кластер делит общий L3 объёмом 192 МБ. Подсистема памяти поддерживает DDR5-7200, Amazon планирует валидировать системы и на DDR8-8800 (предположительно MRDIMM). Интерфейс ввода-вывода — PCIe 6.0.
Производство Graviton5 Amazon относит к TSMC 3 нм, однако остаётся неясным, касается ли это только центрального вычислительного чиплета или всех чиплетов конструкции. У предыдущего поколения крупные северный и южный чиплеты отвечали за I/O, а меньшие восточный и западный элементы — за внешние контроллеры памяти. Судя по структуре корпусировки Graviton5, логика распределяется аналогичным образом, хотя Amazon пока не раскрывает точные роли каждого блока.
Рост производительности
Переход от 96 к 192 ядрам фактически удваивает вычислительные ресурсы на сокет. При этом L3 вырос втрое, а пропускная способность памяти значительно увеличилась. В результате Graviton5, по данным Amazon, обеспечивает до +25 % производительности относительно Graviton4 при почти неизменной энергоэффективности.
Amazon также приводит результаты для типовых облачных нагрузок:
- EC2-M9g / C9g / R9g ускоряются в зависимости от сценария на 35–60 %,
- SAP HANA и Persistency дают верхнюю границу этого диапазона,
- инструменты Synopsys EDA ускоряются примерно на 35 %.
Модельный ряд экземпляров
- M9g — универсальные рабочие нагрузки,
- C9g — вычислительно тяжёлые сценарии,
- R9g — приложения, зависящие от ёмкости памяти.
Инстансы M9g уже доступны в виде Preview. C9g и R9g появятся в 2026 году.