
На конференции GTC 2025 Nvidia анонсировала обновления своей дорожной карты для дата-центров на 2026 и 2027 годы, представив запланированные конфигурации для предстоящих Rubin (названный в честь астронома Веры Рубин) и Rubin Ultra.
Несмотря на то что компания только что завершила запуск Blackwell B200 в массовое производство и планирует выпуск Blackwell B300 во второй половине 2025 года, Nvidia уже смотрит в будущее на следующие два года и помогает своим партнёрам подготовиться к предстоящим переходам. Один из интересных моментов, который был озвучен, это то, что «Blackwell был назван неверно». Короче говоря, Blackwell B200 на самом деле имеет два кристалла на каждом GPU, что, по словам генерального директора Дженсена Хуанга, изменяет топологию NVLink.
Таким образом, несмотря на то что компания называет текущее решение Blackwell B200 NVL72, Хуанг говорит, что было бы более уместно назвать его NV144L. И именно это Nvidia сделает с предстоящими решениями Rubin.
На изображении показан вариант Rubin NVL144, который будет совместим с существующей инфраструктурой Blackwell NVL72. Для сравнения на втором слайде представлены данные о конфигурации Blackwell Ultra B300 NVL72. Где B300 NVL72 предлагает 1,1 EFLOPS плотных вычислений FP4, Rubin NVL144 — это с теми же 144 кристаллами GPU — предложит 3,6 EFLOPS плотных вычислений FP4.
Rubin также будет иметь 1,2 ExaFLOPS для обучения FP8, по сравнению с 0,36 ExaFLOPS для B300. В целом это улучшение в 3,3 раза по вычислительной мощности.
Rubin также станет отправной точкой для перехода с HBM3/HBM3e на HBM4, при этом HBM4e будет использоваться для Rubin Ultra. Ёмкость памяти останется на уровне 288 ГБ на GPU, как и у B300, но пропускная способность увеличится с 8 ТБ/с до 13 ТБ/с. Также будет быстрее NVLink, который удвоит пропускную способность до 260 ТБ/с в сумме, а новый CX9-соединение между стойками обеспечит 28,8 ТБ/с (в два раза больше пропускной способности B300 и CX8).
Другой половиной семьи Rubin будет процессор Vera, который заменит текущие процессоры Grace. Vera будет относительно небольшим и компактным процессором с 88 кастомными ядрами ARM и 176 потоками. Также он будет иметь интерфейс NVLink core-to-core с пропускной способностью 1,8 ТБ/с для связи с GPU Rubin.
Rubin Ultra поступит во второй половине 2027 года, и хотя процессор Vera останется, графическая часть получит ещё один большой скачок. Полный стояк будет заменён новым макетом NVL576. Да, это до 576 GPU в стойке, каждый с неопределённым уровнем потребляемой мощности.
Вычисления на основе вывода с FP4 вырастут до 15 ExaFLOPS, а вычисления для обучения FP8 достигнут 5 ExaFLOPS. Это в 4 раза больше вычислительной мощности, чем у Rubin NVL144, что логично, учитывая, что в нем в 4 раза больше GPU. В GPU будет четыре кристалла на каждый пакет, чтобы повысить плотность вычислений.
В то время как решение Rubin NVL144 имеет 75 ТБ «быстрой памяти» (для процессоров и GPU) на стойку, Rubin Ultra NVL576 предложит 365 ТБ памяти. GPU получат HBM4e, но тут возникает некая загадка: Nvidia указывает 4.6 ПБ/с пропускной способности HBM4e, но при 576 GPU это означает 8 ТБ/с на каждый GPU. Это, казалось бы, меньше пропускной способности на GPU, чем раньше.
Возможно, это связано с тем, как связаны между собой четыре кристалла GPU? Также будет 1 ТБ HBM4e на каждые четыре кристалла GPU, с 100 ПетаФлопс вычислений FP4.
Интерфейс NVLink7 будет в 6 раз быстрее, чем у Rubin, с пропускной способностью 1,5 ПБ/с. CX9-соединения между стойками также получат улучшение в 4 раза, до 115,2 ТБ/с, что возможно связано с удвоением количества соединений.
Очевидно, что о Rubin и Rubin Ultra ещё многое не известно, но эти детали будут раскрыты в будущем. Дата-центры требуют гораздо большего планирования, чем потребительские GPU, поэтому Nvidia предоставила все подробности заранее до того, как продукты будут готовы к отгрузке.
После Rubin следующая архитектура дата-центров от Nvidia будет названа в честь физика-теоретика Ричарда Фейнмана. Предположительно, это означает, что мы получим процессоры Richard с GPU Feynman, если Nvidia продолжит придерживаться текущего шаблона.