NVIDIA acaba de revelar los detalles oficiales de su acelerador de inteligencia artificial GB300 Blackwell Ultra, una versión mejorada del ya potente GB200. El nuevo modelo lleva la computación de alto rendimiento a otro nivel, con más núcleos CUDA, mayor cantidad de memoria HBM3E, una interfaz de comunicación más veloz y un aumento considerable en su consumo energético.
Más potencia con una arquitectura de doble chip
El NVIDIA GB300 se basa en dos cristales de silicio interconectados que, en conjunto, cuentan con 208 mil millones de transistores. Estos se fabrican bajo el nodo TSMC 4NP y funcionan como una sola GPU gracias a la interfaz de alta velocidad NV-HBI, que ofrece un ancho de banda interno de 10 TB/s.
La unidad de procesamiento gráfico está compuesta por 160 multiprocesadores de streaming, cada uno con 128 núcleos CUDA, lo que da un total de 20.480 núcleos CUDA. Además, incluye núcleos Tensor de quinta generación que admiten formatos como FP8, FP6 y el nuevo NVFP4, diseñado para usar menos memoria manteniendo buena precisión.
Cada multiprocesador incluye 256 KB de memoria Tensor, sumando 40 MB en total, y cuenta con unidades de cálculo dedicadas para operaciones matemáticas avanzadas y trascendentales.
Memoria HBM3E masiva y rendimiento de datos extremo
El NVIDIA GB300 incorpora 8 pilas de memoria HBM3E de 12 capas, alcanzando un total de 288 GB de memoria integrada. El ancho de banda se mantiene en 8 TB/s, repartidos en una interfaz de 8192 bits con 16 canales de 512 bits cada uno. Esta configuración permite cargar modelos de IA completos dentro del acelerador, optimizando velocidad y consumo energético al evitar accesos externos frecuentes.
El TGP del GB300 sube a 1400 W, una cifra altísima que refleja la ambición de este hardware.
Comunicaciones ultra rápidas con NVLink 5 y PCIe 6.0
Para la comunicación entre GPU, se utiliza NVLink 5, con una tasa bidireccional de 1,8 TB/s por GPU. Para conectar la GPU con la CPU Grace, se emplea NVLink-C2C, con 900 GB/s de ancho de banda y soporte para un único espacio de direcciones. Y como novedad, NVIDIA estrena el estándar PCIe 6.0 x16, con un ancho de banda de 256 GB/s bidireccional entre el acelerador y el sistema host.
Los nuevos aceleradores pueden instalarse en el rack NVIDIA GB300 NVL72, que permite montar 72 GPUs, sumando 20,7 TB de memoria HBM3E y un ancho de banda total de 576 TB/s. También incluye 72 CPUs Grace Superchip ARM con hasta 480 GB de memoria LPDDR5X y un ancho de banda de 512 GB/s.
El nuevo formato NVFP4 ahorra memoria sin perder precisión
NVIDIA también presentó NVFP4, un nuevo formato de datos de baja precisión para núcleos tensoriales. Es comparable en precisión a FP8, pero consume 1,8 veces menos memoria, algo clave en cargas de trabajo de IA a gran escala.







