Hace ya varios meses que salieron a la venta las AMD Radeon RX 6000 (RDNA2) y las NVIDIA GeForce RTX 3000 (Ampere). Sin embargo, hasta ahora a nadie se le había ocurrido realizar una prueba de rendimiento en el apartado de las latencias de memoria de ambas arquitecturas, lo cual arrojó resultados llamativos.
Estando a las puertas de los diseños chiplet para GPU, vemos que AMD lleva ventaja sobre NVIDIA en cuanto al rendimiento de la memoria caché y la latencia. Recordemos que el equipo rojo estrenó el diseño chiplet con los procesadores Ryzen, y con las GPUs están preparando el terreno con la conocida Infinity Cache.
La gente de Chips and Cheese quiso probar el rendimiento de la memoria caché y las latencias de la actual generación de tarjetas gráficas. Dicho esto, pusieron cara a cara a la AMD Radeon RX 6800 XT con la GPU insignia de NVIDIA, la GeForce RTX 3090.
Los resultados del benchmark fueron contundentes: La arquitectura RDNA2 es muy superior a Ampere, ya que ofrece unas latencias inferiores a pesar de tener que comprobar dos niveles más de caché en el camino hacia la memoria. Además, el uso de Infinity Cache sólo añade 20ns sobre la caché L2 y sigue siendo más rápida que la integrada en la GPU del equipo verde.
Desde el sitio explicaron que esto se debe a que el chip gráfico NVIDIA GA102 es una GPU mucho más grande y, que aunque utiliza un subsistema de memoria de GPU más convencional con sólo dos niveles de caché, tiene que tomar muchos ciclos, lo que da como resultado una latencia de más de 100ns (L1 a L2).
Por otra parte, con el chip gráfico AMD Navi 21 se tiene una latencia de sólo 66ns. La GPU AMD Navi 21 es mucho más pequeña y cuenta con una caché L2 de 4 MB, mientras que la GPU NVIDIA GA102 cuenta con una caché L2 de 6 MB.
«La caché de RDNA2 es rápida y hay mucha. En comparación con Ampere, la latencia es baja en todos los niveles. La Infinity Cache sólo añade unos 20ns de impacto sobre la L2 y tiene una latencia menor que la L2 de Ampere. Sorprendentemente, la latencia de la VRAM de RDNA 2 es más o menos la misma que la de Ampere, a pesar de que RDNA 2 comprueba dos niveles más de caché de camino a la memoria.
En cambio, Nvidia sigue con un subsistema de memoria de GPU más convencional, con sólo dos niveles de caché y una alta latencia L2. Pasar de la L1 privada SM de Ampere a la L2 lleva más de 100ns. La L2 de RDNA está a ~66 ns de la L0, incluso con una caché L1 entre ambas. Sortear el enorme troquel/die del GA102 parece llevar muchos ciclos.
Esto podría explicar el excelente rendimiento de AMD en resoluciones inferiores. Las cachés L2 y L3 de baja latencia de RDNA 2 pueden darle una ventaja con cargas de trabajo más pequeñas, en las que la ocupación es demasiado baja para ocultar la latencia. En comparación, los chips Ampere de Nvidia necesitan más paralelismo para brillar».
RDNA2 supera con diferencia a Ampere en cuanto a latencia de memoria…
Fuente: Chips And Cheese