Las especificaciones de la tarjeta grafica tope de gama Ada Lovelace de NVIDIA supuestamente han sido filtradas. La GeForce RTX 4090 que aprovecha el chip AD102 contará con un total de 16.128 núcleos FP32 en 126 SM, 63 TPC y 11 GPC. Este chip se combinará con 24 GB de memoria GDDR6X de 21 Gbps en un bus de 384 bits, al igual que la RTX 3090 Ti. Es probable que Lovelace tome prestadas algunas de las características de Hopper, especialmente Thread Block Memory Sharing, que junto con los 96 MB de caché L2 aumentan drásticamente la utilización de SM y el ancho de banda, respectivamente.
Para que la programación en GPU con más de 100 SM sea más eficiente, Hopper y Lovelace se agruparán cada dos bloques de subprocesos en un GPC en un clúster. El objetivo principal de los clústeres de bloques de subprocesos es mejorar los subprocesos múltiples y la utilización de SM. Estos clústeres se ejecutan simultáneamente en SM en un GPC.
OK, let's do a new summary.
RTX 4090, AD102-300, 16128FP32, 21Gbps 24G GDDR6X, 450W, ~2×3090.
I am disappointed with RDNA3.
That's all.— kopite7kimi (@kopite7kimi) May 16, 2022
Gracias a una red SM a SM entre los dos bloques de subprocesos en un clúster, los datos se pueden compartir de manera eficiente entre ellos. Esta va a ser una de las características clave que promueven la escalabilidad en Hopper y Lovelace, que es un requisito clave cuando se aumenta el número de núcleos/ALU en más del 50 %.
Por último, no olvidemos que la RTX 4090 no contará con el chip AD102 completo, sin embargo, ofrecerá el doble de rendimiento que su predecesor. El TGP eventualmente será solo de 450W, muy lejos de las abominaciones de 600-900W que se rumoreaban anteriormente. Es más probable que la RTX 4090 Ti, que puede lanzarse más adelante con el dado AD102 totalmente habilitado, venga con un TGP de 600 W.