Arquitectura
La nueva arquitectura Nvidia Ampere básicamente duplica el poder frente a Turing, ofreciendo el doble de núcleos FP32, 33% más caché L1 con el doble de ancho de banda, y los nuevos RT Cores de 2da. Generación que duplican el rendimiento frente a la 1ra. Generación presente en Turing y los nuevos Tensor Cores de 3ra. Generación que duplican el rendimiento frente a los de 2da. Generación presentes en Turing.
Si comparamos la GeForce RTX 3080 frente a la RTX 2080 Super, vemos que tiene 68SMs frente a 48SMs, los cuales permiten tener 8704 Cuda Cores frente a 3072 Cuda Cores y así elevar la capacidad de procesamiento en cálculos FP32 de 11 a 30 TFLOPs. Además, gracias a sus nuevos Tensor Cores, que son el doble de rápidos y tenemos mayor cantidad presentes, logra elevar la cantidad de TFLOPs para aprendizaje profundo de 89 a 238, ofreciendo 2.66 veces más rendimiento en este tipo de tareas.
Resumiendo, la RTX 3080 ofrece 30 FP32 TFLOPs gracias a sus Cuda Cores, 58 RT TFLOPs gracias a sus RT Cores de 2da. Generación, y 238 Tensor TFLOPs gracias a sus nuevos Tensor Cores de 3ra. Generación. Como comparación, una 2080 Super tiene 11 FP32 TFLOPs, 34 RT TFLOPs y 89 Tensor TFLOPs, habiendo una notable diferencia de rendimiento en todos los aspectos.
Otra novedad de Ampere es su fabricación bajo el proceso de 8nm de Samsung y su nuevo diseño que separa los voltajes de los núcleos gráficos y del sistema de memoria para reducir el consumo al poder reducir el voltaje en las partes menos utilizadas. Esto permite obtener una eficiencia energética hasta 90% superior frente a Turing si comparamos cuanto poder requiere Ampere y cuanto requiere Turing para llegar a 60FPS en Control.
También trae modificaciones en el I/O que le permiten ser la primera arquitectura en soportar HDMI 2.1 para transmitir contenido en 8K@60Hz o 4K@120Hz con un solo cable y la primera arquitectura en decodificar AV1 por hardware permitiendo decodificar videos en 8K@60FPS en tiempo real.