Durante una sesión de preguntas y respuestas en Reddit, los empleados de NVIDIA respondieron algunas de las preguntas más relevantes en la comunidad de subreddit. Entre los tópicos con mayor mención se encuentra RTX IO, DLSS 2.1, PCIe 4.0, RTX 3070 y más.
La empresa proporcionó algunas respuestas mediante los administradores de la comunidad de NVIDIA, aunque esperamos obtener aún más detalles después de las conferencias de prensa previstas para esta semana y después del lanzamiento oficial de la primera tarjeta Ampere (17 de septiembre).
Especificaciones de HDMI 2.1
La arquitectura NVIDIA Ampere admite la velocidad de enlace HDMI 2.1 más alta de 12 Gbs /carril en los 4 carriles, y también admite Display Stream Compression (DSC) para poder alimentar hasta 8K, 60Hz en HDR.
Requisitos de SDD para Ampere
No hay un requisito de velocidad SSD para RTX IO, pero obviamente, SSD más rápidos como la última generación de SSD Gen4 NVMe producirán mejores resultados, lo que resulta en tiempos de carga más rápidos y la capacidad de los juegos para transmitir más datos dinámicamente. Algunos juegos pueden tener requisitos mínimos en cuanto a los SSD en el futuro, pero los desarrolladores lo determinarán.
RTX IO acelerará el rendimiento del SSD independientemente de lo rápido que sea, al reducir la carga de CPU y al habilitar la descompresión basada en la GPU, permitiendo que los assets del juego se almacenen en un formato comprimido y descargando potencialmente docenas de núcleos de la CPU de hacer ese trabajo. Las relaciones de compresión suelen ser de 2:1, por lo que amplificarían de manera efectiva el rendimiento de lectura de cualquier SSD en 2x.
RTX IO
RTX IO permite leer datos de SSD a una velocidad mucho mayor que los métodos tradicionales, y permite que los datos sean almacenados y leídos en un formato comprimido por la GPU, para la descompresión y uso por la GPU. No permite que el SSD reemplace la tasa de memoria del búfer, pero permite que los datos del SSD lleguen a la GPU y a la memoria de la GPU mucho más rápido, con mucha menos sobrecarga de la CPU.
RTX IO y DirectStorage requerirán aplicaciones que admitan estas características mediante la incorporación de nuevas API. Microsoft tiene como objetivo una versión preliminar para desarrolladores de DirectStorage y para desarrolladores de juegos el próximo año. Los jugadores que utilicen NVIDIA RTX podrán aprovechar los juegos mejorados con RTX IO tan pronto como estén disponibles.
NVIDIA Ampere Streaming Multiprocessor
Uno de los objetivos de diseño clave de Ampere era lograr el doble de rendimiento para las operaciones FP32 en comparación con Turing. Para lograr este objetivo, Ampere incluye nuevos diseños de rutas de datos para las operaciones FP32 e INT32. Una ruta de datos en cada partición consta de 16 núcleos CUDA FP32 capaces de ejecutar 16 operaciones FP32 por reloj.
Otra ruta de datos consta de 16 núcleos CUDA FP32 y 16 núcleos INT32. Como resultado de este nuevo diseño, cada partición Ampere es capaz de ejecutar 32 operaciones FP32 por reloj o 16 operaciones FP32 y 16 INT32 por reloj. Las cuatro particiones de streaming multiprocessor combinadas pueden ejecutar 128 operaciones FP32 por reloj, que es el doble de la frecuencia FP32 de Turing, o 64 operaciones FP32 y 64 INT32 por reloj.
PCIe 3.0 vs PCIe 4.0
Acerca de una pregunta que consultaba sobre si se producirá un cuello de botella por utilizar PCIe 3.0 con las nuevas gráficas, NVIDIA contestó lo siguiente:
El rendimiento del sistema se ve afectado por muchos factores y el impacto varía entre aplicaciones. El impacto suele ser pequeño al pasar de un PCIE 4.0 x16 a un PCIE 3.0 x16. La selección de CPU a menudo tiene un mayor impacto en el rendimiento. Esperamos nuevas plataformas que puedan aprovechar al máximo las capacidades de Gen4 para posibles aumentos de rendimiento.
GeForce RTX 3070
Un usuario consultó si la afirmación de que la RTX 3070 es más rápida que la 2080 Ti se refiere a la rasterización tradicional o a las cargas de trabajo DLSS / Ray Tracing. La empresa brindó la siguiente información:
Estamos hablando de ambos. Juegos que solo admiten la rasterización tradicional y juegos que admiten RTX (RT + DLSS). Pueden ver esto en nuestro artículo de lanzamiento acá.
DLSS 2.1
DLSS 2.1 incluye tres actualizaciones:
- Nuevo modo de ultra rendimiento para juegos de 8K. Ofrece juegos en 8K en GeForce RTX 3090 con una nueva opción de escala de 9x.
- Soporte de realidad virtual. DLSS ahora es compatible con títulos de realidad virtual.
- Soporte de resolución dinámica. El búfer de entrada puede cambiar las dimensiones de un frame a otro mientras el tamaño de salida permanece fijo. Si el motor de renderizado admite la resolución dinámica, DLSS se puede utilizar para realizar la re-escala a la resolución de pantalla requerida.
¿Qué otras cosas les gustaría conocer de las nuevas GeForce RTX 30 de NVIDIA?
Fuente: VideoCardz