Estableciendo un nuevo hito en las industrias de la inteligencia artificial, NVIDIA ha anunciado recientemente la disponibilidad de CUDA 9. La noticia fue compartida en el GTC 2017 de China, y este lanzamiento probablemente será la punta de lanza que dara soporte para nuevas arquitecturas. Vale la pena señalar que CUDA 9 ha estado disponible en forma BETA por un tiempo. Sin embargo, esta es la primera vez que hemos podido ver a la empresa hablar de CUDA 9.
Aparte de las nuevas arquitecturas, y las bibliotecas optimizadas para nuevas aplicaciones estarán disponibles en breve.
Según el sitio web de desarrolladores de NVIDIA, los principales aspectos destacados de la nueva plataforma son los siguientes:
- Aceleración en la computación de alto rendimiento (HPC) y aplicaciones de aprendizaje profundo con nuevos núcleos GEMM en cuBLAS.
- Aplicaciones de procesamiento de imagen y señales más rápidas con optimizaciones de rendimiento en múltiples configuraciones de GPU en cuFFT y NVIDIA Performance Primitives.
- Resolver problemas de análisis lineal y gráfico comunes en HPC con nuevos algoritmos en cuSOLVER y nvGRAPH.
- Interpretación de algoritmos paralelos ricos con subprocesos de hilos, bloques y rejillas.
- Administrar y reutilizar los hilos de forma eficiente dentro de una aplicación con nuevas API.
- Se optimiza el acceso a la memoria, identificando el código fuente.
- Inspecciones en los cuellos de botella en el rendimiento de la memoria con nuevos filtros de eventos basados en la dirección virtual, motivo de migración y el tipo de acceso.
Además, también se incluyen varios elementos de soporte de Volta y NVLink:
- Se Reemplaza la programación de sincronización de urdimbre con un modelo de programación más robusto en la arquitectura Kepler y más nueva.
- Se ejecutan las aplicaciones de IA más rápida con los núcleos tensor, hasta 5X más rápido que las GPU Pascal.
- Escala de aplicaciones multi-GPU con la próxima generación de NVLink que ofrece un rendimiento 2X con la generación anterior.
- Aumentar la utilización de la GPU con Volta Multi-Process Service (MPS).
- Perfil de uso de PCIe analizando el ancho de banda de transferencias de memoria, latencia y comparación con NVLink.