En el GTC de China, NVIDIA dio a conocer hoy las últimas incorporaciones a su plataforma de aprendizaje profundo basadas en la arquitectura Pascal, la nueva NVIDIA Tesla P4 y P40 y un nuevo software que ofrece saltos masivos en la eficiencia y la velocidad, para acelerar la inferencia de las cargas de trabajo de producción en la inteligencia artificial.
Servicios de IA modernos tales como la asistencia por voz, filtros de spam para correo electrónico, y motores de búsqueda, están creciendo rápidamente en complejidad, que requieren hasta 10 veces más de potencia de cómputo. La tecnología actual basado en CPU no es capaz de ofrecer la capacidad de respuesta en tiempo real necesaria para los servicios modernos de IA, lo que lleva a una mala experiencia del usuario.
La nueva Tesla P4 tiene un consumo de solo 50W para ser 40 veces más eficiente en su trabajo que una CPU, un servidor con una sola de estas tarjetas puede reemplazar hasta 13 servidores basados en CPU para tareas de inferencia de vídeo, lo que supone un ahorro de 8 veces en los costes totales.
La Tesla P40 ofrece el máximo rendimiento en escenarios de aprendizaje profundo, un servidor con ocho de estas tarjetas es capaz de reemplazar hasta 140 servidores basados en CPU, lo que se traduce en un ahorro de más de 650.000$ dolares.
El nuevo Software llamado TensorRT es una librería creada para optimizar los modelos de aprendizaje profundo con la finalidad de ofrecer respuesta inmediata en las situaciones de las redes más complejas.
También esta DeepStream SDK que ofrece la potencia de todo un servidor para simultáneamente decodificar y analizar hasta 93 streams de vídeo HD en tiempo real, un gran avance frente a los 7 streams que puede procesar un servidor con dos CPUs.
Tesla P40 y P4