Los procesadores EPYC están siendo un total éxito para AMD gracias a su enorme cantidad de núcleos, soporte a 8 canales de memoria RAM, y un impresionante I/O con hasta 128 líneas PCI-Express 4.0, y la última empresa en adoptarlos fue Netflix, quien los eligió gracias a su capacidad para transmitir hasta 400Gb/s de video por sistema, algo que no pudo lograr con ninguna alternativa de la competencia.
Los detalles sobre estos nuevos servidores llegan de la mano del Ingeniero de Software Senior de Netflix Drew Gallatin, quien reveló durante el evento EuroBSD 2021 el proceso de elección de componentes y configuración de software para alcanzar este flujo de datos de 400Gb/s, y la lista de componentes finales que terminaron implementando en cada sistema para lograr esta increíble cifra.
Según reveló Gallatin, luego de un largo proceso de elección de componentes, desde la compañía eligieron alimentar cada sistema con un procesador AMD EPYC 7502p de 32 núcleos y 64 hilos con arquitectura Zen 3, 256GB de memoria DDR4 a 3200MHz, 18 SSDs M.2 PCI-E 3.0 para datacenters Western Digital SN720, y dos adaptadores de red Nvidia Mellanox ConnectX-6 Dx con conectividad PCI-E 4.0 x16, los cuales cuentan con soporte a dos conexiones de 100Gb/s cada uno, para un total de 400Gb/s entre los dos adaptadores.
Teniendo el hardware listo, el problema ahora era la configuración del software y la BIOS, ya que por defecto este sistema solo alcanza un ancho de banda máximo de 240Gb/s. El primer paso fue jugar con las configuraciones de NUMA (Arquitectura de Memoria No Uniforme), ya que sin esta tecnología el bus Infinity Fabric se saturaba y hacía un cuello de botella que limitaba el ancho de banda máximo, por lo que el sistema se configuró para utilizar cuatro nodos NUMA, lo cual básicamente separa los DIEs en cuatro grupos y cada grupo solo accede a la memoria controlada por estos DIEs para evitar tener que pasar por el Infinity Fabric, evitando el cuello de botella cuando todos los DIEs piden pasar por el Infinity Fabric de manera constante. Este cambio permitió elevar el ancho de banda a 280Gb/s, lo cual es una mejora, aunque aún no está ni siquiera cerca de los 400Gb/s que buscaba alcanzar la compañía, por lo que la aventura no termina.
Luego de estudiar cual era la limitación que evitaba que se superen los 280Gb/s, los ingenieros de Netflix notaron que la mayoría del uso de CPU era para encriptaciones TLS, función que pueden realizar las placas de red Melanox utilizadas por este sistema, por lo que derivaron dicha funcionalidad a las placas de red, y ahí vino la magia. Con este cambio, se logró alcanzar un flujo de datos de 380Gb/s, acercándose cada vez más a la meta de los 400Gb/s, la cual alcanzaron luego de lograr realizar distintos ajustes en software y BIOS que no detallaron, alcanzando el límite máximo de sus placas de red y por lo tanto el límite del sistema.
Teniendo listos estos sistemas capaces de alcanzar un flujo de datos de 400Gb/s, la meta de Netflix ahora está en alcanzar los 800Gb/s por sistema, aunque no recibieron los componentes necesarios a tiempo para la conferencia EuroBSD 2021, por lo que todavía no pudieron realizar pruebas y por lo tanto tampoco pueden contarnos sus resultados. Será interesante ver como logran alcanzar esta enorme meta de 800Gb/s por sistema, ya que las complicaciones para alcanzar los 400Gb/s fueron varias, y por lo tanto duplicar este flujo de datos no será una tarea fácil.
¿Qué opinan sobre estos increíbles servidores de Netflix basados en AMD EPYC? ¿Creen que lograrán alcanzar pronto la cifra de 800Gb/s en sus nuevos servidores?
Fuente: TechSpot