Investigadores de Apple y la Universidad Estatal de Ohio presentaron un nuevo avance en generación de lenguaje llamado FS-DFM, capaz de escribir texto hasta 128 veces más rápido que los modelos actuales.
Un modelo más veloz y eficiente
El modelo FS-DFM puede generar fragmentos de texto completos en solo ocho pasos de refinamiento, mientras que las soluciones tradicionales requieren más de mil pasos para obtener resultados similares. El secreto está en su nuevo enfoque de entrenamiento en tres etapas. En la primera, el modelo aprende a manejar diferentes tipos de iteraciones de refinamiento. En la segunda, un modelo guía llamado “instructor” ayuda a realizar ajustes más amplios y precisos en cada paso. Y finalmente, se optimiza cada iteración para lograr resultados coherentes en menos tiempo y con una mayor estabilidad.
Según los investigadores, esta metodología permite que el modelo mantenga la coherencia del texto sin sacrificar calidad ni naturalidad, incluso en tareas de escritura largas.
Mejores métricas que modelos más grandes
En las pruebas comparativas, FS-DFM superó a modelos mucho más pesados como Dream (7.000 millones de parámetros) y LLaDA (8.000 millones de parámetros). Incluso en sus versiones más pequeñas, de 1,7, 1,3 y 0,17 mil millones de parámetros, el modelo obtuvo una menor perplejidad (indicador de calidad textual) y una entropía más estable (grado de confianza del modelo al elegir cada palabra).
Esto significa que los textos generados son más naturales, precisos y consistentes, evitando tanto la repetición como la aleatoriedad excesiva.
Un avance para la comunidad científica
El equipo de desarrollo adelantó que publicará el código y los puntos de control del modelo, con el objetivo de facilitar la reproducibilidad y fomentar la investigación futura.
Este nuevo enfoque podría marcar un cambio importante en la forma en que los modelos de lenguaje de difusión generan texto, reduciendo drásticamente el tiempo de procesamiento y ampliando su uso en asistentes de IA, redacción automática y generación de contenido a gran escala.






