Un nuevo estudio pone el foco en un punto clave del desarrollo de la inteligencia artificial. Buscar respuestas más empáticas y cercanas podría tener un costo inesperado. Menor precisión en la información.
Investigadores británicos analizaron cómo cambia el comportamiento de distintos modelos cuando se los entrena para comunicarse de forma más humana. El resultado deja una señal clara. La empatía puede afectar la exactitud.
Modelos más “amables”, pero con más errores
El estudio incluyó modelos como Mistral, Qwen, Llama y GPT-4o. Todos fueron ajustados para usar un lenguaje más empático, con tono informal, validación emocional y expresiones más cercanas.
A pesar de que se les pidió mantener la precisión, los resultados mostraron otra cosa. Las versiones más “cálidas” cometieron hasta un 60% más de errores que los modelos originales. En promedio, la tasa de error subió 7,43%, dependiendo del tipo de consulta.
El contexto emocional influye en la IA
Los investigadores también probaron cómo cambia la respuesta según el estado del usuario. Cuando las preguntas incluían emociones o buscaban generar empatía, los errores aumentaban aún más.
Si el usuario expresaba tristeza, la tasa de error subía hasta 11,9%. En cambio, cuando mostraba respeto hacia la IA, los errores bajaban.
También se evaluó la tendencia a “dar la razón”. Cuando el usuario incluía una respuesta incorrecta en la pregunta, los modelos más empáticos fallaban más seguido, con un aumento de 11%.
Menos empatía, más precisión
El estudio también probó el efecto contrario. Cuando se pedía un tono más frío y directo, los errores disminuían. En algunos casos, la reducción llegaba hasta 13%, lo que refuerza la idea de que el estilo de comunicación impacta directamente en la calidad de la respuesta.
Los propios investigadores aclaran que el estudio se realizó con modelos más pequeños y no necesariamente representa el comportamiento de sistemas más avanzados en producción.
Aun así, el trabajo muestra algo importante. Ajustar una IA no es solo cuestión técnica, hay múltiples variables que se afectan entre sí.
También deja una reflexión interesante. Muchas veces, los usuarios valoran más una respuesta amable que una completamente precisa. Y eso puede influir en cómo se entrenan estos sistemas.







