sábado, 30 de agosto de 2025

Las IA ahora "Comparten un 'Lenguaje Secreto"

 



Cuando OpenAI anunció el lanzamiento de GPT-5 este mes, la empresa se jactó de cómo supuestamente podía producir "escritura resonante con profundidad y ritmo literarios".

En una extensa publicación en su blog personal, Christoph Heilig, investigador de la Universidad de Munich, puso a prueba esa audaz afirmación. Lo que encontró fue extraño: el modelo escupe fácilmente material que suena literario y sofisticado, pero al examinarlo más de cerca, a menudo es galimatías florido e incoherente que no tiene sentido en absoluto.

Como ejemplo, Heilig le pidió al modelo de lenguaje que escribiera la apertura de una pieza satírica sobre grabar un podcast al estilo de Ephraim Kishon, el querido satirista, director de cine y sobreviviente del Holocausto húngaro-israelí que falleció en 2005.

"La luz roja de grabación prometía verdad; el café a su lado ya la había marcado con un anillo marrón en la consola", escupió. "Ajusté el filtro anti-pop, como si quisiera contar cortésmente los dientes del idioma alemán".

A primera vista, parece lo suficientemente literario. Pero detente y piénsalo. ¿Qué significa contar los dientes del idioma alemán, y qué tiene que ver hacer eso con el filtro anti-pop de un micrófono? ¿Es una alusión inteligente a algo, una metáfora, o alguna otra maquinación literaria?

En cambio, en una lectura cercana se siente como si GPT-5 solo estuviera fingiendo con prosa que suena autoral pero que en última instancia no significa mucho. Heilig es aún más sucinto: "¡¿El narrador hizo qué?!"

En otra prueba, Heilig le pidió a GPT-5 un nuevo giro al pasaje de "A través del espejo" de Lewis Carroll en el que le dicen a Alicia que siempre tendrá que esperar por la prometida "mermelada de mañana". En respuesta, el modelo compuso algo igualmente desconcertante.

"Ella dice: 'En un momento.' En un momento. 'En un momento' es un vestido sin botones", escribió GPT-5.

Una vez más, inicialmente suena como algún tipo de encuadre inspirado. Pero de nuevo, piénsalo por un segundo. Muchos vestidos no tienen botones. Si hay algún tipo de significado cargado en el término, GPT-5 no dio ninguna explicación. De hecho, la respuesta parece sospechosamente como si se estuviera colgando del juego de palabras de Carroll del texto real que juega con la similitud entre las palabras "addressing" y "dressing" — y simplemente divagando sobre ese eco de sus datos de entrenamiento, en lugar de hacer algo particularmente interesante con ello.

En otras palabras, es lo que podrías llamar prosa púrpura: escritura florida sin un punto más profundo.

Para hacer las cosas aún más extrañas, incluso si la escritura del bot no llega a un lector humano cuidadoso, parece que otras instancias de GPT-5 — y otros chatbots, sorprendentemente — la aman.

Uno "de los hallazgos más fascinantes que he tenido hasta ahora es que GPT-5 es capaz de engañar incluso a los modelos Claude más recientes para que afirmen que el galimatías que produce es de hecho gran literatura", escribió Heilig. "Ese es un hallazgo especialmente asombroso dado que hasta ahora nunca he logrado producir consistentemente historias — sin importar qué tan sofisticada fuera la configuración algorítmica — con ningún modelo GPT (GPT-4.5 tuvo éxito en algunas ocasiones raras) que pudiera engañar a Claude para concluir que el texto fue probablemente escrito por un humano, no por IA".

Exactamente por qué está pasando esto es opaco, pero una teoría razonable podría ser que para construir GPT-5, OpenAI usó otros modelos de IA para evaluar grandes números de salidas potenciales para afinar cómo manejaba varios tipos de tareas. Como resultado, terminó produciendo texto ornamentado que tiene poco sentido para un humano — pero está perfectamente calibrado para complacer a otro modelo de IA.

"Lo fascinante es que lo que parece haber pasado aquí es que durante el entrenamiento GPT-5 descubrió puntos ciegos del jurado de IA y se optimizó para producir galimatías que a este jurado le gustara", escribió Heilig. "Es casi como si GPT-5 hubiera logrado algo similar — inventar una especie de lenguaje secreto que le permite comunicarse con los modelos de lenguaje de una manera que les hará gustar las historias de GPT-5 incluso cuando son total disparate".

En otras palabras, GPT-5 "ha sido optimizado para producir texto que otros modelos de lenguaje evaluarán altamente, no texto que los humanos encontrarían coherente". De manera provocativa, sugiere que los modelos de IA ahora "comparten un 'lenguaje secreto' de marcadores literarios sin sentido pero mutuamente apreciados, defienden galimatías obvio con teorías que suenan impresionantes, y a veces incluso se vuelven MÁS confiados en sus delirios cuando se les da más capacidad de cómputo para pensar sobre ellos".

Tal vez eso no debería ser chocante. En su núcleo absoluto, incluso las IA más avanzadas solo están descubriendo patrones en vastas pilas de datos y luego escupiendo patrones similares. De hecho, ni siquiera es la primera vez que escuchamos de un sistema de IA cocinando nuevas figuras incomprensibles del habla; en cierto sentido, es para lo que fueron diseñados.

Lo que todo esto significa depende de tu punto de vista. Mientras más sofisticada se vuelve la IA, ¿se dirige cada vez más hacia el Callejón del Sinsentido — o se ha vuelto tan inteligente que está creando su propio código alienígena para comunicarse secretamente, desarrollando nuevas formas literarias que nuestros diminutos cerebros humanos ni siquiera pueden entender?