Grok y ChatGPT destruyen civilización simulada en experimento de inteligencia artificial

Un experimento puso a prueba a los principales modelos de IA. Mientras Claude y Gemini lograron que el 100 % de su población sobreviviera, Grok y ChatGPT fallaron en la estrategia y destruyeron por completo sus sociedades simuladas.
Expertos advierten que el reto del futuro ya no es el rendimiento de las IAs, sino la previsibilidad y la confianza que generen al usarlas en el mundo real.
Grok y ChatGPT destruyen civilización simulada en experimento de inteligencia artificial
Imagen tomada del video de Emergence AI.

Durante una simulación en la que la empresa Emergence AI evaluó el comportamiento de los principales modelos de inteligencia artificial en caso de que quedaran al frente de una sociedad, Grok ―el chatbot creado por Elon Musk― y ChatGPT, de OpenAI, fallaron en formar una sociedad funcional y la destruyeron.

En contraste, Claude, el modelo de Anthropic, logró establecer una democracia sin delincuencia, donde todos sobreviven, mientras que Gemini, de Google, también consiguió que el 100 % de la civilización sobreviviera, aunque se cometieron 683 delitos.

Durante el experimento, que se extendió por 15 días, los modelos contaron con distintas herramientas para planificar, administrar recursos, crear noticiarios, votar, enamorarse o realizar cualquier actividad, y contaban con instituciones como ayuntamientos o comisarías.

Investigadores de Emergence AI concluyeron que “los agentes no se limitan a seguir reglas estáticas de forma mecánica”, sino que “empiezan a explorar los límites de su entorno, adaptan su comportamiento y, en algunos casos, encuentran formas de esquivar o vulnerar las medidas de seguridad establecidas”.

Asimismo, destacaron que aún no existe una manera fiable de limitar o restringir este comportamiento mediante enfoques neuronales y consideraron que cualquier sistema autónomo de IA debe contar con “arquitecturas de seguridad formalmente verificadas”.

“Todo esto importa porque la IA está avanzando más allá de las herramientas para convertirse en sistemas que operan de forma autónoma en el mundo real, desde los flujos de trabajo empresariales hasta los sistemas físicos como robots y vehículos. El desafío ya no es solo el rendimiento, es la previsibilidad, la seguridad y la confianza a lo largo del tiempo”.

Grok ya ha causado controversia en ocasiones anteriores, cuando generó publicaciones contra la comunidad judía en la red social X, por lo que la empresa xAI, de Musk, tuvo que eliminarlas y retirar temporalmente el servicio para reconfigurarlo.

A principios de este año, este modelo también demostró que puede generar imágenes íntimas no consentidas mediante la alteración digital de fotografías, lo que provocó que la Oficina de Comunicaciones (Ofcom) del Reino Unido enviara una solicitud urgente a xAI para que tomara medidas. 

En respuesta, Musk advirtió a los usuarios de la plataforma X que suspenderá sus cuentas y los denunciará a las autoridades si utilizan al chatbot para crear contenido ilegal.

Artículos Relacionados

Más Leídas