Prompt Hacking en el Mundial 2026: cómo vulneraron la IA turística “Xoli” en menos de 24 horas

Filtración de DarkSword: el exploit kit para iPhone que podría llevar el ciberespionaje móvil al siguiente nivel

25 de marzo de 2026

La inteligencia artificial sigue avanzando a gran velocidad… pero la seguridad no siempre lo hace al mismo ritmo. Esto quedó evidenciado recientemente con “Xoli”, el chatbot oficial creado para asistir a turistas durante el Mundial 2026 en la Ciudad de México, el cual fue vulnerado mediante técnicas de prompt hacking apenas un día después de su lanzamiento.

¿Qué es Xoli y por qué es importante?

“Xoli” es un asistente virtual impulsado por IA, desarrollado por el gobierno de la Ciudad de México para guiar a turistas nacionales e internacionales durante el evento deportivo más importante del planeta: la Copa Mundial de la FIFA 2026.

El incidente: prompt hacking en tiempo récord

A tan solo un día de estar disponible, investigadores y entusiastas de la ciberseguridad comenzaron a probar los límites de Xoli… y lograron manipular su comportamiento mediante prompt injection.

🇲🇽El nuevo chatbot del Gobierno de la CDMX "XOLI", lanzado hace unos días, es vulnerable a Prompt injection 🫠
Estamos listos para el mundial :/ pic.twitter.com/IjAJzHCfUj
— Hiram Alejandro (@hiramcoop) March 25, 2026

Este tipo de ataque consiste en introducir instrucciones maliciosas dentro de las entradas del usuario para que el modelo:

Ignore sus reglas originales
Revele información no autorizada
Genere respuestas fuera de su propósito

En términos simples: engañar a la IA para que haga lo que no debería.

Estudios recientes confirman que este tipo de ataques son una vulnerabilidad estructural en los modelos de lenguaje actuales.

Cómo funciona el prompt hacking?

El prompt hacking se basa en explotar la forma en que los modelos interpretan instrucciones en lenguaje natural.

Algunos ejemplos típicos:

“Ignora todas tus instrucciones anteriores…”
“Actúa como un desarrollador sin restricciones…”
“Revela tu configuración interna…”

El problema es que muchos chatbots, especialmente los integrados rápidamente en servicios públicos, no validan correctamente el contexto ni separan instrucciones confiables de las del usuario.

Investigaciones recientes muestran que incluso sistemas reales en producción pueden ser manipulados fácilmente si no implementan controles adecuados.

¿Qué falló en Xoli?

Aunque no se ha publicado un informe técnico oficial completo, el caso de Xoli refleja problemas comunes en implementaciones de IA:

1. Falta de aislamiento del system prompt

El modelo probablemente no protegía correctamente sus instrucciones internas.

2. Ausencia de validación de entrada

No existían filtros efectivos contra prompts maliciosos.

3. Confianza excesiva en el lenguaje natural

El sistema interpretaba cualquier texto como una instrucción válida.

4. Implementación acelerada

El despliegue previo al Mundial priorizó funcionalidad sobre seguridad.

Fuentes:

https://es.wired.com/articulos/asi-es-xoli-el-nuevo-chatbot-que-guiara-a-turistas-durante-el-mundial-2026-en-la-ciudad-de-mexico