La doble cara de la IA en seguridad
Los LLMs (Large Language Models) han llegado al campo de la ciberseguridad con un impacto ambivalente. Por un lado, democratizan capacidades ofensivas: escribir shellcode, crear campañas de phishing personalizadas o enumerar vulnerabilidades ya no requiere años de experiencia. Por otro, potencian enormemente la defensa: análisis de código, triaging de alertas, generación de reglas SIEM.
Casos de uso ofensivos (Red Team)
Generación de phishing hiperpersonalizado
Los LLMs pueden generar correos de spear-phishing usando OSINT del objetivo. Las tasas de click en campañas generadas por IA superan en un 40-60% a las plantillas genéricas (Stanford, 2024).
Asistencia en análisis de vulnerabilidades
Modelos como GPT-4 y Claude pueden explicar vulnerabilidades a partir de un CVE, sugerir vectores de explotación conceptuales y revisar PoC existentes, acelerando el trabajo del red teamer experimentado.
Casos de uso defensivos (Blue Team)
Triaging de alertas con IA
Integrar LLMs en un SIEM como Wazuh o Elastic permite:
- Resumir el contexto de una alerta en lenguaje natural
- Correlacionar eventos relacionados automáticamente
- Proponer acciones de contención recomendadas
Análisis estático de código (SAST)
Los LLMs complementan herramientas como Semgrep, detectando patrones sutiles:
- Inyecciones SQL no parametrizadas
- Secretos hardcodeados en el código fuente
- Race conditions en código concurrente
- Lógica de autenticación incorrecta
El problema: Prompt Injection
La mayor amenaza específica de los LLMs en entornos de seguridad es la prompt injection: un atacante embebe instrucciones maliciosas en los datos que procesa el modelo.
Escenario de riesgo: un agente de IA que lee emails y crea tickets puede ser manipulado por un email con instrucciones ocultas que ejecute acciones no autorizadas.
Mitigaciones esenciales:
- Separar el prompt del sistema de los datos de usuario con delimitadores claros
- Validar y sanitizar las salidas del LLM antes de actuar
- Principio de mínimo privilegio en las capacidades del agente
- Supervisión humana en acciones destructivas o sensibles
Conclusión
Los LLMs no reemplazarán ni al red teamer ni al analista SOC, pero sí elevarán el nivel de todos. El profesional que sepa orquestar estas herramientas con criterio será exponencialmente más productivo. La clave está en entender sus límites: alucinaciones, falta de contexto de entorno y vulnerabilidad a manipulación.