El verdadero peligro de darle "manos" a la IA
Hasta ahora, en nuestra serie de investigaciones, hemos atacado a modelos de lenguaje interactuando directamente con ellos a través de un chat. Pero las cosas e…
root@portfolio:~$
Artículos y write-ups organizados por categorías de AI Red Team.
Hasta ahora, en nuestra serie de investigaciones, hemos atacado a modelos de lenguaje interactuando directamente con ellos a través de un chat. Pero las cosas e…
Hasta ahora, cuando hablamos de hackear un Modelo de Lenguaje (LLM), todos pensamos en un atacante tecleando comandos en una ventana de chat para confundir a la…
En el artículo anterior estrenamos el laboratorio de AI Red Teaming superando un reto básico de ingeniería social. Sin embargo, en el mundo corporativo real, lo…
Siempre he tenido claro que para mejorar específicamente en AI Red Teaming no bastaba con leer teoría. Necesito enfrentarme a distintos modelos, distintas defen…
Imaginemos una tienda online ficticia que, cansada de gestionar miles de devoluciones manualmente, decide implementar un Agente de IA para automatizar el proces…
Cuando interactuamos con un asistente de Inteligencia Artificial, solemos tener la falsa sensación de que estamos en un entorno cerrado. Creemos que lo peor que…
La industria de la Inteligencia Artificial está evolucionando rápidamente. Ya no solo usamos LLMs para chatear o resumir textos; ahora los integramos como "Agen…
Existe la creencia de que las instrucciones internas de una IA (el System Prompt) son completamente inaccesibles para el usuario. Muchas empresas confían en ell…
Si vienes del mundo del pentesting web, el concepto de "no confiar en el input del usuario" es el mandamiento número uno. En la seguridad web clásica, si un usu…
La implementación de Agentes de IA en el comercio electrónico crece exponencialmente. Muchas de ellas confían ciegamente en el "System Prompt" (las instruccione…
<p>Tras un tiempo profundizando en la ciberseguridad ofensiva, es imposible ignorar la realidad: la Inteligencia Artificial se está integrando en casi todos los…