
La compañía anunció nuevas medidas para proteger el modo agente del navegador con IA y reducir riesgos asociados a la inyección de prompts
OpenAI dio a conocer nuevas acciones para fortalecer la seguridad de ChatGPT Atlas, su navegador web impulsado por inteligencia artificial, una herramienta que aún se encuentra en desarrollo pero que ya plantea retos importantes en materia de ciberseguridad. La compañía busca cerrar brechas críticas antes de que el producto alcance una adopción masiva.
Uno de los principales focos de atención es el modo agente, una función que permite a la IA navegar por internet y ejecutar tareas de forma autónoma. Precisamente esta capacidad, considerada uno de los mayores atractivos del sistema, también se ha convertido en su mayor punto de vulnerabilidad frente a ataques maliciosos.
La amenaza más relevante identificada por OpenAI es la llamada inyección de prompts, una técnica que consiste en ocultar instrucciones maliciosas dentro de textos, correos o páginas web para engañar a la inteligencia artificial y llevarla a ejecutar acciones no deseadas, muchas veces sin que el usuario lo note.
Aunque este tipo de ataque no es nuevo en el ecosistema de la IA generativa, su adaptación a navegadores con funciones autónomas ha elevado el nivel de riesgo. En el caso de ChatGPT Atlas, la capacidad de actuar sin intervención constante del usuario abre la puerta a fraudes, accesos indebidos o envío de información sensible.
Para enfrentar este problema, OpenAI desarrolló un sistema interno al que denomina un “atacante automatizado basado en modelos de lenguaje”. Se trata de un bot entrenado mediante aprendizaje por refuerzo, diseñado para crear, probar y perfeccionar ataques simulados contra el modo agente, con el fin de identificar fallas antes de que puedan ser explotadas en escenarios reales.
Según la compañía, este enfoque permite anticiparse a los ciberdelincuentes, ya que el sistema aprende de cada intento fallido y ajusta sus estrategias, ayudando a fortalecer las defensas del navegador. Un ejemplo presentado por OpenAI muestra cómo, tras la actualización, ChatGPT Atlas logra detectar instrucciones maliciosas ocultas en un correo electrónico y alerta al usuario en lugar de ejecutar la acción.
Desde OpenAI aclaran que estas medidas representan apenas un primer paso. Las técnicas de ataque continúan evolucionando y requieren mejoras constantes. Mientras tanto, la empresa recomienda a los usuarios emplear el modo agente con precaución, evitar iniciar sesión en sitios sensibles y revisar cuidadosamente las solicitudes de confirmación, como parte de una estrategia preventiva para reducir riesgos.
Foto: Hipertextual
La Junta Directiva de la Cámara de Comercio de Bogotá (CCB) ratificó en sesión ordinaria a...
Seguir leyendo →TikTok en Estados Unidos llevaba varios años enfrentando un escenario de incertidumbre, marcado...
Seguir leyendo →La Empresa Metro de Bogotá confirmó que el quinto tren destinado a la Línea 1 del sistema de...
Seguir leyendo →