OpenAI blinda ChatGPT Atlas y refuerza su seguridad frente a ataques avanzados

26 de Diciembre de 2025

La compañía anunció nuevas medidas para proteger el modo agente del navegador con IA y reducir riesgos asociados a la inyección de prompts

Radio Viva Fenix

OpenAI dio a conocer nuevas acciones para fortalecer la seguridad de ChatGPT Atlas, su navegador web impulsado por inteligencia artificial, una herramienta que aún se encuentra en desarrollo pero que ya plantea retos importantes en materia de ciberseguridad. La compañía busca cerrar brechas críticas antes de que el producto alcance una adopción masiva.

Uno de los principales focos de atención es el modo agente, una función que permite a la IA navegar por internet y ejecutar tareas de forma autónoma. Precisamente esta capacidad, considerada uno de los mayores atractivos del sistema, también se ha convertido en su mayor punto de vulnerabilidad frente a ataques maliciosos.

La amenaza más relevante identificada por OpenAI es la llamada inyección de prompts, una técnica que consiste en ocultar instrucciones maliciosas dentro de textos, correos o páginas web para engañar a la inteligencia artificial y llevarla a ejecutar acciones no deseadas, muchas veces sin que el usuario lo note.

Aunque este tipo de ataque no es nuevo en el ecosistema de la IA generativa, su adaptación a navegadores con funciones autónomas ha elevado el nivel de riesgo. En el caso de ChatGPT Atlas, la capacidad de actuar sin intervención constante del usuario abre la puerta a fraudes, accesos indebidos o envío de información sensible.

Radio Viva Fenix

Para enfrentar este problema, OpenAI desarrolló un sistema interno al que denomina un “atacante automatizado basado en modelos de lenguaje”. Se trata de un bot entrenado mediante aprendizaje por refuerzo, diseñado para crear, probar y perfeccionar ataques simulados contra el modo agente, con el fin de identificar fallas antes de que puedan ser explotadas en escenarios reales.

Según la compañía, este enfoque permite anticiparse a los ciberdelincuentes, ya que el sistema aprende de cada intento fallido y ajusta sus estrategias, ayudando a fortalecer las defensas del navegador. Un ejemplo presentado por OpenAI muestra cómo, tras la actualización, ChatGPT Atlas logra detectar instrucciones maliciosas ocultas en un correo electrónico y alerta al usuario en lugar de ejecutar la acción.

Desde OpenAI aclaran que estas medidas representan apenas un primer paso. Las técnicas de ataque continúan evolucionando y requieren mejoras constantes. Mientras tanto, la empresa recomienda a los usuarios emplear el modo agente con precaución, evitar iniciar sesión en sitios sensibles y revisar cuidadosamente las solicitudes de confirmación, como parte de una estrategia preventiva para reducir riesgos.



Foto: Hipertextual

NOTICIAS RELEVANTES

Reelegidos los directivos de la Junta de la Cámara de Comercio de Bogotá

24 de Enero de 2026

La Junta Directiva de la Cámara de Comercio de Bogotá (CCB) ratificó en sesión ordinaria a...

Seguir leyendo →

TikTok redefine su futuro en EE. UU. tras acuerdo con Oracle y un grupo de inversores

24 de Enero de 2026

TikTok en Estados Unidos llevaba varios años enfrentando un escenario de incertidumbre, marcado...

Seguir leyendo →

Quinto tren del Metro de Bogotá ya está en la ciudad y avanzará a fase de pruebas

24 de Enero de 2026

La Empresa Metro de Bogotá confirmó que el quinto tren destinado a la Línea 1 del sistema de...

Seguir leyendo →
Radio Viva Fenix



VIVO
VIVO
VIVO
VIVO
VIVO
VIVO
VIVO