Radio viva Fenix | OpenAI blinda ChatGPT Atlas y refuerza su seguridad frente a ataques avanzados

OpenAI blinda ChatGPT Atlas y refuerza su seguridad frente a ataques avanzados

26 de Diciembre de 2025

La compañía anunció nuevas medidas para proteger el modo agente del navegador con IA y reducir riesgos asociados a la inyección de prompts

OpenAI dio a conocer nuevas acciones para fortalecer la seguridad de ChatGPT Atlas, su navegador web impulsado por inteligencia artificial, una herramienta que aún se encuentra en desarrollo pero que ya plantea retos importantes en materia de ciberseguridad. La compañía busca cerrar brechas críticas antes de que el producto alcance una adopción masiva.

Uno de los principales focos de atención es el modo agente, una función que permite a la IA navegar por internet y ejecutar tareas de forma autónoma. Precisamente esta capacidad, considerada uno de los mayores atractivos del sistema, también se ha convertido en su mayor punto de vulnerabilidad frente a ataques maliciosos.

La amenaza más relevante identificada por OpenAI es la llamada inyección de prompts, una técnica que consiste en ocultar instrucciones maliciosas dentro de textos, correos o páginas web para engañar a la inteligencia artificial y llevarla a ejecutar acciones no deseadas, muchas veces sin que el usuario lo note.

Aunque este tipo de ataque no es nuevo en el ecosistema de la IA generativa, su adaptación a navegadores con funciones autónomas ha elevado el nivel de riesgo. En el caso de ChatGPT Atlas, la capacidad de actuar sin intervención constante del usuario abre la puerta a fraudes, accesos indebidos o envío de información sensible.

Para enfrentar este problema, OpenAI desarrolló un sistema interno al que denomina un “atacante automatizado basado en modelos de lenguaje”. Se trata de un bot entrenado mediante aprendizaje por refuerzo, diseñado para crear, probar y perfeccionar ataques simulados contra el modo agente, con el fin de identificar fallas antes de que puedan ser explotadas en escenarios reales.

Según la compañía, este enfoque permite anticiparse a los ciberdelincuentes, ya que el sistema aprende de cada intento fallido y ajusta sus estrategias, ayudando a fortalecer las defensas del navegador. Un ejemplo presentado por OpenAI muestra cómo, tras la actualización, ChatGPT Atlas logra detectar instrucciones maliciosas ocultas en un correo electrónico y alerta al usuario en lugar de ejecutar la acción.

Desde OpenAI aclaran que estas medidas representan apenas un primer paso. Las técnicas de ataque continúan evolucionando y requieren mejoras constantes. Mientras tanto, la empresa recomienda a los usuarios emplear el modo agente con precaución, evitar iniciar sesión en sitios sensibles y revisar cuidadosamente las solicitudes de confirmación, como parte de una estrategia preventiva para reducir riesgos.

Foto: Hipertextual

NOTICIAS RELEVANTES

Galán interviene bodegas de Rappi y exige medidas para recuperar el orden en las calles de Bogotá

12 de Junio de 2026

El alcalde mayor de Bogotá, Carlos Fernando Galán, encabezó este jueves un operativo sorpresa en...

Seguir leyendo →

Las figuras a seguir en el Mundial 2026: Sofascore revela los jugadores más destacados de cada selección

11 de Junio de 2026

La cuenta regresiva para el Mundial de 2026 ya comenzó y, a pocos días del inicio del torneo, la...

Seguir leyendo →

Julián Quiñones entra en la historia del Mundial 2026 con gol en el partido inaugural

12 de Junio de 2026

El atacante Julián Quiñones escribió una página dorada en la historia de los Mundiales al...

Seguir leyendo →

VER TODAS LAS NOTICIAS