La carrera por dominar la inteligencia artificial avanza con rapidez y determinación. Mientras empresas como Google, Anthropic o xAI continúan presentando nuevos modelos con regularidad, OpenAI, responsable de ChatGPT, ha optado por un enfoque diferente. En lugar de buscar revoluciones constantes, la compañía ha centrado sus esfuerzos en perfeccionar y depurar sus modelos para minimizar errores, mejorar la fluidez y aumentar la precisión técnica. En ese contexto, OpenAI ha anunciado la llegada de GPT-5.4, la última evolución de su sistema de inteligencia artificial.
GPT-5.4 y su enfoque en tareas profesionales complejas
Hace solo unas horas, OpenAI dio a conocer GPT-5.4, una versión que se distancia del propósito principal de su predecesor, GPT-5.3, que estaba orientado a reducir errores en las respuestas y mejorar la naturalidad del diálogo. Esta nueva edición está especialmente diseñada para afrontar trabajos avanzados que requieren manejo de grandes volúmenes de información, programación y automatización. La capacidad de analizar, razonar en múltiples pasos y utilizar herramientas externas para la resolución de objetivos complejos son sus puntos clave.
GPT-5.4 no es una actualización menor; incorpora de forma integrada diversas mejoras que OpenAI había desarrollado de forma independiente. Entre ellas destaca la herencia de la potencia en programación de GPT-5.3-Codex, uno de los sistemas más avanzados para la escritura y análisis de código. Ahora, la IA puede investigar, generar código, ejecutar acciones y evaluar sus propios resultados sin necesidad de intervención constante por parte del usuario.
Una novedad relevante es la capacidad de GPT-5.4 para interactuar directamente con interfaces de ordenador. El modelo puede analizar capturas de pantalla y decidir qué acciones realizar, como navegar por páginas web, usar aplicaciones, o ejecutar comandos mediante ratón y teclado. Aunque no es un agente completamente autónomo, está dando los primeros pasos hacia un futuro en el que la IA pueda actuar de manera más autónoma y funcional dentro de los sistemas del usuario, convirtiéndose en un asistente digital más versátil.
Mejoras en rendimiento técnico y análisis visual
Las mejoras de GPT-5.4 no se limitan a la programación o la interacción con software. El modelo también exhibe un avance significativo en benchmarks relevantes del sector. Por ejemplo, en SWE-Bench Pro, que evalúa la resolución de problemas reales de programación, alcanza un 57,7 % de éxito, superando incluso a GPT-5.3-Codex. En la prueba OSWorld-Verified, que mide la habilidad de una IA para utilizar un ordenador, obtiene un 75 % de éxito, nivel algo superior al rendimiento medio humano. Además, en análisis visual, consigue un 81,2 % de acierto en la prueba MMMU-Pro, resultado favorecido por su capacidad para trabajar con imágenes de hasta 10 megapíxeles.
Estas evaluaciones reflejan que GPT-5.4 ofrece mejoras tangibles más allá de la teoría, incrementando su utilidad en entornos profesionales donde la precisión y complejidad son esenciales.
Diferenciación entre las versiones recientes de GPT
Si observamos las últimas versiones desarrolladas por OpenAI, se aprecia una especialización creciente según el tipo de tarea. GPT-5.2, ahora descontinuado, servía como modelo base multimodal con un equilibrio razonable entre rendimiento y coste, adecuado para tareas generales.
Sobre esa base, GPT-5.3 se orientó a mejorar la conversación diaria, reducir errores y ofrecer respuestas más rápidas y naturales, consolidándose como la elección para actividades cotidianas. Asimismo, introdujo funciones de agente que permiten ejecutar cambios directamente en el código sin requerir confirmación constante.
Por su parte, GPT-5.4 se presenta como la opción para trabajos profesionales complejos, automatización y razonamiento avanzado, integrando capacidades para interactuar con el ordenador y manejar tareas en múltiples pasos.
La elección entre GPT-5.3 y GPT-5.4 dependerá del tipo de uso: GPT-5.3 para diálogos y tareas habituales, y GPT-5.4 para proyectos que demandan mayor profundidad y precisión.
Acceso y disponibilidad de GPT-5.4
GPT-5.4 ya está disponible para los usuarios suscritos a los planes de OpenAI, incluidos Plus, Team y Pro. También puede ser utilizado por desarrolladores mediante la API, que incluye la opción de GPT-5.4 Pro, dirigida a tareas más exigentes pero con un coste superior.
El sistema asigna automáticamente el modelo más adecuado en función de la complejidad de la tarea: con comandos sencillos se utiliza GPT-5.3 Instant para ofrecer respuestas rápidas, mientras que para peticiones más complejas se recurre a GPT-5.4 para obtener resultados más elaborados y precisos.
Este lanzamiento marca un paso más en la evolución de la inteligencia artificial, donde los modelos comienzan a desempeñar funciones más complejas y cercano a roles de asistentes digitales integrados en el ordenador.
OpenAI está evidenciando que el futuro inmediato de la inteligencia artificial pasa por herramientas capaces de trabajar de manera más autónoma en los sistemas de los usuarios, reducir las conocidas «alucinaciones» —errores graves en las respuestas— y acercar sus habilidades a lo que hasta hace poco era pura ciencia ficción. En este sentido, GPT-5.4 apunta a ser un referente para entornos profesionales, abriendo la puerta a aplicaciones que exigen no solo generación de texto, sino también control y automatización en entornos digitales complejos.
Estos avances indican un movimiento hacia sistemas de IA que no solo atienden a consultas, sino que colaboran activamente con los usuarios en la ejecución de tareas dentro de sus ordenadores, redefiniendo la interacción tradicional con la tecnología.

