GPT-5.4 Thinking llega como una evolución clara de la estrategia de OpenAI: unificar razonamiento, programación, uso de herramientas y flujos de trabajo profesionales en un solo sistema. Ya no se trata solo de responder preguntas con más precisión, sino de ejecutar tareas complejas del mundo real con menos idas y vueltas, mejor contexto y mayor control por parte del usuario.
La novedad más importante es que este modelo puede mostrar un plan de razonamiento desde el inicio, lo que permite corregir el rumbo mientras trabaja. Además, OpenAI lo posiciona como su sistema más capaz y eficiente para trabajo profesional, con mejoras en hojas de cálculo, presentaciones, documentos, navegación web y uso nativo de ordenador. Para analistas, desarrolladores, equipos de negocio y usuarios avanzados, el cambio es mucho más práctico que cosmético.
¿Qué hace diferente a GPT-5.4 Thinking en trabajo profesional?
OpenAI define este lanzamiento como su sistema más fuerte para trabajo profesional complejo. Eso incluye desde análisis en hojas de cálculo hasta presentaciones, documentos extensos, flujos con conectores, tareas de software y razonamiento en varios pasos.
Entre sus fortalezas más destacadas están:
- Mayor precisión factual.
- Menor consumo de tokens.
- Mejor uso de herramientas externas.
- Respuestas más alineadas con la intención del usuario.
La propuesta es clara: entregar resultados más útiles con menos correcciones manuales.

Mejor rendimiento en hojas de cálculo, documentos y presentaciones
Uno de los avances más visibles está en el trabajo de oficina avanzado. En pruebas internas sobre modelización financiera, el modelo alcanzó 87,5 % frente al 68,4 % de la generación anterior. En presentaciones, los evaluadores humanos prefirieron sus resultados el 68 % de las veces gracias a una estética más sólida, mejor estructura visual y un uso más eficaz de imágenes.
Eso significa que puede ayudar en tareas como:
- Construcción de modelos financieros.
- Redacción y edición de documentos complejos.
- Diseño de presentaciones de venta o análisis.
- Organización de información de múltiples fuentes.

Menos errores y menos alucinaciones
Otro punto clave es la reducción de errores. OpenAI afirma que este modelo es su sistema más preciso hasta la fecha: sus afirmaciones individuales son 33 % menos propensas a ser falsas y sus respuestas completas son 18 % menos propensas a contener algún error frente a la versión anterior. Para usuarios profesionales, esta mejora es crítica porque reduce el tiempo de verificación posterior.
¿Cómo GPT-5.4 Thinking usa el ordenador, la web y grandes contextos?
Uno de los cambios más importantes es que OpenAI lo presenta como su primer modelo general con capacidades nativas de uso de ordenador. Esto permite a agentes operar software, navegar interfaces y ejecutar flujos complejos entre aplicaciones.
Puede trabajar con:
- Capturas de pantalla.
- Ratón y teclado.
- Navegadores web.
- Bibliotecas como Playwright.
Esto abre la puerta a agentes que no solo responden, sino que actúan dentro de sistemas reales.
Ventana de contexto de hasta 1 millón de tokens
El modelo soporta hasta 1 millón de tokens de contexto, lo que le permite planificar, ejecutar y verificar tareas en horizontes amplios sin perder coherencia. Esto es especialmente útil en auditorías, investigación extensa, análisis de proyectos grandes o flujos de desarrollo con múltiples archivos y herramientas.
Mejor búsqueda web y uso de herramientas
OpenAI también reforzó el rendimiento del modelo en búsqueda web y ecosistemas de herramientas amplios. Con su sistema de búsqueda de herramientas, el modelo no carga todo desde el inicio, sino que localiza la herramienta correcta cuando la necesita. Eso reduce tokens, acelera la respuesta y mejora la eficiencia.
Además, en tareas de navegación persistente por la web logró una mejora notable, lo que lo vuelve más útil para preguntas del tipo “aguja en un pajar”, donde hay que encontrar información difícil, contrastarla y sintetizarla.
Rendimiento, benchmarks y comparación frente a humanos
OpenAI presentó métricas potentes en distintos escenarios. En GDPval, que evalúa trabajo especializado en 44 ocupaciones, el modelo igualó o superó a expertos del sector en 83 % de las comparaciones. En uso de ordenador sobre escritorio real, logró 75 % de éxito, superando incluso el promedio humano reportado de 72,4 %.

También destacó en:
- OSWorld-Verified: 75,0 %
- Toolathlon: 54,6 %
- BrowseComp: 82,7 %
- SWE-Bench Pro: 57,7 %
Estas cifras lo posicionan como un sistema especialmente fuerte en tareas prolongadas, herramientas y entornos reales.
Programación más rápida y más útil
El modelo incorpora las capacidades líderes de GPT-5.3-Codex, con mejoras en tareas de programación, depuración y front-end. OpenAI afirma que iguala o supera a esa generación en SWE-Bench Pro y además ofrece menor latencia en varios niveles de esfuerzo de razonamiento.

Eso es especialmente relevante para desarrolladores que buscan:
- Menos intervención manual.
- Más velocidad en iteración.
- Mejor capacidad de depuración visual.
- Mayor calidad estética y funcional en front-end.
Seguridad y control del comportamiento
OpenAI también subraya mejoras en seguridad. El sistema mantiene controles de acceso, monitorización y bloqueo de solicitudes de mayor riesgo para ciertos clientes. Además, la compañía afirma que su capacidad para ocultar deliberadamente el razonamiento es baja, lo que se considera positivo para la supervisión y el control.
Disponibilidad, planes y cuándo conviene usarlo
¿Dónde está disponible?
El modelo se despliega en ChatGPT, la API y Codex. En ChatGPT, está disponible para usuarios de Plus, Team y Pro, mientras que la versión Pro se reserva para Pro y Enterprise. En la API aparece como gpt-5.4, y su versión de mayor rendimiento como gpt-5.4-pro.
¿Qué modelo elegir según la tarea?
La estructura por capas de OpenAI deja un mensaje claro: no todas las tareas necesitan la misma profundidad. Para conversación cotidiana sigue existiendo una opción más rápida. Pero cuando se trata de análisis complejos, uso de herramientas, ordenador, documentos o investigación prolongada, este modelo es la mejor elección.
Conviene usarlo cuando necesitas:
- Mantener contexto largo.
- Corregir el plan a mitad de respuesta.
- Integrar navegación, herramientas y software.
- Reducir errores en trabajo profesional.
Preguntas frecuentes
¿Puede operar un ordenador de verdad?
Sí. Puede interactuar con interfaces, capturas de pantalla, teclado y ratón, además de ejecutar flujos con aplicaciones y web.
¿Es mejor para profesionales que para uso casual?
Sí. Está optimizado para análisis, documentos, hojas de cálculo, presentaciones, programación y tareas complejas.
¿Consume más recursos?
Tiene un precio por token más alto que la versión anterior, pero también usa menos tokens para muchas tareas, lo que mejora eficiencia y velocidad.
Conclusión
GPT-5.4 Thinking no es solo una mejora en capacidad de conversación: es un salto hacia modelos que trabajan de manera más útil dentro de entornos reales. Su combinación de razonamiento, programación, uso de ordenador, web, documentos y herramientas lo convierte en una pieza mucho más cercana a un agente profesional que a un simple chatbot.
Lo más interesante es que OpenAI no solo aumentó potencia, sino también eficiencia, control y aplicabilidad. Para quienes necesitan resultados complejos en menos tiempo, con mejor contexto y menos correcciones, este modelo marca un nuevo estándar. La competencia con otros sistemas seguirá creciendo, pero aquí ya se ve con claridad hacia dónde va la próxima etapa de la inteligencia artificial aplicada al trabajo.





























