OpenAI випустила GPT-5.4: що може нова модель
OpenAI представила GPT-5.4 у ChatGPT (режим GPT-5.4 Thinking), API та Codex. Компанія також запустила GPT-5.4 Pro — версію для користувачів, яким потрібна максимальна продуктивність у складних задачах.
OpenAI представила GPT-5.4 у ChatGPT (режим GPT-5.4 Thinking), API та Codex. Компанія також запустила GPT-5.4 Pro — версію для користувачів, яким потрібна максимальна продуктивність у складних задачах.
OpenAI представила GPT-5.4 у ChatGPT (режим GPT-5.4 Thinking), API та Codex. Компанія також запустила GPT-5.4 Pro — версію для користувачів, яким потрібна максимальна продуктивність у складних задачах.
За даними OpenAI, GPT-5.4 орієнтована на «робочі» сценарії: підготовку документів, таблиць і презентацій, а також багатокрокові дії з інструментами. У ChatGPT режим Thinking може показувати короткий план дій перед фінальною відповіддю, щоб користувач скоригував напрям ще в процесі.
Для розробників ключова зміна в іншому: у Codex та API GPT-5.4 отримала вбудовану можливість працювати з комп’ютером як агент. Простими словами, модель може дивитися на скриншоти інтерфейсу, натискати кнопки мишею та вводити текст, виконуючи ланцюжки дій у різних програмах і на сайтах. У релізі зазначено, що в API підтримується контекст до 1 млн токенів, тобто модель може тримати в пам’яті дуже довгі інструкції й матеріали під час роботи.
OpenAI також навела результати тестів. На GDPval, який перевіряє виконання професійних завдань у 44 ролях, GPT-5.4 перемагає або не поступається людям у 83,0% порівнянь (для GPT-5.2 вказано 70,9%). На OSWorld-Verified, де оцінюють роботу в «настільному» середовищі через скриншоти та дії мишею/клавіатурою, модель має 75,0% успішності проти 47,3% у GPT-5.2. Для кодування на SWE-Bench Pro (Public) OpenAI заявляє 57,7%.
У блоці про якість компанія пише, що GPT-5.4 стала точнішою: окремі твердження на 33% рідше бувають хибними, а повні відповіді на 18% рідше містять помилки порівняно з GPT-5.2. Також OpenAI заявляє про відчутний прогрес у офісних задачах: на внутрішньому тесті зі створення фінансових таблиць GPT-5.4 набрала 87,3% проти 68,4% у GPT-5.2, а презентації від нової моделі частіше обирають люди.
GPT-5.4 поєднує підхід GPT-5.3-Codex у програмуванні з акцентом на інструменти та автоматизацію. У Codex OpenAI окремо показала експериментальний режим Playwright (Interactive), який дозволяє моделі тестувати вебзастосунки під час розробки.
Раніше dev.ua писав про те, як OpenAI випустила оновлену модель GPT‑5.3 Instant. Вона значно менше моралізаторствує у спілкуванні з користувачами і відразу переходить до діла.


