OpenAI анонсувала нову флагманську модель GPT-5.4, яку компанія позиціонує як найбільш продуктивну й ефективну модель для професійного використання. За заявою розробника, вона поєднує можливості міркування, програмування та агентних сценаріїв в одному рішенні.
Повідомляє AstroNotus, посилаючись на OpenAI.
Разом зі стандартною версією компанія представила GPT-5.4 Thinking — модель для задач, що потребують поглибленого міркування, а також GPT-5.4 Pro, орієнтовану на високу продуктивність. В API нова модель підтримує контекстне вікно до 1 млн токенів — найбільший показник серед моделей OpenAI на цей момент.
У компанії також повідомили про покращення ефективності використання токенів. За її даними, GPT-5.4 здатна виконувати завдання з меншими витратами токенів порівняно з попередньою версією. Розгортання моделі стартує від сьогодні: GPT-5.4 буде доступна в ChatGPT, Codex та API OpenAI. Версію GPT-5.4 Thinking отримають користувачі тарифів Plus, Teams і Pro, тоді як GPT-5.4 Pro стане доступною через API, а також для клієнтів ChatGPT Enterprise та Edu.
OpenAI зазначає, що GPT-5.4 стала першою моделлю загального призначення компанії з вбудованими можливостями використання комп’ютера. Йдеться про здатність моделі виконувати дії в різних застосунках від імені користувача. Серед заявлених функцій — написання коду, виконання завдань на комп’ютері, а також надсилання команд клавіатури й миші для навігації операційною системою.
Компанія також оприлюднила результати внутрішніх і зовнішніх тестів. За її даними, GPT-5.4 посіла перше місце в Mercor APEX-Agents — тесті професійних сервісних навичок у сферах права та фінансів. Крім того, модель продемонструвала найвищі результати в OSWorld-Verified і WebArena Verified, які оцінюють здатність ШІ працювати з комп’ютером, а також отримала 83% у GDPval — бенчмарку для задач інтелектуальної праці.
Генеральний директор Mercor Брендан Фуді заявив, що модель демонструє високу результативність у створенні довгострокових робочих матеріалів, зокрема презентацій, фінансових моделей і юридичного аналізу, за нижчих витрат.
Окремо OpenAI повідомила про зниження кількості помилок і галюцинацій. За даними компанії, GPT-5.4 на 33% рідше допускає помилки в окремих твердженнях порівняно з GPT-5.2, а загальна кількість відповідей із помилками скоротилася на 18%.
Разом із запуском моделі компанія оновила API, представивши систему Tool Search для роботи з інструментами. Замість завантаження всіх визначень інструментів у системний промпт модель може знаходити їх за потреби. У OpenAI зазначають, що це дає змогу економити токени та пришвидшувати запити в системах із великою кількістю інструментів.
Також компанія представила нову оцінку безпеки для перевірки ланцюжка міркувань моделі — проміжних пояснень, які відображають процес виконання багатокрокових задач. За результатами досліджень OpenAI, GPT-5.4 Thinking рідше демонструє ознаки фальсифікації таких пояснень, що, за оцінкою компанії, може підвищити ефективність моніторингу безпеки.
Читайте також: Monobank запускає інвестиції для валютних “банок”: що відомо про нову функцію.