OpenAI представила GPT-5.4 із контекстом до 1 млн токенів та зниженням кількості помилок на 33%

OpenAI представила GPT-5.4 з контекстом до 1 млн токенів, вбудованим computer use, новими агентними функціями та на 33% меншою кількістю помилок.

OpenAI анонсувала нову флагманську модель GPT-5.4, яку компанія позиціонує як найбільш продуктивну й ефективну модель для професійного використання. За заявою розробника, вона поєднує можливості міркування, програмування та агентних сценаріїв в одному рішенні.

Повідомляє AstroNotus, посилаючись на OpenAI.

Разом зі стандартною версією компанія представила GPT-5.4 Thinking — модель для задач, що потребують поглибленого міркування, а також GPT-5.4 Pro, орієнтовану на високу продуктивність. В API нова модель підтримує контекстне вікно до 1 млн токенів — найбільший показник серед моделей OpenAI на цей момент.

У компанії також повідомили про покращення ефективності використання токенів. За її даними, GPT-5.4 здатна виконувати завдання з меншими витратами токенів порівняно з попередньою версією. Розгортання моделі стартує від сьогодні: GPT-5.4 буде доступна в ChatGPT, Codex та API OpenAI. Версію GPT-5.4 Thinking отримають користувачі тарифів Plus, Teams і Pro, тоді як GPT-5.4 Pro стане доступною через API, а також для клієнтів ChatGPT Enterprise та Edu.

OpenAI зазначає, що GPT-5.4 стала першою моделлю загального призначення компанії з вбудованими можливостями використання комп’ютера. Йдеться про здатність моделі виконувати дії в різних застосунках від імені користувача. Серед заявлених функцій — написання коду, виконання завдань на комп’ютері, а також надсилання команд клавіатури й миші для навігації операційною системою.

Компанія також оприлюднила результати внутрішніх і зовнішніх тестів. За її даними, GPT-5.4 посіла перше місце в Mercor APEX-Agents — тесті професійних сервісних навичок у сферах права та фінансів. Крім того, модель продемонструвала найвищі результати в OSWorld-Verified і WebArena Verified, які оцінюють здатність ШІ працювати з комп’ютером, а також отримала 83% у GDPval — бенчмарку для задач інтелектуальної праці.

Генеральний директор Mercor Брендан Фуді заявив, що модель демонструє високу результативність у створенні довгострокових робочих матеріалів, зокрема презентацій, фінансових моделей і юридичного аналізу, за нижчих витрат.

Окремо OpenAI повідомила про зниження кількості помилок і галюцинацій. За даними компанії, GPT-5.4 на 33% рідше допускає помилки в окремих твердженнях порівняно з GPT-5.2, а загальна кількість відповідей із помилками скоротилася на 18%.

Разом із запуском моделі компанія оновила API, представивши систему Tool Search для роботи з інструментами. Замість завантаження всіх визначень інструментів у системний промпт модель може знаходити їх за потреби. У OpenAI зазначають, що це дає змогу економити токени та пришвидшувати запити в системах із великою кількістю інструментів.

Також компанія представила нову оцінку безпеки для перевірки ланцюжка міркувань моделі — проміжних пояснень, які відображають процес виконання багатокрокових задач. За результатами досліджень OpenAI, GPT-5.4 Thinking рідше демонструє ознаки фальсифікації таких пояснень, що, за оцінкою компанії, може підвищити ефективність моніторингу безпеки.

Читайте також: Monobank запускає інвестиції для валютних “банок”: що відомо про нову функцію.

Більше від автора

Детальний прогноз магнітних бур на 25 квітня 2026 року: погодинна інтенсивність Kp, очікувана геомагнітна активність, вплив на самопочуття та корисні поради.

Прогноз магнітних бур на 7 березня 2026: чи буде небезпечна геомагнітна активність

Дізнайтесь, що означає 14:14 на годиннику: духовне послання, нумерологія, кохання, гроші, робота та чекліст дій, якщо бачите часто.

14:14 на годиннику: значення ангельського числа, кохання, гроші та що робити, якщо бачите часто 1414

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *