Проекти та інновації

ChatGPT навчився «нормально писати» на картинках: OpenAI представила Images 2.0

22 квітня 2026, 13:03Новини59

Этот материал также доступен на русском

Оновлена модель краще відтворює текст різними мовами, створює складні макети та дозволяє генерувати кілька варіантів зображень із одного запиту

  • Посилання скопійованоlink copied

OpenAI представила нову версію генератора зображень — ChatGPT Images 2.0, яка інтегрована безпосередньо в ChatGPT і орієнтована на створення складних візуальних матеріалів із підвищеною точністю.

Ключовим оновленням стало суттєве покращення роботи з текстом на зображеннях — саме цей елемент традиційно був слабким місцем генеративних моделей. За даними компанії, нова система значно точніше відтворює підписи, дрібний шрифт і інтерфейсні елементи навіть у складних композиціях, включно з інфографікою, постерами та UI-макетами.

Окремий акцент зроблено на підтримці різних мов, зокрема не латинських систем письма. Це означає, що модель краще працює з українською, а також із японською, корейською чи хінді — мовами, де попередні версії часто припускалися помилок у написанні.

Тестування інструмента показує, що генератор значно впевненіше формує структуровані візуальні матеріали, зокрема інфографіку з великою кількістю текстових блоків і дрібних деталей, що раніше вимагало ручного доопрацювання.

Ось один з варіантів редакційного завдання:

Ще одне оновлення — поява режиму «thinking», у якому модель витрачає більше часу на аналіз запиту перед генерацією. Такий підхід застосовується для складних завдань, де важлива структура зображення — наприклад, у багатокадрових коміксах або маркетингових матеріалах із кількома рівнями інформації.

Також користувачі отримали можливість створювати одразу кілька варіантів зображення з одного запиту та гнучко обирати формат і розмір під конкретні задачі — від соцмереж до презентацій.

Для розробників OpenAI відкрила доступ до нової моделі через API під назвою gpt-image-2, яка підтримує генерацію, редагування зображень і роботу з різними роздільними здатностями.

У компанії наголошують, що ChatGPT Images 2.0 є наступним етапом еволюції генерації зображень після дифузійних моделей, із фокусом на деталізації, коректному відображенні тексту та роботі зі складними сценами — саме ці аспекти раніше залишалися головними обмеженнями для ШІ-інструментів у практичному використанні.

Не пропустіть важливе!
Підписуйтесь та отримуйте дайжест новин

Щоденно чи щотижня – обираєте ви!

Матеріали за темою

Огляд ринків

Статті • БОРГ-review
Ключові помилки під час укладення угоди, які призводять до судів і втрати коштів

Огляд ринків

Статті • БОРГ-review
Про роль ОПЕК+, «премію за страх» і чому дешевшого пального швидко не буде

Огляд ринків

Статті • БОРГ-review
Проблема вибору «правильного» коду виду цільового призначення земель для ОРСГП лежить на стику земельного та містобудівного регулювання

Огляд ринків

Статті • БОРГ-review
Суди все частіше оцінюють не форму правочину, а його реальний економічний зміст

Огляд ринків

Статті • БОРГ-review
Верховний Суд зазначив, що під час формування земельної ділянки визначення її виду цільового призначення здійснюється розробником документації із землеустрою

Огляд ринків

Статті • БОРГ-review
Як змінилися правила публічних закупівель під час війни, чому зросли ризики формальної конкуренції і що насправді заважає бізнесу працювати на рівних умовах