21 апреля OpenAI представил GPT Image 2 — следующее поколение нативной генерации изображений. Это первое крупное обновление семейства GPT Image с декабря 2025 года, и оно переписывает правила игры сразу в нескольких направлениях: скорость, точность текста, фотореализм и поддержка языков.

Попробовать можно прямо сейчас.

Что изменилось

Новая single-pass архитектура

GPT Image 1.5 работал в две стадии: сначала низкое разрешение, потом апскейл. Это давало 8–12 секунд на генерацию и редкие артефакты на швах.

GPT Image 2 рендерит изображение за один проход. Полностью новая архитектура, не основанная на GPT-4o pipeline. Результат:

Почти идеальный рендеринг текста

Главная болячка всех генеративных моделей — буквы. У GPT Image 1.5 точность составляла 90–95%, и длинные строки регулярно «плыли».

GPT Image 2 выдаёт близкую к 100% точность даже на плакатах, UI-макетах, заголовках NeurIPS, этикетках и печатях. Можно генерировать:

Многоязычность нового уровня

OpenAI особо отметил скачок в не-латинских алфавитах: японский, корейский, китайский, арабский, хинди, кириллица, греческий, бенгали, деванагари. Кириллица теперь работает так же точно, как английский — это критично для русскоязычных постеров, макетов и обложек.

Можно генерировать мультиязычные версии одного макета, не переделывая композицию в графическом редакторе.

Фотореализм, неотличимый от фото

В слепых тестах LM Arena более 70% участников принимали изображения GPT Image 2 за реальные фотографии. Убран давний «желтоватый оттенок», характерный для 1.5 — цвет теперь кинематографически точный.

Работают и нишевые стили: street-photo 35mm, киношные портреты с атмосферным освещением, редакторская мода, candid-кадры на плёнку. Модель понимает разницу между «студийным портретом» и «случайным селфи» на уровне фотографа.

Точное знание мира

GPT Image 2 знает, как выглядят реальные вещи: логотипы, UI крупных продуктов, архитектурные детали, городские панорамы, бренды. Попросите «скриншот главной YouTube с новым логотипом» — размещение кнопок, цвета и структура будут почти 1:1.

Это значит, что модель подходит не только для креативных задач, но и для концептов продуктов, конкурентного анализа и презентационных макетов.

16:9 и гибкие размеры

Раньше были только 1024×1024, 1536×1024 и 1024×1536. GPT Image 2 добавляет:

Три уровня качества — low / medium / high — позволяют балансировать между стоимостью и детализацией под конкретную задачу.

GPT Image 2 vs GPT Image 1.5

GPT Image 2 — скорость, текст, фотореализм

GPT Image 1.5 — прозрачный фон

1.5 остаётся в каталоге — он пока единственный среди GPT Image, кто поддерживает прозрачный PNG-фон на выходе. Если нужны иконки, логотипы или элементы для композиций без фона — 1.5 справится лучше. OpenAI обещал добавить прозрачность в 2.0 позже, но точной даты нет.

Примеры генераций

Несколько работ, сделанных в GPT Image 2 — без постобработки, напрямую из модели:

Ночной candid-портрет с плёночной вспышкой Ретро компьютерный класс в стиле 2000-х Кампус Cornell University — точная архитектура и текст на баннере Сюрреалистичный портрет с пуделем и вороной

Новая эра генерации изображений

Если первое поколение моделей OpenAI делало «картинку по запросу», то GPT Image 2 — это семантический рендер-движок: он понимает композицию, освещение, типографику и мир вокруг. Сочетание скорости, точности текста и многоязычности делает его первой моделью, которую можно без оговорок использовать в продакшен-пайплайнах — от маркетинговых кампаний до UI-мокапов.

Мы подключили GPT Image 2 в первый же день релиза. Пробуйте — и расскажите, что получилось.

Попробуйте GPT Image 2 прямо сейчас

Генерируйте изображения с идеальным текстом, фотореализмом и поддержкой 16:9.

Создать