21 апреля OpenAI представил GPT Image 2 — следующее поколение нативной генерации изображений. Это первое крупное обновление семейства GPT Image с декабря 2025 года, и оно переписывает правила игры сразу в нескольких направлениях: скорость, точность текста, фотореализм и поддержка языков.
Попробовать можно прямо сейчас.
Что изменилось
Новая single-pass архитектура
GPT Image 1.5 работал в две стадии: сначала низкое разрешение, потом апскейл. Это давало 8–12 секунд на генерацию и редкие артефакты на швах.
GPT Image 2 рендерит изображение за один проход. Полностью новая архитектура, не основанная на GPT-4o pipeline. Результат:
- Скорость менее 3 секунд вместо 8–12
- Консистентность композиции, цвета и деталей в рамках одного прохода
- Значительно выше concurrency — можно генерировать пайплайны в реальном времени
Почти идеальный рендеринг текста
Главная болячка всех генеративных моделей — буквы. У GPT Image 1.5 точность составляла 90–95%, и длинные строки регулярно «плыли».
GPT Image 2 выдаёт близкую к 100% точность даже на плакатах, UI-макетах, заголовках NeurIPS, этикетках и печатях. Можно генерировать:
- Готовые рекламные постеры с читаемой типографикой
- UI-мокапы с корректными подписями и кнопками
- Инфографику с точными числами и заголовками
- Упаковку и вывески со сложными шрифтами
Многоязычность нового уровня
OpenAI особо отметил скачок в не-латинских алфавитах: японский, корейский, китайский, арабский, хинди, кириллица, греческий, бенгали, деванагари. Кириллица теперь работает так же точно, как английский — это критично для русскоязычных постеров, макетов и обложек.
Можно генерировать мультиязычные версии одного макета, не переделывая композицию в графическом редакторе.
Фотореализм, неотличимый от фото
В слепых тестах LM Arena более 70% участников принимали изображения GPT Image 2 за реальные фотографии. Убран давний «желтоватый оттенок», характерный для 1.5 — цвет теперь кинематографически точный.
Работают и нишевые стили: street-photo 35mm, киношные портреты с атмосферным освещением, редакторская мода, candid-кадры на плёнку. Модель понимает разницу между «студийным портретом» и «случайным селфи» на уровне фотографа.
Точное знание мира
GPT Image 2 знает, как выглядят реальные вещи: логотипы, UI крупных продуктов, архитектурные детали, городские панорамы, бренды. Попросите «скриншот главной YouTube с новым логотипом» — размещение кнопок, цвета и структура будут почти 1:1.
Это значит, что модель подходит не только для креативных задач, но и для концептов продуктов, конкурентного анализа и презентационных макетов.
16:9 и гибкие размеры
Раньше были только 1024×1024, 1536×1024 и 1024×1536. GPT Image 2 добавляет:
- 1792×1024 (16:9) — для YouTube-превью, баннеров, слайдов
- 1024×1792 (9:16) — вертикальные сторис, Reels, TikTok
- Любые размеры до 4K (с соотношением до 3:1)
GPT Image 2 vs GPT Image 1.5
GPT Image 2 — скорость, текст, фотореализм
- Single-pass, < 3 секунды на генерацию
- Near-100% рендер текста и типографики
- Фотореалистичные изображения уровня блайнд-тестов
- 16:9 и вертикальные форматы из коробки
- Сильная многоязычность, включая кириллицу
GPT Image 1.5 — прозрачный фон
1.5 остаётся в каталоге — он пока единственный среди GPT Image, кто поддерживает прозрачный PNG-фон на выходе. Если нужны иконки, логотипы или элементы для композиций без фона — 1.5 справится лучше. OpenAI обещал добавить прозрачность в 2.0 позже, но точной даты нет.
Примеры генераций
Несколько работ, сделанных в GPT Image 2 — без постобработки, напрямую из модели:
Новая эра генерации изображений
Если первое поколение моделей OpenAI делало «картинку по запросу», то GPT Image 2 — это семантический рендер-движок: он понимает композицию, освещение, типографику и мир вокруг. Сочетание скорости, точности текста и многоязычности делает его первой моделью, которую можно без оговорок использовать в продакшен-пайплайнах — от маркетинговых кампаний до UI-мокапов.
Мы подключили GPT Image 2 в первый же день релиза. Пробуйте — и расскажите, что получилось.
Попробуйте GPT Image 2 прямо сейчас
Генерируйте изображения с идеальным текстом, фотореализмом и поддержкой 16:9.