GPT Image 2 — новая эра генерации изображений от OpenAI | Fyro AI

21 апреля OpenAI представил GPT Image 2 — следующее поколение нативной генерации изображений. Это первое крупное обновление семейства GPT Image с декабря 2025 года, и оно переписывает правила игры сразу в нескольких направлениях: скорость, точность текста, фотореализм и поддержка языков.

Модель уже доступна через официальный OpenAI API (gpt-image-2) — и мы подключили её одной из первых. Попробовать можно прямо сейчас.

GPT Image 2 — пиксельно точный текст, безупречный фотореализм, многоязычная типографика

Что изменилось

Новая single-pass архитектура

GPT Image 1.5 работал в две стадии: сначала низкое разрешение, потом апскейл. Это давало 8–12 секунд на генерацию и редкие артефакты на швах.

GPT Image 2 рендерит изображение за один проход. Полностью новая архитектура, не основанная на GPT-4o pipeline. Результат:

Скорость менее 3 секунд вместо 8–12
Консистентность композиции, цвета и деталей в рамках одного прохода
Значительно выше concurrency — можно генерировать пайплайны в реальном времени

Почти идеальный рендеринг текста

Главная болячка всех генеративных моделей — буквы. У GPT Image 1.5 точность составляла 90–95%, и длинные строки регулярно «плыли».

GPT Image 2 выдаёт близкую к 100% точность даже на плакатах, UI-макетах, заголовках NeurIPS, этикетках и печатях. Можно генерировать:

Готовые рекламные постеры с читаемой типографикой
UI-мокапы с корректными подписями и кнопками
Инфографику с точными числами и заголовками
Упаковку и вывески со сложными шрифтами

Многоязычность нового уровня

OpenAI особо отметил скачок в не-латинских алфавитах: японский, корейский, китайский, арабский, хинди, кириллица, греческий, бенгали, деванагари. Кириллица теперь работает так же точно, как английский — это критично для русскоязычных постеров, макетов и обложек.

Можно генерировать мультиязычные версии одного макета, не переделывая композицию в графическом редакторе.

Фотореализм, неотличимый от фото

В слепых тестах LM Arena более 70% участников принимали изображения GPT Image 2 за реальные фотографии. Убран давний «желтоватый оттенок», характерный для 1.5 — цвет теперь кинематографически точный.

Работают и нишевые стили: street-photo 35mm, киношные портреты с атмосферным освещением, редакторская мода, candid-кадры на плёнку. Модель понимает разницу между «студийным портретом» и «случайным селфи» на уровне фотографа.

Точное знание мира

GPT Image 2 знает, как выглядят реальные вещи: логотипы, UI крупных продуктов, архитектурные детали, городские панорамы, бренды. Попросите «скриншот главной YouTube с новым логотипом» — размещение кнопок, цвета и структура будут почти 1:1.

Это значит, что модель подходит не только для креативных задач, но и для концептов продуктов, конкурентного анализа и презентационных макетов.

16:9 и гибкие размеры

Раньше были только 1024×1024, 1536×1024 и 1024×1536. GPT Image 2 добавляет:

1792×1024 (16:9) — для YouTube-превью, баннеров, слайдов
1024×1792 (9:16) — вертикальные сторис, Reels, TikTok
Любые размеры до 4K (с соотношением до 3:1) через API

Три уровня качества — low / medium / high — позволяют балансировать между стоимостью и детализацией под конкретную задачу.

GPT Image 2 vs GPT Image 1.5

GPT Image 2 — скорость, текст, фотореализм

Single-pass, < 3 секунды на генерацию
Near-100% рендер текста и типографики
Фотореалистичные изображения уровня блайнд-тестов
16:9 и вертикальные форматы из коробки
Сильная многоязычность, включая кириллицу

GPT Image 1.5 — прозрачный фон

1.5 остаётся в каталоге — он пока единственный среди GPT Image, кто поддерживает прозрачный PNG-фон на выходе. Если нужны иконки, логотипы или элементы для композиций без фона — 1.5 справится лучше. OpenAI обещал добавить прозрачность в 2.0 позже, но точной даты нет.

Примеры генераций

Несколько работ, сделанных в GPT Image 2 — без постобработки, напрямую из модели:

Ночной candid-портрет с плёночной вспышкой

Кампус Cornell University — точная архитектура и текст на баннере

Сюрреалистичный портрет с пуделем и вороной

Новая эра генерации изображений

Если первое поколение моделей OpenAI делало «картинку по запросу», то GPT Image 2 — это семантический рендер-движок: он понимает композицию, освещение, типографику и мир вокруг. Сочетание скорости, точности текста и многоязычности делает его первой моделью, которую можно без оговорок использовать в продакшен-пайплайнах — от маркетинговых кампаний до UI-мокапов.

Мы подключили GPT Image 2 в первый же день релиза. Пробуйте — и расскажите, что получилось.

Попробуйте GPT Image 2 прямо сейчас

Генерируйте изображения с идеальным текстом, фотореализмом и поддержкой 16:9.

Создать

GPT Image 2 — новая эра генерации изображений от OpenAI