OpenAI представила GPT Image 2: новый уровень генерации изображений

OpenAI представила **GPT Image 2** — вторую версию встроенного генератора изображений, которая начала раскатываться пользователям ChatGPT в апреле 2026 года. Главное достижение новой модели — принципиально переработанная работа с текстом на изображениях: система теперь корректно рендерит кириллицу и латиницу с заявленной точностью выше 99%, что решает многолетнюю проблему индустрии. В отличие от своего предшественника GPT Image 1, запущенного в марте 2025 года, новая версия использует архитектуру single-pass (один проход вместо двух), что ускорило рендер примерно в два раза. Модель встроена непосредственно в ChatGPT и доступна через API, что отличает её от DALL-E и делает более интегрированным решением для пользователей платформы.

Технические улучшения GPT Image 2 охватывают несколько направлений. Система получила улучшенный фотореализм с лучшей работой со светом, текстурами, руками и лицами — исчез характерный глянцево-жёлтый оттенок предыдущих моделей. Новая функция позволяет генерировать реалистичные пользовательские интерфейсы, скриншоты браузеров и мобильных приложений, что полезно для прототипирования и презентаций. Для подписчиков Plus и выше доступен режим рассуждений, при котором модель сначала дорабатывает промпт, создаёт черновик, оценивает результат и при необходимости исправляет ошибки. Система также получила возможность поиска в интернете для поиска актуальных референсов, если событие не попало в обучающую выборку.

Значительный прогресс достигнут в работе с сериями изображений и редактированием. Генератор способен создавать до восьми картинок одновременно с сохранением одинаковых персонажей, объектов и стиля, что упрощает создание комиксов, манги и визуальных историй. Функция точного редактирования позволяет изменять фон, одежду, освещение или отдельные элементы, сохраняя идентичность исходного персонажа и композицию. Ключевое отличие от первой итерации заключается в самом подходе к созданию изображений — это больше не просто генерация по описанию, а осмысленный процесс, при котором модель анализирует контекст, учитывает содержание загруженных файлов и понимает структуру изображения перед генерацией.

Для рынка и пользователей это означает качественный скачок в доступности инструментов для создания визуального контента. Решение проблемы с текстом на изображениях открывает новые возможности для дизайнеров, маркетологов и разработчиков, которые ранее вынуждены были использовать дополнительные инструменты для исправления ошибок. Интеграция в ChatGPT делает эту функциональность более доступной для массовой аудитории, а не только для специалистов, работающих с отдельными API. Улучшенная скорость и качество рендера позволяют ускорить итеративный процесс создания контента, что особенно важно для профессионалов, работающих с дедлайнами.

GPT Image 2 значительно улучшает работу с текстом на изображениях, повышая точность рендеринга и скорость генерации. Эта модель открывает новые горизонты для специалистов в области дизайна и разработки.

Источник: https://habr.com/ru/companies/studyai/articles/1026850/

OpenAI представила GPT Image 2: новый уровень генерации изображений

Комментарии(0)

Читайте также