21 апреля 2026 года компания OpenAI анонсировала ChatGPT Images 2.0 — новую версию инструмента генерации изображений, интегрированного в чат-бот ChatGPT и работающего на модели gpt-image-2. Это не просто обновление, а переход к генералистской модели, способной обрабатывать пространственные отношения и трехмерную перспективу через текстовые инструкции. Ключевое нововведение — интеграция с reasoning-возможностями O-серии, где модель перед генерацией анализирует задачу, строит план композиции, проверяет себя и при необходимости ищет референсы в интернете. Knowledge cutoff модели приходится на декабрь 2025 года. OpenAI подчеркивает: «Изображения — это язык, а не декорация. Хорошее изображение делает то же, что хорошее предложение: выбирает, расставляет и раскрывает».
Модель предлагает два режима: Instant для быстрой генерации, доступный всем пользователям, и Thinking для платных подписчиков Plus, Pro и Business, где происходит глубокий анализ. Images 2.0 решает историческую проблему диффузионных моделей с текстом — точность воспроизведения превышает 99% по предрелизным тестам, позволяя создавать страничные макеты вроде обложек журналов с заголовками и штрихкодами, инфографику с легендами или постеры с иерархией. Поддерживается пакетная генерация до 8–10 изображений за запрос с сохранением стиля, палитры и character consistency, что упрощает итерации для дизайнеров и открывает сценарии вроде комиксов, сторибордов или детских книг. Разрешения достигают 2K, соотношения сторон от 3:1 до 1:3. Интеграция с Codex позволяет разработчикам генерировать UI-макеты и прототипы прямо в среде разработки без переключений.
Обновление знаменует сдвиг от реактивной визуализации к мышлению, объединяя текст, логику и изображения в единую архитектуру, что отличает его от конкурентов вроде Flux 2 Pro (лидирующего в фотореализме портретов) или Midjourney. Для рынка это заявка на доминирование в профессиональном дизайне, снижая нужду в отдельных специалистах и ускоряя рабочие процессы. Пользователи получают более точный, контекстный инструмент, но с небольшой задержкой в Thinking-режиме из-за анализа; возможны ошибки в высокодетализированных сценариях. В итоге Images 2.0 укрепляет позиции OpenAI, делая визуальный контент базовым форматом AI-взаимодействия и стимулируя спрос на платные подписки.
Инструмент предлагает два режима работы, включая уникальные функции анализа и генерации, что позволяет значительно улучшить качество визуального контента.
Источник: https://openai.com/index/introducing-chatgpt-images-2-0

Комментарии(0)
Оставьте комментарий
Войдите, чтобы присоединиться к обсуждению