OpenAI вводит новую систему управления лимитами использования API ChatGPT, выходящую за рамки традиционных ограничений по скорости запросов, чтобы обеспечить стабильность сервиса и предотвратить злоупотребления. Лимиты измеряются по нескольким метрикам: запросы в минуту (RPM), запросы в день (RPD), токены в минуту (TPM), токены в день (TPD), а для моделей с обработкой изображений и аудио — изображения в минуту (IPM). Для бесплатных аккаунтов действуют строгие ограничения, например, всего несколько запросов в минуту, но они автоматически повышаются по мере роста расходов пользователя или перехода на платные уровни. Каждый уровень использования привязан к пожизненным тратам и истории платежей: Tier 1 требует минимум 5 долларов и 7 дней активности с лимитом 100 долларов в месяц, Tier 2 — 50 долларов и 7 дней с потолком 500 долларов. Более высокие уровни, включая Tier 3 с лимитом до 1000 долларов, требуют верификации личности и доступны для растущих проектов.
Модели имеют индивидуальные квоты: крупные, такие как GPT-4.1 или GPT-5.2 Instant (обновление от 10 февраля 2026 года), обладают меньшими RPM из-за высокой вычислительной нагрузки, в то время как компактные варианты вроде o4-mini (выпущена 16 апреля 2025 года) поддерживают повышенную пропускную способность. Лимиты применяются на уровне организации или проекта, а не индивидуального пользователя, что упрощает управление для команд. OpenAI предоставляет дашборд для мониторинга RPM/TPM и возвращает заголовки HTTP с остатком квот в ответах API, рекомендуя стратегии обратного ожидания при приближении к пределам. Для крупных клиентов, нуждающихся в обработке свыше 450 миллионов токенов в день, доступны выделенные инстансы через Microsoft Azure с кастомным ценообразованием и гарантированной пропускной способностью, минуя стандартные ограничения.
Эта система влияет на разработчиков, заставляя планировать бюджеты заранее: малые проекты остаются в Tier 1–3 с расходами 500–1000 долларов в месяц, а превышение лимитов приводит к простою сервиса. Пользователи Plus и Pro получают удвоенные лимиты для моделей вроде Codex, а новые подписки вроде ChatGPT Go (расширена до 89 стран к 14 октября 2025 года) предлагают больше сообщений и файлов за низкую цену. В итоге переход к автоматическому масштабированию повышает предсказуемость затрат, но требует активного мониторинга, чтобы избежать неожиданных отключений; для рынка это стимулирует миграцию на enterprise-планы, снижая риски для высоконагруженных приложений и оптимизируя расходы на токены для GPT-5 и будущих моделей.
Система лимитов API ChatGPT учитывает не только количество запросов, но и специфические метрики, что позволяет более эффективно управлять ресурсами. Нововведения касаются как бесплатных, так и платных аккаунтов, обеспечивая гибкость для различных проектов.

Комментарии(0)
Оставьте комментарий
Войдите, чтобы присоединиться к обсуждению