LLM Router
Концепции

Расходы, лимиты и коммерческий баланс

Как считается потребление, где задаются лимиты, чем они отличаются от оплаты пакета и как получить отчёт.

Кому подходит

  • Финансам — месячный бюджет организации и выгрузки.
  • Администраторам — лимиты на отдельные API-ключи.
  • Наблюдателям — просмотр расходов без права менять настройки.

Уровни лимитов

УровеньГде задаётся
Организациякабинет «Организация»
API-ключпри создании ключа

Суммы в кабинете — в рублях (₽).

При превышении лимита новые запросы с ключом могут быть отклонены. Следите за разделом Биллинг.

Коммерческий B2B-биллинг

Коммерческий биллинг — отдельный слой поверх usage-аналитики. После регистрации организации создаётся billing account и первичный счёт на выбранный пакет.

Базовая модель:

  • Срок подписки (1 / 3 / 12 месяцев) и тариф по объёму предоплаты (уровни Старт → Корпоративный) задаются отдельно.
  • Экономия на стоимость обращения к модели складывается из тарифа и срока (настраивается в ops-console → «Тарифы»).
  • Баланс расходуется на токены по внутреннему price catalog; итоговая цена списания ниже базовой пропорционально экономии организации.
  • Внутри периода можно создать счёт на пополнение баланса.
  • Стандартные пакеты работают по prepaid-модели: если счёт не оплачен или баланс закончился, новые LLM-запросы блокируются.
  • Enterprise может работать с кредитным лимитом и постоплатой по договорённости.

Не смешивайте эти сущности:

СущностьДля чего нужна
Budget-модули в PolicyRuleОперационный лимит расходов и защита от перерасхода
Коммерческий balanceRubОплаченный баланс клиента, из которого списывается стоимость токенов
Usage snapshots/exportОтчётность по фактическому потреблению
Invoices/ledgerФинансовый lifecycle: выставлено, оплачено, зачислено, списано

Где смотреть расходы

  • Обзор и Биллинг в кабинете — текущая сводка и график.
  • Разбивка по API-ключам — в детализации биллинга.
  • Выгрузка JSON/CSV — инструкция.

Данные обновляются по мере запросов приложений к API моделей (OpenAI-совместимый gateway). После каждого inference создаётся запись в usage_events; finance-worker списывает стоимость с коммерческого баланса по тарифу организации (проекция ledger). Ручной POST .../usage/sync не предусмотрен — в кабинете можно обновить экран или сохранить снимок за период (POST .../usage/snapshots).

Что дальше

На этой странице