Расходы, лимиты и коммерческий баланс
Как считается потребление, где задаются лимиты, чем они отличаются от оплаты пакета и как получить отчёт.
Кому подходит
- Финансам — месячный бюджет организации и выгрузки.
- Администраторам — лимиты на отдельные API-ключи.
- Наблюдателям — просмотр расходов без права менять настройки.
Уровни лимитов
| Уровень | Где задаётся |
|---|---|
| Организация | кабинет «Организация» |
| API-ключ | при создании ключа |
Суммы в кабинете — в рублях (₽).
При превышении лимита новые запросы с ключом могут быть отклонены. Следите за разделом Биллинг.
Коммерческий B2B-биллинг
Коммерческий биллинг — отдельный слой поверх usage-аналитики. После регистрации организации создаётся billing account и первичный счёт на выбранный пакет.
Базовая модель:
- Срок подписки (1 / 3 / 12 месяцев) и тариф по объёму предоплаты (уровни Старт → Корпоративный) задаются отдельно.
- Экономия на стоимость обращения к модели складывается из тарифа и срока (настраивается в ops-console → «Тарифы»).
- Баланс расходуется на токены по внутреннему price catalog; итоговая цена списания ниже базовой пропорционально экономии организации.
- Внутри периода можно создать счёт на пополнение баланса.
- Стандартные пакеты работают по prepaid-модели: если счёт не оплачен или баланс закончился, новые LLM-запросы блокируются.
- Enterprise может работать с кредитным лимитом и постоплатой по договорённости.
Не смешивайте эти сущности:
| Сущность | Для чего нужна |
|---|---|
Budget-модули в PolicyRule | Операционный лимит расходов и защита от перерасхода |
Коммерческий balanceRub | Оплаченный баланс клиента, из которого списывается стоимость токенов |
| Usage snapshots/export | Отчётность по фактическому потреблению |
| Invoices/ledger | Финансовый lifecycle: выставлено, оплачено, зачислено, списано |
Где смотреть расходы
- Обзор и Биллинг в кабинете — текущая сводка и график.
- Разбивка по API-ключам — в детализации биллинга.
- Выгрузка JSON/CSV — инструкция.
Данные обновляются по мере запросов приложений к API моделей (OpenAI-совместимый gateway). После каждого inference создаётся запись в usage_events; finance-worker списывает стоимость с коммерческого баланса по тарифу организации (проекция ledger). Ручной POST .../usage/sync не предусмотрен — в кабинете можно обновить экран или сохранить снимок за период (POST .../usage/snapshots).