Policy Rules (Guardrails)

Guardrails в LLM Router задают, как участники workspace и API-ключи могут пользоваться моделями: лимиты расходов, списки разрешённых моделей и провайдеров, пров

Кому подходит

Владельцам и администраторам — централизованно управлять ограничениями без разрозненных полей.
ИБ и compliance — настраивать content-политики на нужном уровне клиента.
Разработчикам — понимать, какие правила реально сработали для конкретного API-запроса.

Где настраиваются ограничения

Ограничения по моделям, бюджетам, контенту и rate limits задаются в API .../policy/rules и применяются единым движком в gateway.

Что можно настроить в одном правиле

Каждое правило — набор модулей:

Модуль	Назначение
`access`	Разрешённые или запрещённые модели и провайдеры
`budget`	Потолок расходов в ₽ с периодом `daily` / `weekly` / `monthly`
`content`	PII, категории контента, prompt-injection, свои regex
`rateLimit`	RPM/TPM на ключ или систему

Пустой allowlist в модуле access означает «без дополнительного ограничения по этому измерению» — сужение начинается только когда хотя бы одно правило задаёт непустой список.

Назначение правил: кому применяется

Правило привязывается к клиенту (clientSubject).

`clientSubject.type`	Когда использовать
`organization`	Базовые лимиты всего workspace / компании
`member`	Ограничения для конкретного сотрудника (все его ключи наследуют контекст участника)
`virtual_group`	Общие правила для группы участников и/или систем
`system`	Правила для информационной системы или агента
`api_key`	Самый узкий уровень — только этот ключ

Личный аккаунт: в кабинете доступны «весь workspace» (organization) и отдельный api_key.

Бизнес-аккаунт: полный набор client tiers плюс виртуальные группы (создаются в разделе Виртуальные группы).

Наслоение правил

На один запрос могут одновременно подойти несколько правил разных уровней — например, организация + виртуальная группа + API-ключ. Это не «первое совпадение», а совокупность:

правило на участника задаёт базовую линию для всех его ключей;
правило на ключ накладывается сверху и может быть строже;
правила организации и группы действуют параллельно, если запрос попадает в их scope.

Счётчик бюджета всегда привязан к тому клиенту, для которого создано правило: отдельно «область счётчика» в кабинете не выбирается — она совпадает с clientSubject.

Иерархия и объединение (collect + merge)

Для каждого запроса gateway выполняет два шага:

Collect — по лестнице scope и client tiers собираются все активные PolicyRule, подходящие к запросу.
Merge — модули объединяются в EffectivePolicy.

Правила объединения:

Настройка	Как объединяется	Итог
`allowedModels`, `allowedProviders`	Пересечение	Доступны только модели/провайдеры из всех правил с непустым allowlist
`deniedModels`	Объединение	Запрет из любого правила блокирует модель
`budget`	Каждый лимит отдельно	Запрос проходит только если все применимые бюджеты не исчерпаны
`content` (PII, категории, regex)	Объединение фильтров	Фильтры из всех правил действуют вместе; при конфликте действий побеждает более строгое: `block` > `mask` > `warn`; режим `observe` только логирует
`rateLimit`	Наиболее строгий	Берётся минимальный RPM/TPM из применимых правил

Чем больше правил сужает доступ, тем уже итоговый allowlist. Чем больше правил задаёт бюджеты, тем больше независимых проверок на каждом запросе.

Примеры бюджета (независимые счётчики)

Бюджеты не делятся между участниками: у каждого клиента свой счётчик на каждое правило.

Пример 1 — правило на участника, 50 000 ₽/день

Правило с лимитом 50 000 ₽/день назначено трём сотрудникам. У каждого свой счётчик 50 000 ₽. Если один исчерпал лимит, остальные продолжают работать в своих пределах.

Пример 2 — расход ключей суммируется для участника

У участника два API-ключа, на каждый — правило 20 000 ₽/день. Ключ A потратил 15 000 ₽, ключ B — 10 000 ₽. По ключам лимиты не превышены, но если на участника тоже действует правило 20 000 ₽/день, его суммарный расход 25 000 ₽ превысит member-лимит — новые запросы с любого его ключа будут отклонены.

Пример 3 — наслоенные лимиты

У участника member-правило 100 000 ₽/день. На ключ — отдельное правило 30 000 ₽/день. Ключ не может потратить больше 30 000 ₽/день, а суммарно по всем ключам участника — больше 100 000 ₽/день. Оба лимита проверяются на каждом запросе; срабатывает тот, который исчерпан первым.

Лестница scope: client × provider × model

Помимо клиента правило может сузить область по провайдеру и модели каталога (8 уровней — как в pricing rules):

Уровень	Клиент	Провайдер	Модель
1	✅	✅	✅
2	✅	—	✅
3	✅	✅	—
4	✅	—	—
5	—	✅	✅
6	—	—	✅
7	—	✅	—
8	—	—	—

Policy rules не останавливаются на первом совпадении по scope — собираются все подходящие уровни, затем merge.

Уровни клиентов (client tiers)

При collect правила сортируются от более специфичного клиента к менее:

api_key
system
member
virtual_group
organization
глобальные правила платформы (без clientSubject)

Virtual Groups и наследование

Virtual group содержит только memberIds и systemIds. API-ключи в группу напрямую не добавляются. Ключ наследует группы через:

владельца ключа (ownerEmail → member);
или systemId, если ключ привязан к системе/агенту.

Проверка контента

Модуль content сканирует вход запроса (тексты сообщений, аргументы tool calls) до вызова модели. Ответы модели не проверяются.

Персональные данные (PII)

Встроенные типы: email, телефон, паспорт, ИНН, платёжная карта. Дополнительно — свои regex через API (customPatterns).

Действия:

mask — подстановка метки, запрос уходит к модели;
block — HTTP 403, запрос не доходит до провайдера;
warn — фиксация срабатывания без блокировки и маскирования.

Встроенные regex для PII

Тип	Regex	Пример совпадения
Email	`[A-Za-z0-9._%+\-]+@[A-Za-z0-9.\-]+\.[A-Za-z]{2,}`	`user@example.com`
Телефон	`(?:\+7\|8)[\s\-]?$?\d{3}$?[\s\-]?\d{3}[\s\-]?\d{2}[\s\-]?\d{2}` и международный вариант	`+7 999 123-45-67`
Паспорт РФ	`\b\d{2}\s?\d{2}\s?\d{6}\b`	`45 12 123456`
ИНН	`\b\d{10}\b\|\b\d{12}\b`	`7707083893`
Платёжная карта	`\b(?:\d[ -]*?){13,19}\b`	`4265 5256 0839 8752`

При маскировании подстановка: [PII:тип] (например [PII:email]).

Категории контента

Дополнительно к PII: ненормативная лексика, разжигание ненависти, насилие, 18+, незаконная активность. Проверка по ключевым словам (не regex). Настраиваются в мастере на шаге «Категории контента».

Prompt injection

Встроенные OWASP-паттерны и свои regex. В кабинете — шаг Prompt injection в мастере правила. Действия: только фиксировать, маскировать, блокировать.

Рекомендуемый порядок: сначала Наблюдение (content.mode: observe) или действие «Только фиксировать», затем маскирование или блокировка.

Если поле content.promptInjection.patterns пустое, используются встроенные паттерны (регистронезависимые):

Фраза / шаблон	Regex
ignore (all) previous/prior instructions	`(?i)ignore\s+(all\s+)?(previous\|prior)\s+instructions`
disregard (all) previous/prior instructions	`(?i)disregard\s+(all\s+)?(previous\|prior)\s+instructions`
forget (all) previous/prior instructions	`(?i)forget\s+(all\s+)?(previous\|prior)\s+instructions`
you are now a/an/in …	`(?i)you\s+are\s+now\s+(a\|an\|in)\s+`
jailbreak	`(?i)jailbreak`
system prompt	`(?i)system\s*prompt`
do anything now	`(?i)do\s+anything\s+now`
DAN mode	`(?i)\bDAN\s+mode\b`
reveal (the) system/hidden prompt	`(?i)reveal\s+(the\s+)?(system\|hidden)\s+prompt`

При указании своих паттернов в promptInjection.patterns встроенный набор заменяется списком из правила (по одному regex на строку в UI).

Свои паттерны (`customPatterns`)

Custom regex на шаге Свои паттерны. Действия: block, mask, warn.

Разрешённый синтаксис (RE2): классы символов, квантификаторы, альтернация |, негруппирующие скобки (?:…), якоря ^ $ \b, экранирование.

Запрещено: lookahead (?=…) / (?!…), lookbehind (?<=…) / (?<!…), backreference \1 / \k<name>, паттерны с риском ReDoS вроде (a+)+.

Примеры:

Паттерн	Действие	Сценарий
`PROJ-\d{4,6}`	mask	Коды проектов
`AKIA[0-9A-Z]{16}`	block	AWS access key
`https?://internal\.company\.com\S*`	mask	Внутренние URL

При маскировании замена на [REDACTED]; при блокировке в ошибке — label паттерна или [BLOCKED]. До 100 000 символов на паттерн.

Объединение контент-фильтров

Если на запрос действуют несколько правил с content:

фильтры объединяются (union): email из одного правила и телефон из другого — оба применяются;
при разных действиях для одного типа данных побеждает block над mask над warn;
mode: observe фиксирует срабатывание без блокировки и без маскирования.

Когда запрос блокируется

При срабатывании budget, access, content (block) или rate limit gateway возвращает 403 или 429. Для content-блокировок в теле ошибки указывается причина (тип PII, категория, паттерн). В pipeline metadata (если включена) видны стадии policy / content / rate_limit.

Информационные системы и агенты

У ClientSystem есть kind: system или agent. В интерфейсе — бейджи IS / Agent; в resolver оба остаются tier system.

Персональные и бизнесовые guardrails

Бизнес: бюджеты организации, доступ к моделям, лимиты для production-ключей, группы и участники.
Личный: правила на весь workspace или отдельный ключ без member/virtual_group.

Про RPM/TPM

Ограничения RPM/TPM — модуль rateLimit в PolicyRule. Gateway применяет sliding-window RPM на уровне API-ключа (429, pipeline stage rate_limit). Для счётчиков нужен Redis (REDIS_URL). См. Лимиты и квоты и Policy API.