Sentence Transformers: multi-qa-mpnet-base-dot-v1
sentence-transformers/multi-qa-mpnet-base-dot-v1-20251117
sentence-transformers/multi-qa-mpnet-base-dot-v1-20251117
Одна и та же модель может быть доступна у разных провайдеров. Маршрутизация выбирает эндпоинт по политике, цене, задержке и доступности.
Нет активных эндпоинтов для этой модели.
Пропускная способность — скорость генерации (ток/с, выше лучше). Задержка — полный round-trip (ниже лучше). TTFT — время до первого токена (ниже лучше). Графики разбиты по провайдерам — нажмите expand для деталей.
Загрузка…
Загрузка…
Загрузка…
Загрузка…
Загрузка…
Загрузка…
Базовая цена за миллион токенов. Эффективная цена учитывает prompt caching: повторяющийся контекст тарифицируется по ставке cache_read.
Фактическая стоимость prompt + cache_read на миллион токенов.
Ниже — лучшеЗагрузка…
Доля контекста, прочитанного из кэша провайдера.
Загрузка…
Для этой модели пока нет опубликованных результатов бенчмарков.
Объём запросов и токенов к модели за последние 7 дней.
Число обращений к модели.
Загрузка…
Prompt и completion суммарно.
Загрузка…
Доля успешных ответов за период. Мониторинг эндпоинтов и автоматический fallback при ошибках upstream.
Процент ответов без ошибки.
Выше — лучшеЗагрузка…
Готовый код для вызова модели. API совместим с OpenAI — достаточно указать base_url LLM Router. Меняется только slug модели: sentence-transformers/multi-qa-mpnet-base-dot-v1-20251117.
curl -s "https://llmmart.ru/api/v1/v1/chat/completions" \
-H "Authorization: Bearer $LLM_ROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "sentence-transformers/multi-qa-mpnet-base-dot-v1-20251117",
"messages": [
{"role": "user", "content": "Привет!"}
]
}'Нужен API-ключ организации — создайте ключ в личном кабинете или см. инструкцию. Подробнее: первый запрос к модели и примеры SDK.