DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параметров, поддерживающая контекстное окно объемом 1 миллион токенов. Он предназначен для быстрого вывода и высокопроизводительных рабочих нагрузок, сохраняя при этом высокую производительность рассуждений и кодирования. Модель включает гибридное внимание для эффективной обработки длинного контекста. Поддерживаются логические усилия high и xhigh; xhigh соответствует максимальному рассуждению. Он хорошо подходит для таких приложений, как помощники по кодированию, системы чата и рабочие процессы агентов, где важны оперативность и экономическая эффективность.
Провайдеры
Одна и та же модель может быть доступна у разных провайдеров. Маршрутизация выбирает эндпоинт по политике, цене, задержке и доступности.
Нет активных эндпоинтов для этой модели.
Производительность
Пропускная способность — скорость генерации (ток/с, выше лучше). Задержка — полный round-trip (ниже лучше). TTFT — время до первого токена (ниже лучше). Графики разбиты по провайдерам — нажмите expand для деталей.
Пропускная способность
Выше — лучшеЗагрузка…
Задержка
Ниже — лучшеЗагрузка…
E2E задержка
Ниже — лучшеЗагрузка…
TTFT
Ниже — лучшеЗагрузка…
Ошибки tool call
Ниже — лучшеЗагрузка…
Ошибки structured output
Ниже — лучшеЗагрузка…
Тарифы
Базовая цена за миллион токенов. Эффективная цена учитывает prompt caching: повторяющийся контекст тарифицируется по ставке cache_read.
Эффективная цена ввода
Фактическая стоимость prompt + cache_read на миллион токенов.
Ниже — лучшеЗагрузка…
Cache read токены
Доля контекста, прочитанного из кэша провайдера.
Загрузка…
Бенчмарки
Результаты на стандартизированных оценках. Проценты и ранги показывают положение модели среди моделей каталога.
| Arena | Категория | Elo | Win rate | Ранг |
|---|---|---|---|---|
| models | Svg | 1213 | 49.1% | #21 |
| models | 3d | 1273 | 50.2% | #24 |
| models | Gamedev | 1267 | 51.1% | #26 |
| models | Codecategories | 1259 | 50.5% | #29 |
| models | Website | 1254 | 51.3% | #30 |
| models | Asciiart | 1178 | 46.7% | #31 |
| models | Uicomponent | 1223 | 47.0% | #38 |
| models | Dataviz | 1171 | 42.4% | #58 |
Активность
Объём запросов и токенов к модели за последние 7 дней.
Запросы
Число обращений к модели.
Загрузка…
Токены
Prompt и completion суммарно.
Загрузка…
Доступность
Доля успешных ответов за период. Мониторинг эндпоинтов и автоматический fallback при ошибках upstream.
Успешные запросы
Процент ответов без ошибки.
Выше — лучшеЗагрузка…
Быстрый старт
Готовый код для вызова модели. API совместим с OpenAI — достаточно указать base_url LLM Router. Меняется только slug модели: deepseek/deepseek-v4-flash-20260423.
curl -s "https://llmmart.ru/api/v1/v1/chat/completions" \
-H "Authorization: Bearer $LLM_ROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek/deepseek-v4-flash-20260423",
"messages": [
{"role": "user", "content": "Привет!"}
]
}'Нужен API-ключ организации — создайте ключ в личном кабинете или см. инструкцию. Подробнее: первый запрос к модели и примеры SDK.
