DeepSeek: DeepSeek V4 Flash

deepseek/deepseek-v4-flash-20260423

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параметров, поддерживающая контекстное окно объемом 1 миллион токенов. Он предназначен для быстрого вывода и высокопроизводительных рабочих нагрузок, сохраняя при этом высокую производительность рассуждений и кодирования. Модель включает гибридное внимание для эффективной обработки длинного контекста. Поддерживаются логические усилия high и xhigh; xhigh соответствует максимальному рассуждению. Он хорошо подходит для таких приложений, как помощники по кодированию, системы чата и рабочие процессы агентов, где важны оперативность и экономическая эффективность.

Модальности

Цена ввод / вывод

— / —за 1M токенов

Базовая цена за миллион токенов. Эффективная цена учитывает prompt caching: повторяющийся контекст тарифицируется по ставке cache_read.

Ввод (list)—за 1M токенов

Вывод—за 1M токенов

Эффективная цена ввода

Фактическая стоимость prompt + cache_read на миллион токенов.

Ниже — лучше

Загрузка…

Cache read токены

Доля контекста, прочитанного из кэша провайдера.

Загрузка…

Бенчмарки

Результаты на стандартизированных оценках. Проценты и ранги показывают положение модели среди моделей каталога.

Агентные задачи31.1%

Программирование56.2%

Индекс интеллекта40.3%

Arena	Категория	Elo	Win rate	Ранг
models	Svg	1213	49.1%	#21
models	3d	1273	50.2%	#24
models	Gamedev	1267	51.1%	#26
models	Codecategories	1259	50.5%	#29
models	Website	1254	51.3%	#30
models	Asciiart	1178	46.7%	#31
models	Uicomponent	1223	47.0%	#38
models	Dataviz	1171	42.4%	#58

Активность

Объём запросов и токенов к модели за последние 7 дней.

Запросы

Число обращений к модели.

Загрузка…

Токены

Prompt и completion суммарно.

—

Загрузка…

Доступность

Доля успешных ответов за период. Мониторинг эндпоинтов и автоматический fallback при ошибках upstream.

Успешные запросы

Процент ответов без ошибки.

Выше — лучше

Загрузка…

Быстрый старт

Готовый код для вызова модели. API совместим с OpenAI — достаточно указать base_url LLM Router. Меняется только slug модели: deepseek/deepseek-v4-flash-20260423.

curl -s "https://llmmart.ru/api/v1/v1/chat/completions" \
  -H "Authorization: Bearer $LLM_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v4-flash-20260423",
    "messages": [
      {"role": "user", "content": "Привет!"}
    ]
  }'

Нужен API-ключ организации — создайте ключ в личном кабинете или см. инструкцию. Подробнее: первый запрос к модели и примеры SDK.

DeepSeek: DeepSeek V4 Flash

Провайдеры

Производительность

Пропускная способность

Задержка

E2E задержка

TTFT

Ошибки tool call

Ошибки structured output

Тарифы

Эффективная цена ввода

Cache read токены

Бенчмарки

Активность

Запросы

Токены

Доступность

Успешные запросы

Быстрый старт

Ещё модели от Deepseek

DeepSeek: DeepSeek V4 Pro

DeepSeek: DeepSeek V3.2

DeepSeek: DeepSeek V3.2 Exp

DeepSeek: DeepSeek V3.1 Terminus

DeepSeek: DeepSeek V3.1

DeepSeek: R1 0528

DeepSeek: DeepSeek V3 0324

DeepSeek: R1 Distill Llama 70B

DeepSeek: R1

DeepSeek: DeepSeek V3