Qwen

Qwen: Qwen3 Next 80B A3B Instruct

qwen/qwen3-next-80b-a3b-instruct-2509

Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции модель чата из серии Qwen3-Next, оптимизированная для быстрых и стабильных ответов без следов «думания». Он предназначен для решения сложных задач, связанных с рассуждениями, генерацией кода, контролем качества знаний и многоязычным использованием, сохраняя при этом надежность в согласовании и форматировании. По сравнению с предыдущими вариантами инструкций Qwen3, он ориентирован на более высокую пропускную способность и стабильность при сверхдлинных входных данных и многоходовых диалогах, что делает его хорошо подходящим для RAG, использования инструментов и агентских рабочих процессов, которые требуют последовательных окончательных ответов, а не видимой цепочки мыслей. Модель использует эффективное масштабирование обучения и декодирования для повышения эффективности параметров и скорости вывода. Модель была проверена на широком наборе общедоступных тестов, где она достигает или приближается к более крупным системам Qwen3 в нескольких категориях, превосходя при этом более ранние базовые показатели среднего размера. Его лучше всего использовать в качестве общего помощника, помощника по коду и средства решения задач с длинным контекстом в производственных условиях, где предпочтительны детерминированные выходные данные, следующие инструкциям.

Модальности
Вход: Текст
Выход: Текст
Цена ввод / вывод
Тарифы уточняются
Контекст262K
Релиз11 сент. 2025 г.

Провайдеры

Одна и та же модель может быть доступна у разных провайдеров. Маршрутизация выбирает эндпоинт по политике, цене, задержке и доступности.

Нет активных эндпоинтов для этой модели.

Производительность

Пропускная способность — скорость генерации (ток/с, выше лучше). Задержка — полный round-trip (ниже лучше). TTFT — время до первого токена (ниже лучше). Графики разбиты по провайдерам — нажмите expand для деталей.

Пропускная способностьлучший провайдер
ЗадержкаP50, лучший провайдер

Тарифы

Базовая цена за миллион токенов. Эффективная цена учитывает prompt caching: повторяющийся контекст тарифицируется по ставке cache_read.

Тарифы появятся после подключения провайдеров.

Бенчмарки

Для этой модели пока нет опубликованных результатов бенчмарков.

Активность

Объём запросов и токенов к модели за последние 7 дней.

Доступность

Доля успешных ответов за период. Мониторинг эндпоинтов и автоматический fallback при ошибках upstream.

Быстрый старт

Готовый код для вызова модели. API совместим с OpenAI — достаточно указать base_url LLM Mart. Меняется только slug модели: qwen/qwen3-next-80b-a3b-instruct-2509.

curl -s "https://llmmart.ru/api/v1/v1/chat/completions" \
  -H "Authorization: Bearer $LLM_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-next-80b-a3b-instruct-2509",
    "messages": [
      {"role": "user", "content": "Привет!"}
    ]
  }'

Нужен API-ключ организации — создайте ключ в личном кабинете или см. инструкцию. Подробнее: первый запрос к модели и примеры SDK.

Ещё модели от Qwen

Все модели (52)
Qwen: Qwen3 Next 80B A3B Instruct — цены и детали API | LLM Mart