OpenAI: o4 Mini High

openai/o4-mini-high-2025-04-16

OpenAI o4-mini-high — это та же модель, что и o4-mini, с высоким значением Reasoning_effort. OpenAI o4-mini — это компактная модель рассуждения серии o, оптимизированная для быстрой и экономичной работы, сохраняющая при этом сильные мультимодальные и агентные возможности. Он поддерживает использование инструментов и демонстрирует производительность конкурентного рассуждения и кодирования в таких тестах, как AIME (99,5% с Python) и SWE-bench, превосходя своего предшественника o3-mini и даже приближаясь к o3 в некоторых областях. Несмотря на меньший размер, o4-mini демонстрирует высокую точность в задачах STEM, визуальном решении задач (например, MathVista, MMMU) и редактировании кода. Он особенно хорошо подходит для сценариев с высокой пропускной способностью, где задержка или стоимость имеют решающее значение. Благодаря эффективной архитектуре и усовершенствованному обучению с подкреплением o4-mini может объединять инструменты, генерировать структурированные результаты и решать многоэтапные задачи с минимальной задержкой — часто менее чем за минуту.

Модальности

Цена ввод / вывод

— / —за 1M токенов

Контекст200K

Релиз16 апр. 2025 г.

Провайдеры

Одна и та же модель может быть доступна у разных провайдеров. Маршрутизация выбирает эндпоинт по политике, цене, задержке и доступности.

Нет активных эндпоинтов для этой модели.

Производительность

Пропускная способность — скорость генерации (ток/с, выше лучше). Задержка — полный round-trip (ниже лучше). TTFT — время до первого токена (ниже лучше). Графики разбиты по провайдерам — нажмите expand для деталей.

Пропускная способность—лучший провайдер

Задержка—P50, лучший провайдер

Регион

Период

Пропускная способность

Выше — лучше

Загрузка…

Задержка

Ниже — лучше

Загрузка…

E2E задержка

Ниже — лучше

Загрузка…

TTFT

Ниже — лучше

Загрузка…

Ошибки tool call

Ниже — лучше

Загрузка…

Ошибки structured output

Ниже — лучше

Загрузка…

Тарифы

Базовая цена за миллион токенов. Эффективная цена учитывает prompt caching: повторяющийся контекст тарифицируется по ставке cache_read.

Ввод (list)—за 1M токенов

Вывод—за 1M токенов

Эффективная цена ввода

Фактическая стоимость prompt + cache_read на миллион токенов.

Ниже — лучше

Загрузка…

Cache read токены

Доля контекста, прочитанного из кэша провайдера.

Загрузка…

Бенчмарки

Для этой модели пока нет опубликованных результатов бенчмарков.

Активность

Объём запросов и токенов к модели за последние 7 дней.

Запросы

Число обращений к модели.

Загрузка…

Токены

Prompt и completion суммарно.

—

Загрузка…

Доступность

Доля успешных ответов за период. Мониторинг эндпоинтов и автоматический fallback при ошибках upstream.

Успешные запросы

Процент ответов без ошибки.

Выше — лучше

Загрузка…

Быстрый старт

Готовый код для вызова модели. API совместим с OpenAI — достаточно указать base_url LLM Router. Меняется только slug модели: openai/o4-mini-high-2025-04-16.

curl -s "https://llmmart.ru/api/v1/v1/chat/completions" \
  -H "Authorization: Bearer $LLM_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/o4-mini-high-2025-04-16",
    "messages": [
      {"role": "user", "content": "Привет!"}
    ]
  }'

Нужен API-ключ организации — создайте ключ в личном кабинете или см. инструкцию. Подробнее: первый запрос к модели и примеры SDK.

OpenAI: o4 Mini High

Провайдеры

Производительность

Пропускная способность

Задержка

E2E задержка

TTFT

Ошибки tool call

Ошибки structured output

Тарифы

Эффективная цена ввода

Cache read токены

Бенчмарки

Активность

Запросы

Токены

Доступность

Успешные запросы

Быстрый старт

Ещё модели от Openai

OpenAI: GPT Image 2

OpenAI: GPT Image 1

OpenAI: GPT Image 1 Mini

OpenAI: GPT Chat Latest

OpenAI: GPT-4o Mini Transcribe

OpenAI: Whisper Large V3

OpenAI: Whisper Large V3 Turbo

OpenAI: Whisper 1

OpenAI: GPT-4o Transcribe

OpenAI: GPT-5.5 Pro

OpenAI: GPT-5.5

OpenAI: GPT-5.4 Image 2