Google

Google: Gemini 3.5 Flash

google/gemini-3.5-flash-20260519

Модальности
Вход: ТекстВход: ИзображенияВход: ВидеоВход: ФайлВход: Аудио
Выход: Текст
Цена ввод / вывод
/ за 1M токенов
Контекст1.0M
Релиз19 мая 2026 г.

Провайдеры

Одна и та же модель может быть доступна у разных провайдеров. Маршрутизация выбирает эндпоинт по политике, цене, задержке и доступности.

Нет активных эндпоинтов для этой модели.

Производительность

Пропускная способность — скорость генерации (ток/с, выше лучше). Задержка — полный round-trip (ниже лучше). TTFT — время до первого токена (ниже лучше). Графики разбиты по провайдерам — нажмите expand для деталей.

Пропускная способностьлучший провайдер
ЗадержкаP50, лучший провайдер

Пропускная способность

Выше — лучше

Загрузка…

Задержка

Ниже — лучше

Загрузка…

E2E задержка

Ниже — лучше

Загрузка…

TTFT

Ниже — лучше

Загрузка…

Ошибки tool call

Ниже — лучше

Загрузка…

Ошибки structured output

Ниже — лучше

Загрузка…

Тарифы

Базовая цена за миллион токенов. Эффективная цена учитывает prompt caching: повторяющийся контекст тарифицируется по ставке cache_read.

Ввод (list)за 1M токенов
Выводза 1M токенов

Эффективная цена ввода

Фактическая стоимость prompt + cache_read на миллион токенов.

Ниже — лучше

Загрузка…

Cache read токены

Доля контекста, прочитанного из кэша провайдера.

Загрузка…

Бенчмарки

Результаты на стандартизированных оценках. Проценты и ранги показывают положение модели среди моделей каталога.

Агентные задачи37.4%
Программирование70.1%
Индекс интеллекта50.2%
ArenaКатегорияEloWin rateРанг
agentsMobileapps126157.0%#2
agentsAgenticgamedev121755.1%#3
agentsAgenticslides(Python-Pptx)124257.8%#3
agentsPptxslides124457.7%#3
modelsAsciiart131662.9%#3
modelsSvg130963.3%#3
agentsAgenticslides124457.5%#4
agentsPython-Pptxslides124757.4%#4
agentsWebapps126254.5%#5
agentsAndroidnative126055.2%#6
agentsFullstack127058.5%#6
agentsAgentichtmlslides116245.8%#7
agentsAgenticslides(Html)116245.7%#7
agentsHtmlslides118448.9%#9
modelsGamedev132558.5%#9
modelsUicomponent131760.6%#11
modelsCodecategories130458.3%#13
modelsWebsite129657.2%#14
models3d131360.7%#15
modelsDataviz126655.3%#24

Активность

Объём запросов и токенов к модели за последние 7 дней.

Запросы

Число обращений к модели.

Загрузка…

Токены

Prompt и completion суммарно.

Загрузка…

Доступность

Доля успешных ответов за период. Мониторинг эндпоинтов и автоматический fallback при ошибках upstream.

Успешные запросы

Процент ответов без ошибки.

Выше — лучше

Загрузка…

Быстрый старт

Готовый код для вызова модели. API совместим с OpenAI — достаточно указать base_url LLM Router. Меняется только slug модели: google/gemini-3.5-flash-20260519.

curl -s "https://llmmart.ru/api/v1/v1/chat/completions" \
  -H "Authorization: Bearer $LLM_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-3.5-flash-20260519",
    "messages": [
      {"role": "user", "content": "Привет!"}
    ]
  }'

Нужен API-ключ организации — создайте ключ в личном кабинете или см. инструкцию. Подробнее: первый запрос к модели и примеры SDK.

Ещё модели от Google

Все модели (36)
Google: Gemini 3.5 Flash — цены и детали API | LLM Router