Google: Gemini 3.5 Flash

google/gemini-3.5-flash-20260519

Модальности

Цена ввод / вывод

— / —за 1M токенов

Контекст1.0M

Релиз19 мая 2026 г.

Провайдеры

Одна и та же модель может быть доступна у разных провайдеров. Маршрутизация выбирает эндпоинт по политике, цене, задержке и доступности.

Нет активных эндпоинтов для этой модели.

Производительность

Пропускная способность — скорость генерации (ток/с, выше лучше). Задержка — полный round-trip (ниже лучше). TTFT — время до первого токена (ниже лучше). Графики разбиты по провайдерам — нажмите expand для деталей.

Пропускная способность—лучший провайдер

Задержка—P50, лучший провайдер

Регион

Период

Пропускная способность

Выше — лучше

Загрузка…

Задержка

Ниже — лучше

Загрузка…

E2E задержка

Ниже — лучше

Загрузка…

TTFT

Ниже — лучше

Загрузка…

Ошибки tool call

Ниже — лучше

Загрузка…

Ошибки structured output

Ниже — лучше

Загрузка…

Тарифы

Базовая цена за миллион токенов. Эффективная цена учитывает prompt caching: повторяющийся контекст тарифицируется по ставке cache_read.

Ввод (list)—за 1M токенов

Вывод—за 1M токенов

Эффективная цена ввода

Фактическая стоимость prompt + cache_read на миллион токенов.

Ниже — лучше

Загрузка…

Cache read токены

Доля контекста, прочитанного из кэша провайдера.

Загрузка…

Бенчмарки

Результаты на стандартизированных оценках. Проценты и ранги показывают положение модели среди моделей каталога.

Агентные задачи37.4%

Программирование70.1%

Индекс интеллекта50.2%

Arena	Категория	Elo	Win rate	Ранг
agents	Mobileapps	1261	57.0%	#2
agents	Agenticgamedev	1217	55.1%	#3
agents	Agenticslides(Python-Pptx)	1242	57.8%	#3
agents	Pptxslides	1244	57.7%	#3
models	Asciiart	1316	62.9%	#3
models	Svg	1309	63.3%	#3
agents	Agenticslides	1244	57.5%	#4
agents	Python-Pptxslides	1247	57.4%	#4
agents	Webapps	1262	54.5%	#5
agents	Androidnative	1260	55.2%	#6
agents	Fullstack	1270	58.5%	#6
agents	Agentichtmlslides	1162	45.8%	#7
agents	Agenticslides(Html)	1162	45.7%	#7
agents	Htmlslides	1184	48.9%	#9
models	Gamedev	1325	58.5%	#9
models	Uicomponent	1317	60.6%	#11
models	Codecategories	1304	58.3%	#13
models	Website	1296	57.2%	#14
models	3d	1313	60.7%	#15
models	Dataviz	1266	55.3%	#24

Активность

Объём запросов и токенов к модели за последние 7 дней.

Запросы

Число обращений к модели.

Загрузка…

Токены

Prompt и completion суммарно.

—

Загрузка…

Доступность

Доля успешных ответов за период. Мониторинг эндпоинтов и автоматический fallback при ошибках upstream.

Успешные запросы

Процент ответов без ошибки.

Выше — лучше

Загрузка…

Быстрый старт

Готовый код для вызова модели. API совместим с OpenAI — достаточно указать base_url LLM Router. Меняется только slug модели: google/gemini-3.5-flash-20260519.

curl -s "https://llmmart.ru/api/v1/v1/chat/completions" \
  -H "Authorization: Bearer $LLM_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-3.5-flash-20260519",
    "messages": [
      {"role": "user", "content": "Привет!"}
    ]
  }'

Нужен API-ключ организации — создайте ключ в личном кабинете или см. инструкцию. Подробнее: первый запрос к модели и примеры SDK.

Ещё модели от Google

Все модели (36)

Google: Gemini 3.5 Flash

Провайдеры

Производительность

Пропускная способность

Задержка

E2E задержка

TTFT

Ошибки tool call

Ошибки structured output

Тарифы

Эффективная цена ввода

Cache read токены

Бенчмарки

Активность

Запросы

Токены

Доступность

Успешные запросы

Быстрый старт

Ещё модели от Google

Google: Nano Banana 2 (Gemini 3.1 Flash Image)

Google: Nano Banana Pro (Gemini 3 Pro Image)

Google: Gemini Embedding 2

Google: Gemini 3.1 Flash Lite

Google: Chirp 3

Google: Gemini 3.1 Flash TTS Preview

Google: Veo 3.1 Fast

Google: Veo 3.1 Lite

Google: Gemini Embedding 2 Preview

Google: Gemma 4 26B A4B

Google: Gemma 4 26B A4B (free)

Google: Gemma 4 31B