Каталог моделей

MiniMax: MiniMax M3

MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…

31 мая 2026 г.1.0M context

StepFun: Step 3.7 Flash

Step 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…

28 мая 2026 г.256K context

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…

27 апр. 2026 г.262K context

Qwen: Qwen3.6 27B

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…

27 апр. 2026 г.262K context

Google: Gemma 4 26B A4B

Gemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…

3 апр. 2026 г.262K context

Google: Gemma 4 31B

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…

2 апр. 2026 г.262K context

Google: Gemma 4 31B (free)

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…

2 апр. 2026 г.262K context

Qwen: Qwen3.5-9B

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…

10 мар. 2026 г.262K context

Qwen: Qwen3.5-35B-A3B

Qwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-27B

Модель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-122B-A10B

Модель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…

25 февр. 2026 г.262K context

Qwen: Qwen3.5 397B A17B

Модель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…

16 февр. 2026 г.256K context