MiniMax: MiniMax M3MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст31 мая 2026 г.1.0M context
StepFun: Step 3.7 FlashStep 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст28 мая 2026 г.256K context
Qwen: Qwen3.6 35B A3BQwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
Qwen: Qwen3.6 27BQwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
Google: Gemma 4 26B A4BGemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст3 апр. 2026 г.262K context
Google: Gemma 4 31BGemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст2 апр. 2026 г.262K context
Google: Gemma 4 31B (free)Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст2 апр. 2026 г.262K context
Qwen: Qwen3.5-9BQwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст10 мар. 2026 г.262K context
Qwen: Qwen3.5-35B-A3BQwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-27BМодель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-122B-A10BМодель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5 397B A17BМодель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст16 февр. 2026 г.256K context