Z.ai: GLM 5.2GLM 5.2 — это крупномасштабная модель рассуждения от Z.ai. Он поддерживает ввод и вывод текста с помощью контекстного окна с токеном 1M и подходит для долгосрочных рабочих процессо…Вход: Текст→Выход: Текст16 июн. 2026 г.1.0M context
MoonshotAI: Kimi K2.7 CodeMoonshotAI: Kimi K2.7 Code — это ориентированная на кодирование модель семейства Kimi K2 от Moonshot AI, созданная для надежного выполнения сквозных задач программирования в длител…Вход: ТекстВход: Изображения→Выход: Текст12 июн. 2026 г.262K context
Nex AGI: Nex-N2-ProNex-N2-Pro — это агентская смешанная модель экспертов от Nex AGI с 17B активных параметров из 397B. Построенный на архитектуре Qwen3.5, он принимает ввод текста и изображений и про…Вход: ТекстВход: Изображения→Выход: Текст8 июн. 2026 г.262K context
MiniMax: MiniMax M3MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст31 мая 2026 г.1.0M context
StepFun: Step 3.7 FlashStep 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст28 мая 2026 г.256K context
IBM: Granite 4.1 8BGranite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров, состоящая только из декодера, от IBM, входящая в семейство Granite 4.1. Он поддерживает контекстное окно ра…Вход: Текст→Выход: Текст30 апр. 2026 г.131K context
MoonshotAI Kimi LatestЭта модель всегда перенаправляет на последнюю модель семейства MoonshotAI Kimi.Вход: ТекстВход: Изображения→Выход: Текст27 апр. 2026 г.262K context
Qwen: Qwen3.6 35B A3BQwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
Qwen: Qwen3.6 27BQwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
DeepSeek: DeepSeek V4 ProDeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общими параметрами 1,6T и активированными параметрами 49B, поддерживающая контекстное окно объемом 1M…Вход: Текст→Выход: Текст24 апр. 2026 г.1.0M context
DeepSeek: DeepSeek V4 FlashDeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параме…Вход: Текст→Выход: Текст24 апр. 2026 г.1.0M context
inclusionAI: Ling-2.6-1TLing-2.6-1T — это модель мгновенного выполнения (инструктирования) от InclusionAI и флагмана компании с триллионом параметров, предназначенная для реальных агентов, которым требует…Вход: Текст→Выход: Текст23 апр. 2026 г.262K context
Xiaomi: MiMo-V2.5-ProMiMo-V2.5-Pro — это флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентских возможностях, сложной разработке программного обеспечения и долгосрочны…Вход: Текст→Выход: Текст22 апр. 2026 г.1.0M context
Xiaomi: MiMo-V2.5MiMo-V2.5 — это родная омнимодальная модель от Xiaomi. Он обеспечивает агентную производительность профессионального уровня примерно за половину стоимости вывода, превосходя при эт…Вход: ТекстВход: АудиоВход: ИзображенияВход: Видео→Выход: Текст22 апр. 2026 г.1.0M context
inclusionAI: Ling-2.6-flashLing-2.6-flash — это модель мгновенного реагирования (инструктирования) от InclusionAI с общим числом параметров 104 млрд и активными параметрами 7,4 млрд, предназначенная для реал…Вход: Текст→Выход: Текст21 апр. 2026 г.262K context
MoonshotAI: Kimi K2.6Kimi K2.6 — это мультимодальная модель следующего поколения Moonshot AI, предназначенная для долгосрочного кодирования, генерации UI/UX на основе кодирования и многоагентной оркест…Вход: ТекстВход: Изображения→Выход: Текст20 апр. 2026 г.262K context
Z.ai: GLM 5.1GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, особенно значительные преимущества в решении долгосрочных задач. В отличие от предыдущих моделей, построенных н…Вход: Текст→Выход: Текст7 апр. 2026 г.203K context
Google: Gemma 4 26B A4BGemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст3 апр. 2026 г.262K context
Google: Gemma 4 31BGemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст2 апр. 2026 г.262K context
Kwaipilot: KAT-Coder-Pro V2KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для разработки сложного программного обеспечения корпоративного уровня и инт…Вход: Текст→Выход: Текст27 мар. 2026 г.256K context
Reka EdgeReka Edge — это чрезвычайно эффективная мультимодальная модель визуального языка 7B, которая принимает входные изображения/видео+текст и генерирует текстовые выходные данные. Эта м…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст20 мар. 2026 г.16K context
MiniMax: MiniMax M2.7MiniMax-M2.7 — это модель большого языка нового поколения, предназначенная для автономной, реальной производительности и постоянного совершенствования. Созданный для активного учас…Вход: Текст→Выход: Текст18 мар. 2026 г.205K context
NVIDIA: Nemotron 3 SuperNVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 битами параметров, активирующая всего 12 миллиардов параметров для максимальной эффективности и точности вычислен…Вход: Текст→Выход: Текст11 мар. 2026 г.1M context
Qwen: Qwen3.5-9BQwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст10 мар. 2026 г.262K context
Qwen: Qwen3.5-35B-A3BQwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-27BМодель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-122B-A10BМодель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5 397B A17BМодель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст16 февр. 2026 г.256K context
MiniMax: MiniMax M2.5MiniMax-M2.5 — это большая языковая модель SOTA, предназначенная для реальной производительности. Обученный в различных сложных реальных цифровых рабочих средах, M2.5 опирается на…Вход: Текст→Выход: Текст12 февр. 2026 г.205K context
Z.ai: GLM 5GLM-5 — это флагманская базовая модель Z.ai с открытым исходным кодом, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданный для опытн…Вход: Текст→Выход: Текст11 февр. 2026 г.203K context
Qwen: Qwen3 Coder NextQwen3-Coder-Next — это причинно-следственная языковая модель с открытым весом, оптимизированная для агентов кодирования и рабочих процессов локальной разработки. Он использует разр…Вход: Текст→Выход: Текст4 февр. 2026 г.262K context
MoonshotAI: Kimi K2.5Kimi K2.5 — это собственная мультимодальная модель Moonshot AI, обеспечивающая современные возможности визуального кодирования и парадигму самостоятельного роя агентов. Созданный н…Вход: ТекстВход: Изображения→Выход: Текст27 янв. 2026 г.262K context
Z.ai: GLM 4.7 FlashМодель GLM-4.7-Flash, являющаяся моделью SOTA класса 30B, предлагает новую опцию, которая сочетает в себе производительность и эффективность. Он дополнительно оптимизирован для сце…Вход: Текст→Выход: Текст19 янв. 2026 г.203K context
Z.ai: GLM 4.7GLM-4.7 — новейшая флагманская модель Z.ai, в которой реализованы обновления в двух ключевых областях: расширенные возможности программирования и более стабильное многоэтапное расс…Вход: Текст→Выход: Текст22 дек. 2025 г.203K context
NVIDIA: Nemotron 3 Nano 30B A3BNVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, позволяющая разработчикам создавать специализированные аг…Вход: Текст→Выход: Текст14 дек. 2025 г.262K context
Arcee AI: Trinity MiniTrinity Mini — это языковая модель с разреженной смесью экспертов с 26B параметрами (3B активных), включающая 128 экспертов, по 8 активных на каждый токен. Разработан для эффективн…Вход: Текст→Выход: Текст1 дек. 2025 г.131K context
DeepSeek: DeepSeek V3.2DeepSeek-V3.2 — это большая языковая модель, предназначенная для сочетания высокой вычислительной эффективности с сильными рассуждениями и производительностью использования агентск…Вход: Текст→Выход: Текст1 дек. 2025 г.131K context
MoonshotAI: Kimi K2 ThinkingKimi K2 Thinking — это самая продвинутая на сегодняшний день модель открытого рассуждения Moonshot AI, расширяющая серию K2 до агентного долгосрочного рассуждения. Построенный на а…Вход: Текст→Выход: Текст6 нояб. 2025 г.262K context
MiniMax: MiniMax M2MiniMax-M2 — это компактная, высокоэффективная модель большого языка, оптимизированная для сквозного кодирования и агентных рабочих процессов. Благодаря 10 миллиардам активированны…Вход: Текст→Выход: Текст23 окт. 2025 г.205K context
IBM: Granite 4.0 MicroГранит-4.0-Н-Микро — параметр 3В из семейства моделей Гранит 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они точно настроены для длинного контекстного вызова…Вход: Текст→Выход: Текст20 окт. 2025 г.131K context
Microsoft: Phi 4 Mini InstructPhi-4-mini-instruct — это легкая открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах, с упором на высококачественные и аргументированные…Вход: Текст→Выход: Текст17 окт. 2025 г.131K context
Qwen: Qwen3 VL 8B InstructQwen3-VL-8B-Instruct — это мультимодальная модель языка видения из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения текста, изображений и видео. Он обеспечивает…Вход: ИзображенияВход: Текст→Выход: Текст14 окт. 2025 г.256K context
Qwen: Qwen3 VL 30B A3B ThinkingQwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант мышления улучшает мышлен…Вход: ТекстВход: Изображения→Выход: Текст6 окт. 2025 г.131K context
Qwen: Qwen3 VL 30B A3B InstructQwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант Instruct оптимизирует сл…Вход: ТекстВход: Изображения→Выход: Текст6 окт. 2025 г.262K context
DeepSeek: DeepSeek V3.2 ExpDeepSeek-V3.2-Exp — это экспериментальная модель большого языка, выпущенная DeepSeek как промежуточный этап между V3.1 и будущими архитектурами. Он представляет DeepSeek Sparse Att…Вход: Текст→Выход: Текст29 сент. 2025 г.164K context
TheDrummer: Cydonia 24B V4.1Модель творческого письма без цензуры на основе Mistral Small 3.2 24B с хорошей запоминаемостью, быстрым соблюдением правил и интеллектом.Вход: Текст→Выход: Текст27 сент. 2025 г.131K context
Qwen: Qwen3 VL 235B A22B ThinkingQwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель мышления оптимизирована для…Вход: ТекстВход: Изображения→Выход: Текст23 сент. 2025 г.131K context
Qwen: Qwen3 VL 235B A22B InstructQwen3-VL-235B-A22B Instruct — это мультимодальная модель с открытым весом, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель Instruct ор…Вход: ТекстВход: Изображения→Выход: Текст23 сент. 2025 г.262K context
Qwen: Qwen3 Next 80B A3B ThinkingQwen3-Next-80B-A3B-Thinking — это модель чата, основанная на рассуждениях, в линейке Qwen3-Next, которая по умолчанию выводит структурированные следы «мышления». Он предназначен дл…Вход: Текст→Выход: Текст11 сент. 2025 г.262K context
Qwen: Qwen3 Next 80B A3B InstructQwen3-Next-80B-A3B-Instruct — это настроенная на инструкции модель чата из серии Qwen3-Next, оптимизированная для быстрых и стабильных ответов без следов «думания». Он предназначен…Вход: Текст→Выход: Текст11 сент. 2025 г.262K context
Qwen: Qwen3 30B A3B Thinking 2507Qwen3-30B-A3B-Thinking-2507 — это модель рассуждения «Смесь экспертов» с 30 параметрами, оптимизированная для сложных задач, требующих расширенного многоэтапного мышления. Модель р…Вход: Текст→Выход: Текст28 авг. 2025 г.131K context
DeepSeek: DeepSeek V3.1DeepSeek-V3.1 — это большая гибридная модель рассуждения (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и режимы без мышления с помощью шаблонов под…Вход: Текст→Выход: Текст21 авг. 2025 г.164K context
OpenAI: gpt-oss-120bgpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
OpenAI: gpt-oss-20bgpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
Qwen: Qwen3 Coder 30B A3B InstructQwen3-Coder-30B-A3B-Instruct — это модель Mixture of Experts (MoE) с 30,5 млрд параметров со 128 экспертами (8 активных на каждый прямой проход), предназначенная для расширенной ге…Вход: Текст→Выход: Текст31 июл. 2025 г.160K context
Qwen: Qwen3 30B A3B Instruct 2507Qwen3-30B-A3B-Instruct-2507 — это языковая модель смешанного типа экспертов от Qwen с 30,5 млрд параметров и 3,3 млрд активных параметров на вывод. Он работает в режиме «без мышлен…Вход: Текст→Выход: Текст29 июл. 2025 г.131K context
Qwen: Qwen3 235B A22B Thinking 2507Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель с открытой массой экспертов (MoE), оптимизированная для сложных задач рассуждения. Он активирует 22B из 2…Вход: Текст→Выход: Текст25 июл. 2025 г.262K context
Qwen: Qwen3 Coder 480B A35BQwen3-Coder-480B-A35B-Instruct — это модель генерации кода с участием экспертов (MoE), разработанная командой Qwen. Он оптимизирован для задач агентного кодирования, таких как вызо…Вход: Текст→Выход: Текст23 июл. 2025 г.1.0M context
ByteDance: UI-TARS 7BUI-TARS-1.5 — это мультимодальный агент языка видения, оптимизированный для сред на основе графического пользовательского интерфейса, включая интерфейсы настольных компьютеров, веб…Вход: ИзображенияВход: Текст→Выход: Текст22 июл. 2025 г.128K context
Qwen: Qwen3 235B A22B Instruct 2507Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на команды языковая модель смешанного уровня экспертов, основанная на архитектуре Qwen3-235B, с 22B активных параметро…Вход: Текст→Выход: Текст21 июл. 2025 г.262K context
Mistral: Mistral Small 3.2 24BMistral-Small-3.2-24B-Instruct-2506 — это обновленная модель параметров 24B от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшенного вызова функ…Вход: ИзображенияВход: Текст→Выход: Текст20 июн. 2025 г.128K context
DeepSeek: R1 052828 мая обновление исходной версии DeepSeek R1 Performance, аналогичной OpenAI o1, но с открытым исходным кодом и с полностью открытыми токенами рассуждений. Его размер составляет 6…Вход: Текст→Выход: Текст28 мая 2025 г.164K context
Qwen: Qwen3 30B A3BQwen3, последнее поколение в серии больших языковых моделей Qwen, имеет как плотную архитектуру, так и архитектуру со смешанным участием экспертов (MoE), позволяющую добиться прево…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Qwen: Qwen3 14BQwen3-14B — это плотная причинно-языковая модель с 14,8 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает…Вход: Текст→Выход: Текст28 апр. 2025 г.132K context
Qwen: Qwen3 32BQwen3-32B — это плотная причинно-языковая модель с 32,8 млрд параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Он поддерживае…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Meta: Llama 4 MaverickLlama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре смешанных экспертов (MoE) со 128 экспертами и…Вход: ТекстВход: Изображения→Выход: Текст5 апр. 2025 г.1.0M context
Mistral: Mistral Small 3.1 24BMistral Small 3.1 24B Instruct — это модернизированный вариант Mistral Small 3 (2501), обладающий 24 миллиардами параметров и расширенными мультимодальными возможностями. Он обеспе…Вход: ТекстВход: Изображения→Выход: Текст17 мар. 2025 г.128K context
Google: Gemma 3 27BGemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…Вход: ТекстВход: Изображения→Выход: Текст12 мар. 2025 г.131K context
TheDrummer: Skyfall 36B V2Skyfall 36B v2 — это улучшенная версия Mistral Small 2501, специально настроенная для улучшения творческих способностей, детального письма, ролевой игры и связного повествования.Вход: Текст→Выход: Текст10 мар. 2025 г.33K context
Qwen: Qwen2.5 VL 72B InstructQwen2.5-VL умеет распознавать обычные объекты, такие как цветы, птицы, рыбы и насекомые. Он также способен анализировать тексты, диаграммы, значки, графику и макеты изображений.Вход: ТекстВход: Изображения→Выход: Текст1 февр. 2025 г.131K context
Meta: Llama 3.3 70B InstructМногоязычная модель большого языка (LLM) Meta Llama 3.3 представляет собой предварительно обученную и настроенную генеративную модель в 70B (ввод/вывод текста). Модель Llama 3.3, н…Вход: Текст→Выход: Текст6 дек. 2024 г.131K context
Magnum v4 72BЭто серия моделей, призванных воспроизвести прозаическое качество моделей Claude 3, в частности Sonnet (https://openrouter.ai/anthropic/claude-3.5-sonnet (открывается в новой вклад…Вход: Текст→Выход: Текст22 окт. 2024 г.33K context
Qwen: Qwen2.5 7B InstructQwen2.5 7B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области код…Вход: Текст→Выход: Текст16 окт. 2024 г.131K context
Meta: Llama 3.2 3B InstructLlama 3.2 3B — это многоязычная модель большого языка с 3 миллиардами параметров, оптимизированная для сложных задач обработки естественного языка, таких как генерация диалогов, ра…Вход: Текст→Выход: Текст25 сент. 2024 г.131K context
Meta: Llama 3.1 70B InstructПоследний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 70B, настроенная на инструкции, оптимизирована для использования в диалогах высокого…Вход: Текст→Выход: Текст23 июл. 2024 г.131K context
Meta: Llama 3.1 8B InstructПоследний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 8B, настроенная по инструкциям, быстрая и эффективная. Он продемонстрировал высокие…Вход: Текст→Выход: Текст23 июл. 2024 г.131K context
Mistral: Mistral NemoМодель с параметрами 12B и длиной контекста токена 128 тыс., созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна и поддерживает английский, французский, немецкий, испа…Вход: Текст→Выход: Текст19 июл. 2024 г.131K context
Mancer: Weaver (alpha)Попытка воссоздать многословие в стиле Клода, но не ожидайте такого же уровня связности или памяти. Предназначен для использования в ролевых/повествовательных ситуациях.Вход: Текст→Выход: Текст2 авг. 2023 г.8K context
ReMM SLERP 13BПробная версия оригинального MythoMax-L2-B13, но с обновленными моделями. #слияниеВход: Текст→Выход: Текст22 июл. 2023 г.6K context
MythoMax 13BОдна из самых эффективных и популярных доработок Llama 2 13B с богатыми описаниями и ролевыми играми. #слияниеВход: Текст→Выход: Текст2 июл. 2023 г.4K context