Каталог моделей

Z.ai: GLM 5.2

GLM 5.2 — это крупномасштабная модель рассуждения от Z.ai. Он поддерживает ввод и вывод текста с помощью контекстного окна с токеном 1M и подходит для долгосрочных рабочих процессо…

16 июн. 2026 г.1.0M context

MoonshotAI: Kimi K2.7 Code

MoonshotAI: Kimi K2.7 Code — это ориентированная на кодирование модель семейства Kimi K2 от Moonshot AI, созданная для надежного выполнения сквозных задач программирования в длител…

12 июн. 2026 г.262K context

Nex AGI: Nex-N2-Pro

Nex-N2-Pro — это агентская смешанная модель экспертов от Nex AGI с 17B активных параметров из 397B. Построенный на архитектуре Qwen3.5, он принимает ввод текста и изображений и про…

8 июн. 2026 г.262K context

MiniMax: MiniMax M3

MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…

31 мая 2026 г.1.0M context

StepFun: Step 3.7 Flash

Step 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…

28 мая 2026 г.256K context

IBM: Granite 4.1 8B

Granite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров, состоящая только из декодера, от IBM, входящая в семейство Granite 4.1. Он поддерживает контекстное окно ра…

30 апр. 2026 г.131K context

MoonshotAI Kimi Latest

Эта модель всегда перенаправляет на последнюю модель семейства MoonshotAI Kimi.

27 апр. 2026 г.262K context

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…

27 апр. 2026 г.262K context

Qwen: Qwen3.6 27B

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…

27 апр. 2026 г.262K context

DeepSeek: DeepSeek V4 Pro

DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общими параметрами 1,6T и активированными параметрами 49B, поддерживающая контекстное окно объемом 1M…

24 апр. 2026 г.1.0M context

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параме…

24 апр. 2026 г.1.0M context

inclusionAI: Ling-2.6-1T

Ling-2.6-1T — это модель мгновенного выполнения (инструктирования) от InclusionAI и флагмана компании с триллионом параметров, предназначенная для реальных агентов, которым требует…

23 апр. 2026 г.262K context

Xiaomi: MiMo-V2.5-Pro

MiMo-V2.5-Pro — это флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентских возможностях, сложной разработке программного обеспечения и долгосрочны…

22 апр. 2026 г.1.0M context

Xiaomi: MiMo-V2.5

MiMo-V2.5 — это родная омнимодальная модель от Xiaomi. Он обеспечивает агентную производительность профессионального уровня примерно за половину стоимости вывода, превосходя при эт…

22 апр. 2026 г.1.0M context

inclusionAI: Ling-2.6-flash

Ling-2.6-flash — это модель мгновенного реагирования (инструктирования) от InclusionAI с общим числом параметров 104 млрд и активными параметрами 7,4 млрд, предназначенная для реал…

21 апр. 2026 г.262K context

MoonshotAI: Kimi K2.6

Kimi K2.6 — это мультимодальная модель следующего поколения Moonshot AI, предназначенная для долгосрочного кодирования, генерации UI/UX на основе кодирования и многоагентной оркест…

20 апр. 2026 г.262K context

Z.ai: GLM 5.1

GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, особенно значительные преимущества в решении долгосрочных задач. В отличие от предыдущих моделей, построенных н…

7 апр. 2026 г.203K context

Google: Gemma 4 26B A4B

Gemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…

3 апр. 2026 г.262K context

Google: Gemma 4 31B

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…

2 апр. 2026 г.262K context

Kwaipilot: KAT-Coder-Pro V2

KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для разработки сложного программного обеспечения корпоративного уровня и инт…

27 мар. 2026 г.256K context

Reka Edge

Reka Edge — это чрезвычайно эффективная мультимодальная модель визуального языка 7B, которая принимает входные изображения/видео+текст и генерирует текстовые выходные данные. Эта м…

20 мар. 2026 г.16K context

MiniMax: MiniMax M2.7

MiniMax-M2.7 — это модель большого языка нового поколения, предназначенная для автономной, реальной производительности и постоянного совершенствования. Созданный для активного учас…

18 мар. 2026 г.205K context

NVIDIA: Nemotron 3 Super

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 битами параметров, активирующая всего 12 миллиардов параметров для максимальной эффективности и точности вычислен…

11 мар. 2026 г.1M context

Qwen: Qwen3.5-9B

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…

10 мар. 2026 г.262K context

Qwen: Qwen3.5-35B-A3B

Qwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-27B

Модель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-122B-A10B

Модель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…

25 февр. 2026 г.262K context

Qwen: Qwen3.5 397B A17B

Модель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…

16 февр. 2026 г.256K context

MiniMax: MiniMax M2.5

MiniMax-M2.5 — это большая языковая модель SOTA, предназначенная для реальной производительности. Обученный в различных сложных реальных цифровых рабочих средах, M2.5 опирается на…

12 февр. 2026 г.205K context

Z.ai: GLM 5

GLM-5 — это флагманская базовая модель Z.ai с открытым исходным кодом, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданный для опытн…

11 февр. 2026 г.203K context

Qwen: Qwen3 Coder Next

Qwen3-Coder-Next — это причинно-следственная языковая модель с открытым весом, оптимизированная для агентов кодирования и рабочих процессов локальной разработки. Он использует разр…

4 февр. 2026 г.262K context

MoonshotAI: Kimi K2.5

Kimi K2.5 — это собственная мультимодальная модель Moonshot AI, обеспечивающая современные возможности визуального кодирования и парадигму самостоятельного роя агентов. Созданный н…

27 янв. 2026 г.262K context

Z.ai: GLM 4.7 Flash

Модель GLM-4.7-Flash, являющаяся моделью SOTA класса 30B, предлагает новую опцию, которая сочетает в себе производительность и эффективность. Он дополнительно оптимизирован для сце…

19 янв. 2026 г.203K context

Z.ai: GLM 4.7

GLM-4.7 — новейшая флагманская модель Z.ai, в которой реализованы обновления в двух ключевых областях: расширенные возможности программирования и более стабильное многоэтапное расс…

22 дек. 2025 г.203K context

NVIDIA: Nemotron 3 Nano 30B A3B

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, позволяющая разработчикам создавать специализированные аг…

14 дек. 2025 г.262K context

Arcee AI: Trinity Mini

Trinity Mini — это языковая модель с разреженной смесью экспертов с 26B параметрами (3B активных), включающая 128 экспертов, по 8 активных на каждый токен. Разработан для эффективн…

1 дек. 2025 г.131K context

DeepSeek: DeepSeek V3.2

DeepSeek-V3.2 — это большая языковая модель, предназначенная для сочетания высокой вычислительной эффективности с сильными рассуждениями и производительностью использования агентск…

1 дек. 2025 г.131K context

MoonshotAI: Kimi K2 Thinking

Kimi K2 Thinking — это самая продвинутая на сегодняшний день модель открытого рассуждения Moonshot AI, расширяющая серию K2 до агентного долгосрочного рассуждения. Построенный на а…

6 нояб. 2025 г.262K context

MiniMax: MiniMax M2

MiniMax-M2 — это компактная, высокоэффективная модель большого языка, оптимизированная для сквозного кодирования и агентных рабочих процессов. Благодаря 10 миллиардам активированны…

23 окт. 2025 г.205K context

IBM: Granite 4.0 Micro

Гранит-4.0-Н-Микро — параметр 3В из семейства моделей Гранит 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они точно настроены для длинного контекстного вызова…

20 окт. 2025 г.131K context

Microsoft: Phi 4 Mini Instruct

Phi-4-mini-instruct — это легкая открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах, с упором на высококачественные и аргументированные…

17 окт. 2025 г.131K context

Qwen: Qwen3 VL 8B Instruct

Qwen3-VL-8B-Instruct — это мультимодальная модель языка видения из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения текста, изображений и видео. Он обеспечивает…

14 окт. 2025 г.256K context

Qwen: Qwen3 VL 30B A3B Thinking

Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант мышления улучшает мышлен…

6 окт. 2025 г.131K context

Qwen: Qwen3 VL 30B A3B Instruct

Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант Instruct оптимизирует сл…

6 окт. 2025 г.262K context

DeepSeek: DeepSeek V3.2 Exp

DeepSeek-V3.2-Exp — это экспериментальная модель большого языка, выпущенная DeepSeek как промежуточный этап между V3.1 и будущими архитектурами. Он представляет DeepSeek Sparse Att…

29 сент. 2025 г.164K context

TheDrummer: Cydonia 24B V4.1

Модель творческого письма без цензуры на основе Mistral Small 3.2 24B с хорошей запоминаемостью, быстрым соблюдением правил и интеллектом.

27 сент. 2025 г.131K context

Qwen: Qwen3 VL 235B A22B Thinking

Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель мышления оптимизирована для…

23 сент. 2025 г.131K context

Qwen: Qwen3 VL 235B A22B Instruct

Qwen3-VL-235B-A22B Instruct — это мультимодальная модель с открытым весом, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель Instruct ор…

23 сент. 2025 г.262K context

Qwen: Qwen3 Next 80B A3B Thinking

Qwen3-Next-80B-A3B-Thinking — это модель чата, основанная на рассуждениях, в линейке Qwen3-Next, которая по умолчанию выводит структурированные следы «мышления». Он предназначен дл…

11 сент. 2025 г.262K context

Qwen: Qwen3 Next 80B A3B Instruct

Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции модель чата из серии Qwen3-Next, оптимизированная для быстрых и стабильных ответов без следов «думания». Он предназначен…

11 сент. 2025 г.262K context

Qwen: Qwen3 30B A3B Thinking 2507

Qwen3-30B-A3B-Thinking-2507 — это модель рассуждения «Смесь экспертов» с 30 параметрами, оптимизированная для сложных задач, требующих расширенного многоэтапного мышления. Модель р…

28 авг. 2025 г.131K context

DeepSeek: DeepSeek V3.1

DeepSeek-V3.1 — это большая гибридная модель рассуждения (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и режимы без мышления с помощью шаблонов под…

21 авг. 2025 г.164K context

OpenAI: gpt-oss-120b

gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…

5 авг. 2025 г.131K context

OpenAI: gpt-oss-20b

gpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…

5 авг. 2025 г.131K context

Qwen: Qwen3 Coder 30B A3B Instruct

Qwen3-Coder-30B-A3B-Instruct — это модель Mixture of Experts (MoE) с 30,5 млрд параметров со 128 экспертами (8 активных на каждый прямой проход), предназначенная для расширенной ге…

31 июл. 2025 г.160K context

Qwen: Qwen3 30B A3B Instruct 2507

Qwen3-30B-A3B-Instruct-2507 — это языковая модель смешанного типа экспертов от Qwen с 30,5 млрд параметров и 3,3 млрд активных параметров на вывод. Он работает в режиме «без мышлен…

29 июл. 2025 г.131K context

Qwen: Qwen3 235B A22B Thinking 2507

Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель с открытой массой экспертов (MoE), оптимизированная для сложных задач рассуждения. Он активирует 22B из 2…

25 июл. 2025 г.262K context

Qwen: Qwen3 Coder 480B A35B

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода с участием экспертов (MoE), разработанная командой Qwen. Он оптимизирован для задач агентного кодирования, таких как вызо…

23 июл. 2025 г.1.0M context

ByteDance: UI-TARS 7B

UI-TARS-1.5 — это мультимодальный агент языка видения, оптимизированный для сред на основе графического пользовательского интерфейса, включая интерфейсы настольных компьютеров, веб…

22 июл. 2025 г.128K context

Qwen: Qwen3 235B A22B Instruct 2507

Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на команды языковая модель смешанного уровня экспертов, основанная на архитектуре Qwen3-235B, с 22B активных параметро…

21 июл. 2025 г.262K context

Mistral: Mistral Small 3.2 24B

Mistral-Small-3.2-24B-Instruct-2506 — это обновленная модель параметров 24B от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшенного вызова функ…

20 июн. 2025 г.128K context

DeepSeek: R1 0528

28 мая обновление исходной версии DeepSeek R1 Performance, аналогичной OpenAI o1, но с открытым исходным кодом и с полностью открытыми токенами рассуждений. Его размер составляет 6…

28 мая 2025 г.164K context

Qwen: Qwen3 30B A3B

Qwen3, последнее поколение в серии больших языковых моделей Qwen, имеет как плотную архитектуру, так и архитектуру со смешанным участием экспертов (MoE), позволяющую добиться прево…

28 апр. 2025 г.131K context

Qwen: Qwen3 14B

Qwen3-14B — это плотная причинно-языковая модель с 14,8 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает…

28 апр. 2025 г.132K context

Qwen: Qwen3 32B

Qwen3-32B — это плотная причинно-языковая модель с 32,8 млрд параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Он поддерживае…

28 апр. 2025 г.131K context

Meta: Llama 4 Maverick

Llama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре смешанных экспертов (MoE) со 128 экспертами и…

5 апр. 2025 г.1.0M context

Mistral: Mistral Small 3.1 24B

Mistral Small 3.1 24B Instruct — это модернизированный вариант Mistral Small 3 (2501), обладающий 24 миллиардами параметров и расширенными мультимодальными возможностями. Он обеспе…

17 мар. 2025 г.128K context

Google: Gemma 3 27B

Gemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…

12 мар. 2025 г.131K context

TheDrummer: Skyfall 36B V2

Skyfall 36B v2 — это улучшенная версия Mistral Small 2501, специально настроенная для улучшения творческих способностей, детального письма, ролевой игры и связного повествования.

10 мар. 2025 г.33K context

Qwen: Qwen2.5 VL 72B Instruct

Qwen2.5-VL умеет распознавать обычные объекты, такие как цветы, птицы, рыбы и насекомые. Он также способен анализировать тексты, диаграммы, значки, графику и макеты изображений.

1 февр. 2025 г.131K context

Meta: Llama 3.3 70B Instruct

Многоязычная модель большого языка (LLM) Meta Llama 3.3 представляет собой предварительно обученную и настроенную генеративную модель в 70B (ввод/вывод текста). Модель Llama 3.3, н…

6 дек. 2024 г.131K context

Magnum v4 72B

Это серия моделей, призванных воспроизвести прозаическое качество моделей Claude 3, в частности Sonnet (https://openrouter.ai/anthropic/claude-3.5-sonnet (открывается в новой вклад…

22 окт. 2024 г.33K context

Qwen: Qwen2.5 7B Instruct

Qwen2.5 7B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области код…

16 окт. 2024 г.131K context

Meta: Llama 3.2 3B Instruct

Llama 3.2 3B — это многоязычная модель большого языка с 3 миллиардами параметров, оптимизированная для сложных задач обработки естественного языка, таких как генерация диалогов, ра…

25 сент. 2024 г.131K context

Meta: Llama 3.1 70B Instruct

Последний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 70B, настроенная на инструкции, оптимизирована для использования в диалогах высокого…

23 июл. 2024 г.131K context

Meta: Llama 3.1 8B Instruct

Последний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 8B, настроенная по инструкциям, быстрая и эффективная. Он продемонстрировал высокие…

23 июл. 2024 г.131K context

Mistral: Mistral Nemo

Модель с параметрами 12B и длиной контекста токена 128 тыс., созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна и поддерживает английский, французский, немецкий, испа…

19 июл. 2024 г.131K context

Mancer: Weaver (alpha)

Попытка воссоздать многословие в стиле Клода, но не ожидайте такого же уровня связности или памяти. Предназначен для использования в ролевых/повествовательных ситуациях.

2 авг. 2023 г.8K context

ReMM SLERP 13B

Пробная версия оригинального MythoMax-L2-B13, но с обновленными моделями. #слияние

22 июл. 2023 г.6K context

MythoMax 13B

Одна из самых эффективных и популярных доработок Llama 2 13B с богатыми описаниями и ролевыми играми. #слияние

2 июл. 2023 г.4K context