Z.ai: GLM 5.2GLM 5.2 — это крупномасштабная модель рассуждения от Z.ai. Он поддерживает ввод и вывод текста с помощью контекстного окна с токеном 1M и подходит для долгосрочных рабочих процессо…Вход: Текст→Выход: Текст16 июн. 2026 г.1.0M context
MoonshotAI: Kimi K2.7 CodeMoonshotAI: Kimi K2.7 Code — это ориентированная на кодирование модель семейства Kimi K2 от Moonshot AI, созданная для надежного выполнения сквозных задач программирования в длител…Вход: ТекстВход: Изображения→Выход: Текст12 июн. 2026 г.262K context
NVIDIA: Nemotron 3 UltraNVIDIA Nemotron 3 Ultra — это открытая модель рассуждений и оркестрации от NVIDIA с 55B активных параметров из общего числа 550B (MoE). Построенный на гибридной архитектуре, состоя…Вход: Текст→Выход: Текст4 июн. 2026 г.1M context
MiniMax: MiniMax M3MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст31 мая 2026 г.1.0M context
StepFun: Step 3.7 FlashStep 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст28 мая 2026 г.256K context
inclusionAI: Ring-2.6-1TRing-2.6-1T — это модель мышления в масштабе 1Т с 63Б активных параметров, созданная для реальных рабочих процессов агентов, требующих как мощных возможностей, так и операционной э…Вход: Текст→Выход: Текст8 мая 2026 г.262K context
IBM: Granite 4.1 8BGranite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров, состоящая только из декодера, от IBM, входящая в семейство Granite 4.1. Он поддерживает контекстное окно ра…Вход: Текст→Выход: Текст30 апр. 2026 г.131K context
MoonshotAI Kimi LatestЭта модель всегда перенаправляет на последнюю модель семейства MoonshotAI Kimi.Вход: ТекстВход: Изображения→Выход: Текст27 апр. 2026 г.262K context
Qwen: Qwen3.6 35B A3BQwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
Qwen: Qwen3.6 27BQwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
DeepSeek: DeepSeek V4 ProDeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общими параметрами 1,6T и активированными параметрами 49B, поддерживающая контекстное окно объемом 1M…Вход: Текст→Выход: Текст24 апр. 2026 г.1.0M context
DeepSeek: DeepSeek V4 FlashDeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параме…Вход: Текст→Выход: Текст24 апр. 2026 г.1.0M context
inclusionAI: Ling-2.6-1TLing-2.6-1T — это модель мгновенного выполнения (инструктирования) от InclusionAI и флагмана компании с триллионом параметров, предназначенная для реальных агентов, которым требует…Вход: Текст→Выход: Текст23 апр. 2026 г.262K context
Xiaomi: MiMo-V2.5-ProMiMo-V2.5-Pro — это флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентских возможностях, сложной разработке программного обеспечения и долгосрочны…Вход: Текст→Выход: Текст22 апр. 2026 г.1.0M context
inclusionAI: Ling-2.6-flashLing-2.6-flash — это модель мгновенного реагирования (инструктирования) от InclusionAI с общим числом параметров 104 млрд и активными параметрами 7,4 млрд, предназначенная для реал…Вход: Текст→Выход: Текст21 апр. 2026 г.262K context
MoonshotAI: Kimi K2.6Kimi K2.6 — это мультимодальная модель следующего поколения Moonshot AI, предназначенная для долгосрочного кодирования, генерации UI/UX на основе кодирования и многоагентной оркест…Вход: ТекстВход: Изображения→Выход: Текст20 апр. 2026 г.262K context
Z.ai: GLM 5.1GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, особенно значительные преимущества в решении долгосрочных задач. В отличие от предыдущих моделей, построенных н…Вход: Текст→Выход: Текст7 апр. 2026 г.203K context
Google: Gemma 4 26B A4BGemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст3 апр. 2026 г.262K context
Google: Gemma 4 26B A4B (free)Gemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст3 апр. 2026 г.262K contextБесплатно
Google: Gemma 4 31BGemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст2 апр. 2026 г.262K context
Kwaipilot: KAT-Coder-Pro V2KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для разработки сложного программного обеспечения корпоративного уровня и инт…Вход: Текст→Выход: Текст27 мар. 2026 г.256K context
MiniMax: MiniMax M2.7MiniMax-M2.7 — это модель большого языка нового поколения, предназначенная для автономной, реальной производительности и постоянного совершенствования. Созданный для активного учас…Вход: Текст→Выход: Текст18 мар. 2026 г.205K context
Z.ai: GLM 5 TurboGLM-5 Turbo — это новая модель от Z.ai, предназначенная для быстрого вывода и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Он глубоко опт…Вход: Текст→Выход: Текст15 мар. 2026 г.262K context
NVIDIA: Nemotron 3 SuperNVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 битами параметров, активирующая всего 12 миллиардов параметров для максимальной эффективности и точности вычислен…Вход: Текст→Выход: Текст11 мар. 2026 г.1M context
Qwen: Qwen3.5-9BQwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст10 мар. 2026 г.262K context
Qwen: Qwen3.5-35B-A3BQwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-27BМодель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-122B-A10BМодель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
LiquidAI: LFM2-24B-A2BLFM2-24B-A2B — самая крупная модель в семействе гибридных архитектур LFM2, предназначенная для эффективного развертывания на устройстве. Построенная в виде модели Mixture-of-Expert…Вход: Текст→Выход: Текст25 февр. 2026 г.128K context
Qwen: Qwen3.5 397B A17BМодель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст16 февр. 2026 г.256K context
MiniMax: MiniMax M2.5MiniMax-M2.5 — это большая языковая модель SOTA, предназначенная для реальной производительности. Обученный в различных сложных реальных цифровых рабочих средах, M2.5 опирается на…Вход: Текст→Выход: Текст12 февр. 2026 г.205K context
Z.ai: GLM 5GLM-5 — это флагманская базовая модель Z.ai с открытым исходным кодом, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданный для опытн…Вход: Текст→Выход: Текст11 февр. 2026 г.203K context
Qwen: Qwen3 Coder NextQwen3-Coder-Next — это причинно-следственная языковая модель с открытым весом, оптимизированная для агентов кодирования и рабочих процессов локальной разработки. Он использует разр…Вход: Текст→Выход: Текст4 февр. 2026 г.262K context
StepFun: Step 3.5 FlashStep 3.5 Flash — это наиболее эффективная базовая модель StepFun с открытым исходным кодом. Построенный на разреженной архитектуре Mixture of Experts (MoE), он выборочно активирует…Вход: Текст→Выход: Текст29 янв. 2026 г.262K context
MoonshotAI: Kimi K2.5Kimi K2.5 — это собственная мультимодальная модель Moonshot AI, обеспечивающая современные возможности визуального кодирования и парадигму самостоятельного роя агентов. Созданный н…Вход: ТекстВход: Изображения→Выход: Текст27 янв. 2026 г.262K context
Z.ai: GLM 4.7 FlashМодель GLM-4.7-Flash, являющаяся моделью SOTA класса 30B, предлагает новую опцию, которая сочетает в себе производительность и эффективность. Он дополнительно оптимизирован для сце…Вход: Текст→Выход: Текст19 янв. 2026 г.203K context
MiniMax: MiniMax M2.1MiniMax-M2.1 — это легкая, современная модель большого языка, оптимизированная для кодирования, агентных рабочих процессов и разработки современных приложений. Имея всего 10 миллиа…Вход: Текст→Выход: Текст23 дек. 2025 г.205K context
Z.ai: GLM 4.7GLM-4.7 — новейшая флагманская модель Z.ai, в которой реализованы обновления в двух ключевых областях: расширенные возможности программирования и более стабильное многоэтапное расс…Вход: Текст→Выход: Текст22 дек. 2025 г.203K context
NVIDIA: Nemotron 3 Nano 30B A3BNVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, позволяющая разработчикам создавать специализированные аг…Вход: Текст→Выход: Текст14 дек. 2025 г.262K context
Z.ai: GLM 4.6VGLM-4.6V — это большая мультимодальная модель, предназначенная для высококачественного визуального понимания и долгоконтекстного анализа изображений, документов и смешанных медиа.…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст8 дек. 2025 г.131K context
Mistral: Ministral 3 14B 2512Самая крупная модель семейства Ministral 3, Ministral 3 14B, предлагает непревзойденные возможности и производительность, сравнимые со своим более крупным аналогом Mistral Small 3.…Вход: ТекстВход: Изображения→Выход: Текст2 дек. 2025 г.262K context
Mistral: Ministral 3 8B 2512Ministral 3 8B, сбалансированная модель семейства Ministral 3, представляет собой мощную и эффективную миниатюрную языковую модель с возможностями машинного зрения.Вход: ТекстВход: Изображения→Выход: Текст2 дек. 2025 г.262K context
Mistral: Ministral 3 3B 2512Ministral 3 3B — самая маленькая модель в семействе Ministral 3. Это мощная и эффективная миниатюрная языковая модель с возможностями машинного зрения.Вход: ТекстВход: Изображения→Выход: Текст2 дек. 2025 г.131K context
DeepSeek: DeepSeek V3.2DeepSeek-V3.2 — это большая языковая модель, предназначенная для сочетания высокой вычислительной эффективности с сильными рассуждениями и производительностью использования агентск…Вход: Текст→Выход: Текст1 дек. 2025 г.131K context
AllenAI: Olmo 3 32B ThinkOlmo 3.1 32B Think — это крупномасштабная модель с 32 миллиардами параметров, предназначенная для глубоких рассуждений, сложной многошаговой логики и выполнения сложных инструкций.…Вход: Текст→Выход: Текст21 нояб. 2025 г.66K context
Deep Cogito: Cogito v2.1 671BCogito v2.1 671B MoE представляет собой одну из самых мощных открытых моделей в мире, сравнимую по производительности с передовыми закрытыми и открытыми моделями. Эта модель обучае…Вход: Текст→Выход: Текст13 нояб. 2025 г.128K context
MoonshotAI: Kimi K2 ThinkingKimi K2 Thinking — это самая продвинутая на сегодняшний день модель открытого рассуждения Moonshot AI, расширяющая серию K2 до агентного долгосрочного рассуждения. Построенный на а…Вход: Текст→Выход: Текст6 нояб. 2025 г.262K context
MiniMax: MiniMax M2MiniMax-M2 — это компактная, высокоэффективная модель большого языка, оптимизированная для сквозного кодирования и агентных рабочих процессов. Благодаря 10 миллиардам активированны…Вход: Текст→Выход: Текст23 окт. 2025 г.205K context
IBM: Granite 4.0 MicroГранит-4.0-Н-Микро — параметр 3В из семейства моделей Гранит 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они точно настроены для длинного контекстного вызова…Вход: Текст→Выход: Текст20 окт. 2025 г.131K context
Microsoft: Phi 4 Mini InstructPhi-4-mini-instruct — это легкая открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах, с упором на высококачественные и аргументированные…Вход: Текст→Выход: Текст17 окт. 2025 г.131K context
Qwen: Qwen3 VL 8B InstructQwen3-VL-8B-Instruct — это мультимодальная модель языка видения из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения текста, изображений и видео. Он обеспечивает…Вход: ИзображенияВход: Текст→Выход: Текст14 окт. 2025 г.256K context
NVIDIA: Llama 3.3 Nemotron Super 49B V1.5Llama-3.3-Nemotron-Super-49B-v1.5 — это англоориентированная модель рассуждений/чата с 49 параметрами, созданная на основе Llama-3.3-70B-Instruct компании Meta с контекстом 128 КБ.…Вход: Текст→Выход: Текст10 окт. 2025 г.131K context
Qwen: Qwen3 VL 30B A3B ThinkingQwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант мышления улучшает мышлен…Вход: ТекстВход: Изображения→Выход: Текст6 окт. 2025 г.131K context
Qwen: Qwen3 VL 30B A3B InstructQwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант Instruct оптимизирует сл…Вход: ТекстВход: Изображения→Выход: Текст6 окт. 2025 г.262K context
Z.ai: GLM 4.6По сравнению с GLM-4.5 это поколение содержит несколько ключевых улучшений: Более длинное контекстное окно: контекстное окно было расширено со 128 000 до 200 000 токенов, что позв…Вход: Текст→Выход: Текст30 сент. 2025 г.203K context
DeepSeek: DeepSeek V3.2 ExpDeepSeek-V3.2-Exp — это экспериментальная модель большого языка, выпущенная DeepSeek как промежуточный этап между V3.1 и будущими архитектурами. Он представляет DeepSeek Sparse Att…Вход: Текст→Выход: Текст29 сент. 2025 г.164K context
TheDrummer: Cydonia 24B V4.1Модель творческого письма без цензуры на основе Mistral Small 3.2 24B с хорошей запоминаемостью, быстрым соблюдением правил и интеллектом.Вход: Текст→Выход: Текст27 сент. 2025 г.131K context
Qwen: Qwen3 VL 235B A22B ThinkingQwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель мышления оптимизирована для…Вход: ТекстВход: Изображения→Выход: Текст23 сент. 2025 г.131K context
Qwen: Qwen3 VL 235B A22B InstructQwen3-VL-235B-A22B Instruct — это мультимодальная модель с открытым весом, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель Instruct ор…Вход: ТекстВход: Изображения→Выход: Текст23 сент. 2025 г.262K context
DeepSeek: DeepSeek V3.1 TerminusDeepSeek-V3.1 Terminus — это обновление DeepSeek V3.1, которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщают пользователи, включая согла…Вход: Текст→Выход: Текст22 сент. 2025 г.164K context
Qwen: Qwen3 Next 80B A3B ThinkingQwen3-Next-80B-A3B-Thinking — это модель чата, основанная на рассуждениях, в линейке Qwen3-Next, которая по умолчанию выводит структурированные следы «мышления». Он предназначен дл…Вход: Текст→Выход: Текст11 сент. 2025 г.262K context
Qwen: Qwen3 Next 80B A3B InstructQwen3-Next-80B-A3B-Instruct — это настроенная на инструкции модель чата из серии Qwen3-Next, оптимизированная для быстрых и стабильных ответов без следов «думания». Он предназначен…Вход: Текст→Выход: Текст11 сент. 2025 г.262K context
MoonshotAI: Kimi K2 0905Kimi K2 0905 — это сентябрьское обновление Kimi K2 0711. Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством 1 триллион па…Вход: Текст→Выход: Текст4 сент. 2025 г.262K context
Qwen: Qwen3 30B A3B Thinking 2507Qwen3-30B-A3B-Thinking-2507 — это модель рассуждения «Смесь экспертов» с 30 параметрами, оптимизированная для сложных задач, требующих расширенного многоэтапного мышления. Модель р…Вход: Текст→Выход: Текст28 авг. 2025 г.131K context
Nous: Hermes 4 70BГермес 4 70B — это гибридная модель мышления от Nous Research, созданная на основе Мета-Лламы-3.1-70B. В нем представлен тот же гибридный режим, что и в более крупной версии 405B,…Вход: Текст→Выход: Текст26 авг. 2025 г.131K context
Nous: Hermes 4 405BГермес 4 — это крупномасштабная модель рассуждения, созданная на основе Мета-Лламы-3.1-405B и выпущенная Nous Research. Он вводит гибридный режим рассуждения, в котором модель може…Вход: Текст→Выход: Текст26 авг. 2025 г.131K context
DeepSeek: DeepSeek V3.1DeepSeek-V3.1 — это большая гибридная модель рассуждения (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и режимы без мышления с помощью шаблонов под…Вход: Текст→Выход: Текст21 авг. 2025 г.164K context
Z.ai: GLM 4.5VGLM-4.5V — это базовая модель языка видения для приложений мультимодальных агентов. Построенный на архитектуре Mixture-of-Experts (MoE) с 106B параметров и 12B активированных парам…Вход: ТекстВход: Изображения→Выход: Текст11 авг. 2025 г.66K context
OpenAI: gpt-oss-120bgpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
OpenAI: gpt-oss-20bgpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
OpenAI: gpt-oss-20b (free)gpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…Вход: Текст→Выход: Текст5 авг. 2025 г.131K contextБесплатно
Qwen: Qwen3 Coder 30B A3B InstructQwen3-Coder-30B-A3B-Instruct — это модель Mixture of Experts (MoE) с 30,5 млрд параметров со 128 экспертами (8 активных на каждый прямой проход), предназначенная для расширенной ге…Вход: Текст→Выход: Текст31 июл. 2025 г.160K context
Qwen: Qwen3 30B A3B Instruct 2507Qwen3-30B-A3B-Instruct-2507 — это языковая модель смешанного типа экспертов от Qwen с 30,5 млрд параметров и 3,3 млрд активных параметров на вывод. Он работает в режиме «без мышлен…Вход: Текст→Выход: Текст29 июл. 2025 г.131K context
Qwen: Qwen3 235B A22B Thinking 2507Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель с открытой массой экспертов (MoE), оптимизированная для сложных задач рассуждения. Он активирует 22B из 2…Вход: Текст→Выход: Текст25 июл. 2025 г.262K context
Qwen: Qwen3 Coder 480B A35BQwen3-Coder-480B-A35B-Instruct — это модель генерации кода с участием экспертов (MoE), разработанная командой Qwen. Он оптимизирован для задач агентного кодирования, таких как вызо…Вход: Текст→Выход: Текст23 июл. 2025 г.1.0M context
Qwen: Qwen3 235B A22B Instruct 2507Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на команды языковая модель смешанного уровня экспертов, основанная на архитектуре Qwen3-235B, с 22B активных параметро…Вход: Текст→Выход: Текст21 июл. 2025 г.262K context
Mistral: Mistral Small 3.2 24BMistral-Small-3.2-24B-Instruct-2506 — это обновленная модель параметров 24B от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшенного вызова функ…Вход: ИзображенияВход: Текст→Выход: Текст20 июн. 2025 г.128K context
DeepSeek: R1 052828 мая обновление исходной версии DeepSeek R1 Performance, аналогичной OpenAI o1, но с открытым исходным кодом и с полностью открытыми токенами рассуждений. Его размер составляет 6…Вход: Текст→Выход: Текст28 мая 2025 г.164K context
Google: Gemma 3n 4BGemma 3n E4B — оптимизирован для эффективной работы на мобильных и малоресурсных устройствах, таких как телефоны, ноутбуки и планшеты. Он поддерживает мультимодальный ввод, включая…Вход: Текст→Выход: Текст20 мая 2025 г.33K context
Meta: Llama Guard 4 12BLlama Guard 4 — это мультимодальная предварительно обученная модель на основе Llama 4 Scout, настроенная для классификации безопасности контента. Подобно предыдущим версиям, его мо…Вход: ИзображенияВход: Текст→Выход: Текст30 апр. 2025 г.164K context
Qwen: Qwen3 30B A3BQwen3, последнее поколение в серии больших языковых моделей Qwen, имеет как плотную архитектуру, так и архитектуру со смешанным участием экспертов (MoE), позволяющую добиться прево…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Qwen: Qwen3 8BQwen3-8B — это плотная причинно-языковая модель с 8,2 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает п…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Qwen: Qwen3 14BQwen3-14B — это плотная причинно-языковая модель с 14,8 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает…Вход: Текст→Выход: Текст28 апр. 2025 г.132K context
Qwen: Qwen3 32BQwen3-32B — это плотная причинно-языковая модель с 32,8 млрд параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Он поддерживае…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Meta: Llama 4 MaverickLlama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре смешанных экспертов (MoE) со 128 экспертами и…Вход: ТекстВход: Изображения→Выход: Текст5 апр. 2025 г.1.0M context
Meta: Llama 4 ScoutLlama 4 Scout 17B Instruct (16E) — это языковая модель смешанных экспертов (MoE), разработанная Meta, которая активирует 17 миллиардов параметров из 109B. Он поддерживает собственн…Вход: ТекстВход: Изображения→Выход: Текст5 апр. 2025 г.10M context
DeepSeek: DeepSeek V3 0324DeepSeek V3, модель, состоящая из нескольких экспертов, с параметрами 685B, является последней версией флагманского семейства моделей чата от команды DeepSeek. Он является преемни…Вход: Текст→Выход: Текст24 мар. 2025 г.164K context
Google: Gemma 3 4BGemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…Вход: ТекстВход: Изображения→Выход: Текст13 мар. 2025 г.131K context
Google: Gemma 3 12BGemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…Вход: ТекстВход: Изображения→Выход: Текст13 мар. 2025 г.131K context
Google: Gemma 3 27BGemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…Вход: ТекстВход: Изображения→Выход: Текст12 мар. 2025 г.131K context
TheDrummer: Skyfall 36B V2Skyfall 36B v2 — это улучшенная версия Mistral Small 2501, специально настроенная для улучшения творческих способностей, детального письма, ролевой игры и связного повествования.Вход: Текст→Выход: Текст10 мар. 2025 г.33K context
Qwen: Qwen2.5 VL 72B InstructQwen2.5-VL умеет распознавать обычные объекты, такие как цветы, птицы, рыбы и насекомые. Он также способен анализировать тексты, диаграммы, значки, графику и макеты изображений.Вход: ТекстВход: Изображения→Выход: Текст1 февр. 2025 г.131K context
Mistral: Mistral Small 3Mistral Small 3 — это языковая модель с 24 битами параметров, оптимизированная для обеспечения производительности с малой задержкой при выполнении распространенных задач искусствен…Вход: Текст→Выход: Текст30 янв. 2025 г.33K context
DeepSeek: R1DeepSeek R1 уже здесь: производительность на уровне OpenAI o1, но с открытым исходным кодом и полностью открытыми токенами рассуждений. Его размер составляет 671 байт параметров, и…Вход: Текст→Выход: Текст20 янв. 2025 г.164K context
Microsoft: Phi 4Microsoft Research Phi-4 хорошо справляется со сложными логическими задачами и может эффективно работать в ситуациях с ограниченной памятью или когда необходимы быстрые реакции. П…Вход: Текст→Выход: Текст10 янв. 2025 г.16K context
DeepSeek: DeepSeek V3DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на следовании инструкциям и возможностях кодирования предыдущих версий. Опубликованные оценки показывают, что моде…Вход: Текст→Выход: Текст26 дек. 2024 г.131K context
Sao10K: Llama 3.3 Euryale 70BEuryale L3.3 70B — модель, ориентированная на творческую ролевую игру от Sao10k(открывается в новой вкладке). Это преемник Euryale L3 70B v2.2.Вход: Текст→Выход: Текст18 дек. 2024 г.131K context
Meta: Llama 3.3 70B InstructМногоязычная модель большого языка (LLM) Meta Llama 3.3 представляет собой предварительно обученную и настроенную генеративную модель в 70B (ввод/вывод текста). Модель Llama 3.3, н…Вход: Текст→Выход: Текст6 дек. 2024 г.131K context
TheDrummer: UnslopNemo 12BUnslopNemo v4.1 — это последнее дополнение от создателя Rocinante, предназначенное для написания приключенческих сценариев и ролевых игр.Вход: Текст→Выход: Текст8 нояб. 2024 г.33K context
Magnum v4 72BЭто серия моделей, призванных воспроизвести прозаическое качество моделей Claude 3, в частности Sonnet (https://openrouter.ai/anthropic/claude-3.5-sonnet (открывается в новой вклад…Вход: Текст→Выход: Текст22 окт. 2024 г.33K context
Qwen: Qwen2.5 7B InstructQwen2.5 7B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области код…Вход: Текст→Выход: Текст16 окт. 2024 г.131K context
Meta: Llama 3.2 11B Vision InstructLlama 3.2 11B Vision — мультимодальная модель с 11 миллиардами параметров, предназначенная для решения задач, объединяющих визуальные и текстовые данные. Он превосходно справляется…Вход: ТекстВход: Изображения→Выход: Текст25 сент. 2024 г.131K context
Qwen2.5 72B InstructQwen2.5 72B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области ко…Вход: Текст→Выход: Текст19 сент. 2024 г.131K context
Sao10K: Llama 3.1 Euryale 70B v2.2Euryale L3.1 70B v2.2 — модель, ориентированная на творческую ролевую игру от Sao10k(откроется в новой вкладке). Это преемник Euryale L3 70B v2.1.Вход: Текст→Выход: Текст28 авг. 2024 г.131K context
Nous: Hermes 3 70B InstructHermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…Вход: Текст→Выход: Текст18 авг. 2024 г.131K context
Nous: Hermes 3 405B InstructHermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…Вход: Текст→Выход: Текст16 авг. 2024 г.131K context
Sao10K: Llama 3 8B LunarisLunaris 8B — это универсальная и ролевая модель, основанная на Llama 3. Это стратегическое объединение нескольких моделей, призванное сбалансировать творческий подход с улучшенной…Вход: Текст→Выход: Текст13 авг. 2024 г.8K context
Meta: Llama 3.1 70B InstructПоследний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 70B, настроенная на инструкции, оптимизирована для использования в диалогах высокого…Вход: Текст→Выход: Текст23 июл. 2024 г.131K context
Meta: Llama 3.1 8B InstructПоследний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 8B, настроенная по инструкциям, быстрая и эффективная. Он продемонстрировал высокие…Вход: Текст→Выход: Текст23 июл. 2024 г.131K context
Mistral: Mistral NemoМодель с параметрами 12B и длиной контекста токена 128 тыс., созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна и поддерживает английский, французский, немецкий, испа…Вход: Текст→Выход: Текст19 июл. 2024 г.131K context
Google: Gemma 2 27BGemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, которые использовались при создании моделей Gemini. Модели Gemma хорошо подходят…Вход: Текст→Выход: Текст13 июл. 2024 г.8K context
Meta: Llama 3 8B InstructМодель последнего класса Meta (Llama 3) выпущена в различных размерах и вкусах. Эта версия 8B, настроенная на инструкции, была оптимизирована для использования в высококачественных…Вход: Текст→Выход: Текст18 апр. 2024 г.8K context
WizardLM-2 8x22BWizardLM-2 8x22B — самая совершенная модель Wizard от Microsoft AI. Он демонстрирует высокую конкурентоспособность по сравнению с ведущими проприетарными моделями и неизменно прево…Вход: Текст→Выход: Текст16 апр. 2024 г.66K context
Mancer: Weaver (alpha)Попытка воссоздать многословие в стиле Клода, но не ожидайте такого же уровня связности или памяти. Предназначен для использования в ролевых/повествовательных ситуациях.Вход: Текст→Выход: Текст2 авг. 2023 г.8K context
ReMM SLERP 13BПробная версия оригинального MythoMax-L2-B13, но с обновленными моделями. #слияниеВход: Текст→Выход: Текст22 июл. 2023 г.6K context
MythoMax 13BОдна из самых эффективных и популярных доработок Llama 2 13B с богатыми описаниями и ролевыми играми. #слияниеВход: Текст→Выход: Текст2 июл. 2023 г.4K context