Z.ai: GLM 5.2GLM 5.2 — это крупномасштабная модель рассуждения от Z.ai. Он поддерживает ввод и вывод текста с помощью контекстного окна с токеном 1M и подходит для долгосрочных рабочих процессо…Вход: Текст→Выход: Текст16 июн. 2026 г.1.0M context
MoonshotAI: Kimi K2.7 CodeMoonshotAI: Kimi K2.7 Code — это ориентированная на кодирование модель семейства Kimi K2 от Moonshot AI, созданная для надежного выполнения сквозных задач программирования в длител…Вход: ТекстВход: Изображения→Выход: Текст12 июн. 2026 г.262K context
NVIDIA: Nemotron 3 UltraNVIDIA Nemotron 3 Ultra — это открытая модель рассуждений и оркестрации от NVIDIA с 55B активных параметров из общего числа 550B (MoE). Построенный на гибридной архитектуре, состоя…Вход: Текст→Выход: Текст4 июн. 2026 г.1M context
MiniMax: MiniMax M3MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст31 мая 2026 г.1.0M context
StepFun: Step 3.7 FlashStep 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст28 мая 2026 г.256K context
Qwen: Qwen3.6 35B A3BQwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
Qwen: Qwen3.6 27BQwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст27 апр. 2026 г.262K context
DeepSeek: DeepSeek V4 ProDeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общими параметрами 1,6T и активированными параметрами 49B, поддерживающая контекстное окно объемом 1M…Вход: Текст→Выход: Текст24 апр. 2026 г.1.0M context
DeepSeek: DeepSeek V4 FlashDeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параме…Вход: Текст→Выход: Текст24 апр. 2026 г.1.0M context
Xiaomi: MiMo-V2.5-ProMiMo-V2.5-Pro — это флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентских возможностях, сложной разработке программного обеспечения и долгосрочны…Вход: Текст→Выход: Текст22 апр. 2026 г.1.0M context
MoonshotAI: Kimi K2.6Kimi K2.6 — это мультимодальная модель следующего поколения Moonshot AI, предназначенная для долгосрочного кодирования, генерации UI/UX на основе кодирования и многоагентной оркест…Вход: ТекстВход: Изображения→Выход: Текст20 апр. 2026 г.262K context
Z.ai: GLM 5.1GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, особенно значительные преимущества в решении долгосрочных задач. В отличие от предыдущих моделей, построенных н…Вход: Текст→Выход: Текст7 апр. 2026 г.203K context
Google: Gemma 4 26B A4BGemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст3 апр. 2026 г.262K context
Google: Gemma 4 31BGemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст2 апр. 2026 г.262K context
Google: Gemma 4 31B (free)Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…Вход: ИзображенияВход: ТекстВход: Видео→Выход: Текст2 апр. 2026 г.262K context
Kwaipilot: KAT-Coder-Pro V2KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для разработки сложного программного обеспечения корпоративного уровня и инт…Вход: Текст→Выход: Текст27 мар. 2026 г.256K context
MiniMax: MiniMax M2.7MiniMax-M2.7 — это модель большого языка нового поколения, предназначенная для автономной, реальной производительности и постоянного совершенствования. Созданный для активного учас…Вход: Текст→Выход: Текст18 мар. 2026 г.205K context
Z.ai: GLM 5 TurboGLM-5 Turbo — это новая модель от Z.ai, предназначенная для быстрого вывода и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Он глубоко опт…Вход: Текст→Выход: Текст15 мар. 2026 г.262K context
NVIDIA: Nemotron 3 SuperNVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 битами параметров, активирующая всего 12 миллиардов параметров для максимальной эффективности и точности вычислен…Вход: Текст→Выход: Текст11 мар. 2026 г.1M context
Qwen: Qwen3.5-9BQwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст10 мар. 2026 г.262K context
Qwen: Qwen3.5-35B-A3BQwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-27BМодель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
Qwen: Qwen3.5-122B-A10BМодель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст25 февр. 2026 г.262K context
LiquidAI: LFM2-24B-A2BLFM2-24B-A2B — самая крупная модель в семействе гибридных архитектур LFM2, предназначенная для эффективного развертывания на устройстве. Построенная в виде модели Mixture-of-Expert…Вход: Текст→Выход: Текст25 февр. 2026 г.128K context
Qwen: Qwen3.5 397B A17BМодель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…Вход: ТекстВход: ИзображенияВход: Видео→Выход: Текст16 февр. 2026 г.256K context
MiniMax: MiniMax M2.5MiniMax-M2.5 — это большая языковая модель SOTA, предназначенная для реальной производительности. Обученный в различных сложных реальных цифровых рабочих средах, M2.5 опирается на…Вход: Текст→Выход: Текст12 февр. 2026 г.205K context
Z.ai: GLM 5GLM-5 — это флагманская базовая модель Z.ai с открытым исходным кодом, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданный для опытн…Вход: Текст→Выход: Текст11 февр. 2026 г.203K context
Qwen: Qwen3 Coder NextQwen3-Coder-Next — это причинно-следственная языковая модель с открытым весом, оптимизированная для агентов кодирования и рабочих процессов локальной разработки. Он использует разр…Вход: Текст→Выход: Текст4 февр. 2026 г.262K context
StepFun: Step 3.5 FlashStep 3.5 Flash — это наиболее эффективная базовая модель StepFun с открытым исходным кодом. Построенный на разреженной архитектуре Mixture of Experts (MoE), он выборочно активирует…Вход: Текст→Выход: Текст29 янв. 2026 г.262K context
MoonshotAI: Kimi K2.5Kimi K2.5 — это собственная мультимодальная модель Moonshot AI, обеспечивающая современные возможности визуального кодирования и парадигму самостоятельного роя агентов. Созданный н…Вход: ТекстВход: Изображения→Выход: Текст27 янв. 2026 г.262K context
LiquidAI: LFM2.5-1.2B-Thinking (free)LFM2.5-1.2B-Thinking — это облегченная модель, ориентированная на рассуждения, оптимизированная для агентских задач, извлечения данных и RAG, при этом она по-прежнему комфортно раб…Вход: Текст→Выход: Текст20 янв. 2026 г.33K context
LiquidAI: LFM2.5-1.2B-Instruct (free)LFM2.5-1.2B-Instruct — это компактная, высокопроизводительная модель с настраиваемыми инструкциями, созданная для быстрого искусственного интеллекта на устройстве. Он обеспечивает…Вход: Текст→Выход: Текст20 янв. 2026 г.33K context
Z.ai: GLM 4.7 FlashМодель GLM-4.7-Flash, являющаяся моделью SOTA класса 30B, предлагает новую опцию, которая сочетает в себе производительность и эффективность. Он дополнительно оптимизирован для сце…Вход: Текст→Выход: Текст19 янв. 2026 г.203K context
MiniMax: MiniMax M2.1MiniMax-M2.1 — это легкая, современная модель большого языка, оптимизированная для кодирования, агентных рабочих процессов и разработки современных приложений. Имея всего 10 миллиа…Вход: Текст→Выход: Текст23 дек. 2025 г.205K context
Z.ai: GLM 4.7GLM-4.7 — новейшая флагманская модель Z.ai, в которой реализованы обновления в двух ключевых областях: расширенные возможности программирования и более стабильное многоэтапное расс…Вход: Текст→Выход: Текст22 дек. 2025 г.203K context
NVIDIA: Nemotron 3 Nano 30B A3BNVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, позволяющая разработчикам создавать специализированные аг…Вход: Текст→Выход: Текст14 дек. 2025 г.262K context
DeepSeek: DeepSeek V3.2DeepSeek-V3.2 — это большая языковая модель, предназначенная для сочетания высокой вычислительной эффективности с сильными рассуждениями и производительностью использования агентск…Вход: Текст→Выход: Текст1 дек. 2025 г.131K context
Deep Cogito: Cogito v2.1 671BCogito v2.1 671B MoE представляет собой одну из самых мощных открытых моделей в мире, сравнимую по производительности с передовыми закрытыми и открытыми моделями. Эта модель обучае…Вход: Текст→Выход: Текст13 нояб. 2025 г.128K context
MoonshotAI: Kimi K2 ThinkingKimi K2 Thinking — это самая продвинутая на сегодняшний день модель открытого рассуждения Moonshot AI, расширяющая серию K2 до агентного долгосрочного рассуждения. Построенный на а…Вход: Текст→Выход: Текст6 нояб. 2025 г.262K context
MiniMax: MiniMax M2MiniMax-M2 — это компактная, высокоэффективная модель большого языка, оптимизированная для сквозного кодирования и агентных рабочих процессов. Благодаря 10 миллиардам активированны…Вход: Текст→Выход: Текст23 окт. 2025 г.205K context
IBM: Granite 4.0 MicroГранит-4.0-Н-Микро — параметр 3В из семейства моделей Гранит 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они точно настроены для длинного контекстного вызова…Вход: Текст→Выход: Текст20 окт. 2025 г.131K context
Qwen: Qwen3 VL 8B InstructQwen3-VL-8B-Instruct — это мультимодальная модель языка видения из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения текста, изображений и видео. Он обеспечивает…Вход: ИзображенияВход: Текст→Выход: Текст14 окт. 2025 г.256K context
NVIDIA: Llama 3.3 Nemotron Super 49B V1.5Llama-3.3-Nemotron-Super-49B-v1.5 — это англоориентированная модель рассуждений/чата с 49 параметрами, созданная на основе Llama-3.3-70B-Instruct компании Meta с контекстом 128 КБ.…Вход: Текст→Выход: Текст10 окт. 2025 г.131K context
Qwen: Qwen3 VL 30B A3B InstructQwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант Instruct оптимизирует сл…Вход: ТекстВход: Изображения→Выход: Текст6 окт. 2025 г.262K context
Z.ai: GLM 4.6По сравнению с GLM-4.5 это поколение содержит несколько ключевых улучшений: Более длинное контекстное окно: контекстное окно было расширено со 128 000 до 200 000 токенов, что позв…Вход: Текст→Выход: Текст30 сент. 2025 г.203K context
DeepSeek: DeepSeek V3.2 ExpDeepSeek-V3.2-Exp — это экспериментальная модель большого языка, выпущенная DeepSeek как промежуточный этап между V3.1 и будущими архитектурами. Он представляет DeepSeek Sparse Att…Вход: Текст→Выход: Текст29 сент. 2025 г.164K context
Qwen: Qwen3 VL 235B A22B InstructQwen3-VL-235B-A22B Instruct — это мультимодальная модель с открытым весом, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель Instruct ор…Вход: ТекстВход: Изображения→Выход: Текст23 сент. 2025 г.262K context
DeepSeek: DeepSeek V3.1 TerminusDeepSeek-V3.1 Terminus — это обновление DeepSeek V3.1, которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщают пользователи, включая согла…Вход: Текст→Выход: Текст22 сент. 2025 г.164K context
Qwen: Qwen3 Next 80B A3B ThinkingQwen3-Next-80B-A3B-Thinking — это модель чата, основанная на рассуждениях, в линейке Qwen3-Next, которая по умолчанию выводит структурированные следы «мышления». Он предназначен дл…Вход: Текст→Выход: Текст11 сент. 2025 г.262K context
Qwen: Qwen3 Next 80B A3B InstructQwen3-Next-80B-A3B-Instruct — это настроенная на инструкции модель чата из серии Qwen3-Next, оптимизированная для быстрых и стабильных ответов без следов «думания». Он предназначен…Вход: Текст→Выход: Текст11 сент. 2025 г.262K context
MoonshotAI: Kimi K2 0905Kimi K2 0905 — это сентябрьское обновление Kimi K2 0711. Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством 1 триллион па…Вход: Текст→Выход: Текст4 сент. 2025 г.262K context
Qwen: Qwen3 30B A3B Thinking 2507Qwen3-30B-A3B-Thinking-2507 — это модель рассуждения «Смесь экспертов» с 30 параметрами, оптимизированная для сложных задач, требующих расширенного многоэтапного мышления. Модель р…Вход: Текст→Выход: Текст28 авг. 2025 г.131K context
DeepSeek: DeepSeek V3.1DeepSeek-V3.1 — это большая гибридная модель рассуждения (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и режимы без мышления с помощью шаблонов под…Вход: Текст→Выход: Текст21 авг. 2025 г.164K context
OpenAI: gpt-oss-120bgpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
OpenAI: gpt-oss-120b (free)gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
OpenAI: gpt-oss-20bgpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
OpenAI: gpt-oss-20b (free)gpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…Вход: Текст→Выход: Текст5 авг. 2025 г.131K context
Qwen: Qwen3 30B A3B Instruct 2507Qwen3-30B-A3B-Instruct-2507 — это языковая модель смешанного типа экспертов от Qwen с 30,5 млрд параметров и 3,3 млрд активных параметров на вывод. Он работает в режиме «без мышлен…Вход: Текст→Выход: Текст29 июл. 2025 г.131K context
Qwen: Qwen3 235B A22B Thinking 2507Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель с открытой массой экспертов (MoE), оптимизированная для сложных задач рассуждения. Он активирует 22B из 2…Вход: Текст→Выход: Текст25 июл. 2025 г.262K context
Qwen: Qwen3 Coder 480B A35BQwen3-Coder-480B-A35B-Instruct — это модель генерации кода с участием экспертов (MoE), разработанная командой Qwen. Он оптимизирован для задач агентного кодирования, таких как вызо…Вход: Текст→Выход: Текст23 июл. 2025 г.1.0M context
Qwen: Qwen3 235B A22B Instruct 2507Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на команды языковая модель смешанного уровня экспертов, основанная на архитектуре Qwen3-235B, с 22B активных параметро…Вход: Текст→Выход: Текст21 июл. 2025 г.262K context
Mistral: Mistral Small 3.2 24BMistral-Small-3.2-24B-Instruct-2506 — это обновленная модель параметров 24B от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшенного вызова функ…Вход: ИзображенияВход: Текст→Выход: Текст20 июн. 2025 г.128K context
DeepSeek: R1 052828 мая обновление исходной версии DeepSeek R1 Performance, аналогичной OpenAI o1, но с открытым исходным кодом и с полностью открытыми токенами рассуждений. Его размер составляет 6…Вход: Текст→Выход: Текст28 мая 2025 г.164K context
Google: Gemma 3n 4BGemma 3n E4B — оптимизирован для эффективной работы на мобильных и малоресурсных устройствах, таких как телефоны, ноутбуки и планшеты. Он поддерживает мультимодальный ввод, включая…Вход: Текст→Выход: Текст20 мая 2025 г.33K context
Arcee AI: Virtuoso LargeVirtuoso‑Large — это высококлассный LLM общего назначения от Arcee с параметрами 72 B, предназначенный для решения междоменных рассуждений, творческого письма и корпоративного конт…Вход: Текст→Выход: Текст5 мая 2025 г.131K context
Arcee AI: Coder LargeCoder-Large — это потомок Qwen 2.5-Instruct с 32 B-параметрами, который прошел дальнейшее обучение на GitHub с разрешительной лицензией, CodeSearchNet и синтетических корпусах испр…Вход: Текст→Выход: Текст5 мая 2025 г.33K context
Meta: Llama Guard 4 12BLlama Guard 4 — это мультимодальная предварительно обученная модель на основе Llama 4 Scout, настроенная для классификации безопасности контента. Подобно предыдущим версиям, его мо…Вход: ИзображенияВход: Текст→Выход: Текст30 апр. 2025 г.164K context
Qwen: Qwen3 30B A3BQwen3, последнее поколение в серии больших языковых моделей Qwen, имеет как плотную архитектуру, так и архитектуру со смешанным участием экспертов (MoE), позволяющую добиться прево…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Qwen: Qwen3 8BQwen3-8B — это плотная причинно-языковая модель с 8,2 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает п…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Qwen: Qwen3 14BQwen3-14B — это плотная причинно-языковая модель с 14,8 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает…Вход: Текст→Выход: Текст28 апр. 2025 г.132K context
Qwen: Qwen3 32BQwen3-32B — это плотная причинно-языковая модель с 32,8 млрд параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Он поддерживае…Вход: Текст→Выход: Текст28 апр. 2025 г.131K context
Meta: Llama 4 MaverickLlama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре смешанных экспертов (MoE) со 128 экспертами и…Вход: ТекстВход: Изображения→Выход: Текст5 апр. 2025 г.1.0M context
Meta: Llama 4 ScoutLlama 4 Scout 17B Instruct (16E) — это языковая модель смешанных экспертов (MoE), разработанная Meta, которая активирует 17 миллиардов параметров из 109B. Он поддерживает собственн…Вход: ТекстВход: Изображения→Выход: Текст5 апр. 2025 г.10M context
DeepSeek: DeepSeek V3 0324DeepSeek V3, модель, состоящая из нескольких экспертов, с параметрами 685B, является последней версией флагманского семейства моделей чата от команды DeepSeek. Он является преемни…Вход: Текст→Выход: Текст24 мар. 2025 г.164K context
Mistral: Mistral Small 3.1 24BMistral Small 3.1 24B Instruct — это модернизированный вариант Mistral Small 3 (2501), обладающий 24 миллиардами параметров и расширенными мультимодальными возможностями. Он обеспе…Вход: ТекстВход: Изображения→Выход: Текст17 мар. 2025 г.128K context
Google: Gemma 3 4BGemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…Вход: ТекстВход: Изображения→Выход: Текст13 мар. 2025 г.131K context
Google: Gemma 3 12BGemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…Вход: ТекстВход: Изображения→Выход: Текст13 мар. 2025 г.131K context
Google: Gemma 3 27BGemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…Вход: ТекстВход: Изображения→Выход: Текст12 мар. 2025 г.131K context
Mistral: Mistral Small 3Mistral Small 3 — это языковая модель с 24 битами параметров, оптимизированная для обеспечения производительности с малой задержкой при выполнении распространенных задач искусствен…Вход: Текст→Выход: Текст30 янв. 2025 г.33K context
Microsoft: Phi 4Microsoft Research Phi-4 хорошо справляется со сложными логическими задачами и может эффективно работать в ситуациях с ограниченной памятью или когда необходимы быстрые реакции. П…Вход: Текст→Выход: Текст10 янв. 2025 г.16K context
Sao10K: Llama 3.1 70B Hanami x1Это эксперимент Sao10K над Euryale v2.2.Вход: Текст→Выход: Текст8 янв. 2025 г.16K context
DeepSeek: DeepSeek V3DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на следовании инструкциям и возможностях кодирования предыдущих версий. Опубликованные оценки показывают, что моде…Вход: Текст→Выход: Текст26 дек. 2024 г.131K context
Meta: Llama 3.3 70B InstructМногоязычная модель большого языка (LLM) Meta Llama 3.3 представляет собой предварительно обученную и настроенную генеративную модель в 70B (ввод/вывод текста). Модель Llama 3.3, н…Вход: Текст→Выход: Текст6 дек. 2024 г.131K context
Qwen2.5 Coder 32B InstructQwen2.5-Coder — это новейшая серия больших языковых моделей Qwen, специфичных для кода (ранее известных как CodeQwen). Qwen2.5-Coder вносит следующие улучшения в CodeQwen1.5: Чтоб…Вход: Текст→Выход: Текст11 нояб. 2024 г.128K context
Magnum v4 72BЭто серия моделей, призванных воспроизвести прозаическое качество моделей Claude 3, в частности Sonnet (https://openrouter.ai/anthropic/claude-3.5-sonnet (открывается в новой вклад…Вход: Текст→Выход: Текст22 окт. 2024 г.33K context
Qwen: Qwen2.5 7B InstructQwen2.5 7B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области код…Вход: Текст→Выход: Текст16 окт. 2024 г.131K context
TheDrummer: Rocinante 12BРосинант 12Б создан для увлекательного повествования и богатой прозы. Первые тестеры сообщили:Вход: Текст→Выход: Текст30 сент. 2024 г.33K context
Meta: Llama 3.2 11B Vision InstructLlama 3.2 11B Vision — мультимодальная модель с 11 миллиардами параметров, предназначенная для решения задач, объединяющих визуальные и текстовые данные. Он превосходно справляется…Вход: ТекстВход: Изображения→Выход: Текст25 сент. 2024 г.131K context
Meta: Llama 3.2 1B InstructLlama 3.2 1B — это языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач на естественном языке, таких как обобщение, диалог и анализ многоязычн…Вход: Текст→Выход: Текст25 сент. 2024 г.131K context
Meta: Llama 3.2 3B InstructLlama 3.2 3B — это многоязычная модель большого языка с 3 миллиардами параметров, оптимизированная для сложных задач обработки естественного языка, таких как генерация диалогов, ра…Вход: Текст→Выход: Текст25 сент. 2024 г.131K context
Qwen2.5 72B InstructQwen2.5 72B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области ко…Вход: Текст→Выход: Текст19 сент. 2024 г.131K context
Sao10K: Llama 3.1 Euryale 70B v2.2Euryale L3.1 70B v2.2 — модель, ориентированная на творческую ролевую игру от Sao10k(откроется в новой вкладке). Это преемник Euryale L3 70B v2.1.Вход: Текст→Выход: Текст28 авг. 2024 г.131K context
Nous: Hermes 3 70B InstructHermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…Вход: Текст→Выход: Текст18 авг. 2024 г.131K context
Nous: Hermes 3 405B InstructHermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…Вход: Текст→Выход: Текст16 авг. 2024 г.131K context
Sao10K: Llama 3 8B LunarisLunaris 8B — это универсальная и ролевая модель, основанная на Llama 3. Это стратегическое объединение нескольких моделей, призванное сбалансировать творческий подход с улучшенной…Вход: Текст→Выход: Текст13 авг. 2024 г.8K context
Meta: Llama 3.1 70B InstructПоследний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 70B, настроенная на инструкции, оптимизирована для использования в диалогах высокого…Вход: Текст→Выход: Текст23 июл. 2024 г.131K context
Meta: Llama 3.1 8B InstructПоследний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 8B, настроенная по инструкциям, быстрая и эффективная. Он продемонстрировал высокие…Вход: Текст→Выход: Текст23 июл. 2024 г.131K context
Mistral: Mistral NemoМодель с параметрами 12B и длиной контекста токена 128 тыс., созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна и поддерживает английский, французский, немецкий, испа…Вход: Текст→Выход: Текст19 июл. 2024 г.131K context
Meta: Llama 3 8B InstructМодель последнего класса Meta (Llama 3) выпущена в различных размерах и вкусах. Эта версия 8B, настроенная на инструкции, была оптимизирована для использования в высококачественных…Вход: Текст→Выход: Текст18 апр. 2024 г.8K context
Mancer: Weaver (alpha)Попытка воссоздать многословие в стиле Клода, но не ожидайте такого же уровня связности или памяти. Предназначен для использования в ролевых/повествовательных ситуациях.Вход: Текст→Выход: Текст2 авг. 2023 г.8K context
ReMM SLERP 13BПробная версия оригинального MythoMax-L2-B13, но с обновленными моделями. #слияниеВход: Текст→Выход: Текст22 июл. 2023 г.6K context
MythoMax 13BОдна из самых эффективных и популярных доработок Llama 2 13B с богатыми описаниями и ролевыми играми. #слияниеВход: Текст→Выход: Текст2 июл. 2023 г.4K context