Каталог моделей

Z.ai: GLM 5.2

GLM 5.2 — это крупномасштабная модель рассуждения от Z.ai. Он поддерживает ввод и вывод текста с помощью контекстного окна с токеном 1M и подходит для долгосрочных рабочих процессо…

16 июн. 2026 г.1.0M context

MoonshotAI: Kimi K2.7 Code

MoonshotAI: Kimi K2.7 Code — это ориентированная на кодирование модель семейства Kimi K2 от Moonshot AI, созданная для надежного выполнения сквозных задач программирования в длител…

12 июн. 2026 г.262K context

NVIDIA: Nemotron 3 Ultra

NVIDIA Nemotron 3 Ultra — это открытая модель рассуждений и оркестрации от NVIDIA с 55B активных параметров из общего числа 550B (MoE). Построенный на гибридной архитектуре, состоя…

4 июн. 2026 г.1M context

MiniMax: MiniMax M3

MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…

31 мая 2026 г.1.0M context

StepFun: Step 3.7 Flash

Step 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…

28 мая 2026 г.256K context

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…

27 апр. 2026 г.262K context

Qwen: Qwen3.6 27B

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…

27 апр. 2026 г.262K context

DeepSeek: DeepSeek V4 Pro

DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общими параметрами 1,6T и активированными параметрами 49B, поддерживающая контекстное окно объемом 1M…

24 апр. 2026 г.1.0M context

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параме…

24 апр. 2026 г.1.0M context

Xiaomi: MiMo-V2.5-Pro

MiMo-V2.5-Pro — это флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентских возможностях, сложной разработке программного обеспечения и долгосрочны…

22 апр. 2026 г.1.0M context

MoonshotAI: Kimi K2.6

Kimi K2.6 — это мультимодальная модель следующего поколения Moonshot AI, предназначенная для долгосрочного кодирования, генерации UI/UX на основе кодирования и многоагентной оркест…

20 апр. 2026 г.262K context

Z.ai: GLM 5.1

GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, особенно значительные преимущества в решении долгосрочных задач. В отличие от предыдущих моделей, построенных н…

7 апр. 2026 г.203K context

Google: Gemma 4 26B A4B

Gemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…

3 апр. 2026 г.262K context

Google: Gemma 4 31B

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…

2 апр. 2026 г.262K context

Google: Gemma 4 31B (free)

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…

2 апр. 2026 г.262K context

Kwaipilot: KAT-Coder-Pro V2

KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для разработки сложного программного обеспечения корпоративного уровня и инт…

27 мар. 2026 г.256K context

MiniMax: MiniMax M2.7

MiniMax-M2.7 — это модель большого языка нового поколения, предназначенная для автономной, реальной производительности и постоянного совершенствования. Созданный для активного учас…

18 мар. 2026 г.205K context

Z.ai: GLM 5 Turbo

GLM-5 Turbo — это новая модель от Z.ai, предназначенная для быстрого вывода и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Он глубоко опт…

15 мар. 2026 г.262K context

NVIDIA: Nemotron 3 Super

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 битами параметров, активирующая всего 12 миллиардов параметров для максимальной эффективности и точности вычислен…

11 мар. 2026 г.1M context

Qwen: Qwen3.5-9B

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…

10 мар. 2026 г.262K context

Qwen: Qwen3.5-35B-A3B

Qwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-27B

Модель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-122B-A10B

Модель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…

25 февр. 2026 г.262K context

LiquidAI: LFM2-24B-A2B

LFM2-24B-A2B — самая крупная модель в семействе гибридных архитектур LFM2, предназначенная для эффективного развертывания на устройстве. Построенная в виде модели Mixture-of-Expert…

25 февр. 2026 г.128K context

Qwen: Qwen3.5 397B A17B

Модель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…

16 февр. 2026 г.256K context

MiniMax: MiniMax M2.5

MiniMax-M2.5 — это большая языковая модель SOTA, предназначенная для реальной производительности. Обученный в различных сложных реальных цифровых рабочих средах, M2.5 опирается на…

12 февр. 2026 г.205K context

Z.ai: GLM 5

GLM-5 — это флагманская базовая модель Z.ai с открытым исходным кодом, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданный для опытн…

11 февр. 2026 г.203K context

Qwen: Qwen3 Coder Next

Qwen3-Coder-Next — это причинно-следственная языковая модель с открытым весом, оптимизированная для агентов кодирования и рабочих процессов локальной разработки. Он использует разр…

4 февр. 2026 г.262K context

StepFun: Step 3.5 Flash

Step 3.5 Flash — это наиболее эффективная базовая модель StepFun с открытым исходным кодом. Построенный на разреженной архитектуре Mixture of Experts (MoE), он выборочно активирует…

29 янв. 2026 г.262K context

MoonshotAI: Kimi K2.5

Kimi K2.5 — это собственная мультимодальная модель Moonshot AI, обеспечивающая современные возможности визуального кодирования и парадигму самостоятельного роя агентов. Созданный н…

27 янв. 2026 г.262K context

LiquidAI: LFM2.5-1.2B-Thinking (free)

LFM2.5-1.2B-Thinking — это облегченная модель, ориентированная на рассуждения, оптимизированная для агентских задач, извлечения данных и RAG, при этом она по-прежнему комфортно раб…

20 янв. 2026 г.33K context

LiquidAI: LFM2.5-1.2B-Instruct (free)

LFM2.5-1.2B-Instruct — это компактная, высокопроизводительная модель с настраиваемыми инструкциями, созданная для быстрого искусственного интеллекта на устройстве. Он обеспечивает…

20 янв. 2026 г.33K context

Z.ai: GLM 4.7 Flash

Модель GLM-4.7-Flash, являющаяся моделью SOTA класса 30B, предлагает новую опцию, которая сочетает в себе производительность и эффективность. Он дополнительно оптимизирован для сце…

19 янв. 2026 г.203K context

MiniMax: MiniMax M2.1

MiniMax-M2.1 — это легкая, современная модель большого языка, оптимизированная для кодирования, агентных рабочих процессов и разработки современных приложений. Имея всего 10 миллиа…

23 дек. 2025 г.205K context

Z.ai: GLM 4.7

GLM-4.7 — новейшая флагманская модель Z.ai, в которой реализованы обновления в двух ключевых областях: расширенные возможности программирования и более стабильное многоэтапное расс…

22 дек. 2025 г.203K context

NVIDIA: Nemotron 3 Nano 30B A3B

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, позволяющая разработчикам создавать специализированные аг…

14 дек. 2025 г.262K context

DeepSeek: DeepSeek V3.2

DeepSeek-V3.2 — это большая языковая модель, предназначенная для сочетания высокой вычислительной эффективности с сильными рассуждениями и производительностью использования агентск…

1 дек. 2025 г.131K context

Deep Cogito: Cogito v2.1 671B

Cogito v2.1 671B MoE представляет собой одну из самых мощных открытых моделей в мире, сравнимую по производительности с передовыми закрытыми и открытыми моделями. Эта модель обучае…

13 нояб. 2025 г.128K context

MoonshotAI: Kimi K2 Thinking

Kimi K2 Thinking — это самая продвинутая на сегодняшний день модель открытого рассуждения Moonshot AI, расширяющая серию K2 до агентного долгосрочного рассуждения. Построенный на а…

6 нояб. 2025 г.262K context

MiniMax: MiniMax M2

MiniMax-M2 — это компактная, высокоэффективная модель большого языка, оптимизированная для сквозного кодирования и агентных рабочих процессов. Благодаря 10 миллиардам активированны…

23 окт. 2025 г.205K context

IBM: Granite 4.0 Micro

Гранит-4.0-Н-Микро — параметр 3В из семейства моделей Гранит 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они точно настроены для длинного контекстного вызова…

20 окт. 2025 г.131K context

Qwen: Qwen3 VL 8B Instruct

Qwen3-VL-8B-Instruct — это мультимодальная модель языка видения из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения текста, изображений и видео. Он обеспечивает…

14 окт. 2025 г.256K context

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

Llama-3.3-Nemotron-Super-49B-v1.5 — это англоориентированная модель рассуждений/чата с 49 параметрами, созданная на основе Llama-3.3-70B-Instruct компании Meta с контекстом 128 КБ.…

10 окт. 2025 г.131K context

Qwen: Qwen3 VL 30B A3B Instruct

Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант Instruct оптимизирует сл…

6 окт. 2025 г.262K context

Z.ai: GLM 4.6

По сравнению с GLM-4.5 это поколение содержит несколько ключевых улучшений: Более длинное контекстное окно: контекстное окно было расширено со 128 000 до 200 000 токенов, что позв…

30 сент. 2025 г.203K context

DeepSeek: DeepSeek V3.2 Exp

DeepSeek-V3.2-Exp — это экспериментальная модель большого языка, выпущенная DeepSeek как промежуточный этап между V3.1 и будущими архитектурами. Он представляет DeepSeek Sparse Att…

29 сент. 2025 г.164K context

Qwen: Qwen3 VL 235B A22B Instruct

Qwen3-VL-235B-A22B Instruct — это мультимодальная модель с открытым весом, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель Instruct ор…

23 сент. 2025 г.262K context

DeepSeek: DeepSeek V3.1 Terminus

DeepSeek-V3.1 Terminus — это обновление DeepSeek V3.1, которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщают пользователи, включая согла…

22 сент. 2025 г.164K context

Qwen: Qwen3 Next 80B A3B Thinking

Qwen3-Next-80B-A3B-Thinking — это модель чата, основанная на рассуждениях, в линейке Qwen3-Next, которая по умолчанию выводит структурированные следы «мышления». Он предназначен дл…

11 сент. 2025 г.262K context

Qwen: Qwen3 Next 80B A3B Instruct

Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции модель чата из серии Qwen3-Next, оптимизированная для быстрых и стабильных ответов без следов «думания». Он предназначен…

11 сент. 2025 г.262K context

MoonshotAI: Kimi K2 0905

Kimi K2 0905 — это сентябрьское обновление Kimi K2 0711. Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством 1 триллион па…

4 сент. 2025 г.262K context

Qwen: Qwen3 30B A3B Thinking 2507

Qwen3-30B-A3B-Thinking-2507 — это модель рассуждения «Смесь экспертов» с 30 параметрами, оптимизированная для сложных задач, требующих расширенного многоэтапного мышления. Модель р…

28 авг. 2025 г.131K context

DeepSeek: DeepSeek V3.1

DeepSeek-V3.1 — это большая гибридная модель рассуждения (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и режимы без мышления с помощью шаблонов под…

21 авг. 2025 г.164K context

OpenAI: gpt-oss-120b

gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…

5 авг. 2025 г.131K context

OpenAI: gpt-oss-120b (free)

gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…

5 авг. 2025 г.131K context

OpenAI: gpt-oss-20b

gpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…

5 авг. 2025 г.131K context

OpenAI: gpt-oss-20b (free)

gpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…

5 авг. 2025 г.131K context

Qwen: Qwen3 30B A3B Instruct 2507

Qwen3-30B-A3B-Instruct-2507 — это языковая модель смешанного типа экспертов от Qwen с 30,5 млрд параметров и 3,3 млрд активных параметров на вывод. Он работает в режиме «без мышлен…

29 июл. 2025 г.131K context

Qwen: Qwen3 235B A22B Thinking 2507

Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель с открытой массой экспертов (MoE), оптимизированная для сложных задач рассуждения. Он активирует 22B из 2…

25 июл. 2025 г.262K context

Qwen: Qwen3 Coder 480B A35B

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода с участием экспертов (MoE), разработанная командой Qwen. Он оптимизирован для задач агентного кодирования, таких как вызо…

23 июл. 2025 г.1.0M context

Qwen: Qwen3 235B A22B Instruct 2507

Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на команды языковая модель смешанного уровня экспертов, основанная на архитектуре Qwen3-235B, с 22B активных параметро…

21 июл. 2025 г.262K context

Mistral: Mistral Small 3.2 24B

Mistral-Small-3.2-24B-Instruct-2506 — это обновленная модель параметров 24B от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшенного вызова функ…

20 июн. 2025 г.128K context

DeepSeek: R1 0528

28 мая обновление исходной версии DeepSeek R1 Performance, аналогичной OpenAI o1, но с открытым исходным кодом и с полностью открытыми токенами рассуждений. Его размер составляет 6…

28 мая 2025 г.164K context

Google: Gemma 3n 4B

Gemma 3n E4B — оптимизирован для эффективной работы на мобильных и малоресурсных устройствах, таких как телефоны, ноутбуки и планшеты. Он поддерживает мультимодальный ввод, включая…

20 мая 2025 г.33K context

Arcee AI: Virtuoso Large

Virtuoso‑Large — это высококлассный LLM общего назначения от Arcee с параметрами 72 B, предназначенный для решения междоменных рассуждений, творческого письма и корпоративного конт…

5 мая 2025 г.131K context

Arcee AI: Coder Large

Coder-Large — это потомок Qwen 2.5-Instruct с 32 B-параметрами, который прошел дальнейшее обучение на GitHub с разрешительной лицензией, CodeSearchNet и синтетических корпусах испр…

5 мая 2025 г.33K context

Meta: Llama Guard 4 12B

Llama Guard 4 — это мультимодальная предварительно обученная модель на основе Llama 4 Scout, настроенная для классификации безопасности контента. Подобно предыдущим версиям, его мо…

30 апр. 2025 г.164K context

Qwen: Qwen3 30B A3B

Qwen3, последнее поколение в серии больших языковых моделей Qwen, имеет как плотную архитектуру, так и архитектуру со смешанным участием экспертов (MoE), позволяющую добиться прево…

28 апр. 2025 г.131K context

Qwen: Qwen3 8B

Qwen3-8B — это плотная причинно-языковая модель с 8,2 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает п…

28 апр. 2025 г.131K context

Qwen: Qwen3 14B

Qwen3-14B — это плотная причинно-языковая модель с 14,8 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает…

28 апр. 2025 г.132K context

Qwen: Qwen3 32B

Qwen3-32B — это плотная причинно-языковая модель с 32,8 млрд параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Он поддерживае…

28 апр. 2025 г.131K context

Meta: Llama 4 Maverick

Llama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре смешанных экспертов (MoE) со 128 экспертами и…

5 апр. 2025 г.1.0M context

Meta: Llama 4 Scout

Llama 4 Scout 17B Instruct (16E) — это языковая модель смешанных экспертов (MoE), разработанная Meta, которая активирует 17 миллиардов параметров из 109B. Он поддерживает собственн…

5 апр. 2025 г.10M context

DeepSeek: DeepSeek V3 0324

DeepSeek V3, модель, состоящая из нескольких экспертов, с параметрами 685B, является последней версией флагманского семейства моделей чата от команды DeepSeek. Он является преемни…

24 мар. 2025 г.164K context

Mistral: Mistral Small 3.1 24B

Mistral Small 3.1 24B Instruct — это модернизированный вариант Mistral Small 3 (2501), обладающий 24 миллиардами параметров и расширенными мультимодальными возможностями. Он обеспе…

17 мар. 2025 г.128K context

Google: Gemma 3 4B

Gemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…

13 мар. 2025 г.131K context

Google: Gemma 3 12B

Gemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…

13 мар. 2025 г.131K context

Google: Gemma 3 27B

Gemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…

12 мар. 2025 г.131K context

Mistral: Mistral Small 3

Mistral Small 3 — это языковая модель с 24 битами параметров, оптимизированная для обеспечения производительности с малой задержкой при выполнении распространенных задач искусствен…

30 янв. 2025 г.33K context

Microsoft: Phi 4

Microsoft Research Phi-4 хорошо справляется со сложными логическими задачами и может эффективно работать в ситуациях с ограниченной памятью или когда необходимы быстрые реакции. П…

10 янв. 2025 г.16K context

Sao10K: Llama 3.1 70B Hanami x1

Это эксперимент Sao10K над Euryale v2.2.

8 янв. 2025 г.16K context

DeepSeek: DeepSeek V3

DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на следовании инструкциям и возможностях кодирования предыдущих версий. Опубликованные оценки показывают, что моде…

26 дек. 2024 г.131K context

Meta: Llama 3.3 70B Instruct

Многоязычная модель большого языка (LLM) Meta Llama 3.3 представляет собой предварительно обученную и настроенную генеративную модель в 70B (ввод/вывод текста). Модель Llama 3.3, н…

6 дек. 2024 г.131K context

Qwen2.5 Coder 32B Instruct

Qwen2.5-Coder — это новейшая серия больших языковых моделей Qwen, специфичных для кода (ранее известных как CodeQwen). Qwen2.5-Coder вносит следующие улучшения в CodeQwen1.5: Чтоб…

11 нояб. 2024 г.128K context

Magnum v4 72B

Это серия моделей, призванных воспроизвести прозаическое качество моделей Claude 3, в частности Sonnet (https://openrouter.ai/anthropic/claude-3.5-sonnet (открывается в новой вклад…

22 окт. 2024 г.33K context

Qwen: Qwen2.5 7B Instruct

Qwen2.5 7B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области код…

16 окт. 2024 г.131K context

TheDrummer: Rocinante 12B

Росинант 12Б создан для увлекательного повествования и богатой прозы. Первые тестеры сообщили:

30 сент. 2024 г.33K context

Meta: Llama 3.2 11B Vision Instruct

Llama 3.2 11B Vision — мультимодальная модель с 11 миллиардами параметров, предназначенная для решения задач, объединяющих визуальные и текстовые данные. Он превосходно справляется…

25 сент. 2024 г.131K context

Meta: Llama 3.2 1B Instruct

Llama 3.2 1B — это языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач на естественном языке, таких как обобщение, диалог и анализ многоязычн…

25 сент. 2024 г.131K context

Meta: Llama 3.2 3B Instruct

Llama 3.2 3B — это многоязычная модель большого языка с 3 миллиардами параметров, оптимизированная для сложных задач обработки естественного языка, таких как генерация диалогов, ра…

25 сент. 2024 г.131K context

Qwen2.5 72B Instruct

Qwen2.5 72B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области ко…

19 сент. 2024 г.131K context

Sao10K: Llama 3.1 Euryale 70B v2.2

Euryale L3.1 70B v2.2 — модель, ориентированная на творческую ролевую игру от Sao10k(откроется в новой вкладке). Это преемник Euryale L3 70B v2.1.

28 авг. 2024 г.131K context

Nous: Hermes 3 70B Instruct

Hermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…

18 авг. 2024 г.131K context

Nous: Hermes 3 405B Instruct

Hermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…

16 авг. 2024 г.131K context

Sao10K: Llama 3 8B Lunaris

Lunaris 8B — это универсальная и ролевая модель, основанная на Llama 3. Это стратегическое объединение нескольких моделей, призванное сбалансировать творческий подход с улучшенной…

13 авг. 2024 г.8K context

Meta: Llama 3.1 70B Instruct

Последний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 70B, настроенная на инструкции, оптимизирована для использования в диалогах высокого…

23 июл. 2024 г.131K context

Meta: Llama 3.1 8B Instruct

Последний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 8B, настроенная по инструкциям, быстрая и эффективная. Он продемонстрировал высокие…

23 июл. 2024 г.131K context

Mistral: Mistral Nemo

Модель с параметрами 12B и длиной контекста токена 128 тыс., созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна и поддерживает английский, французский, немецкий, испа…

19 июл. 2024 г.131K context

Meta: Llama 3 8B Instruct

Модель последнего класса Meta (Llama 3) выпущена в различных размерах и вкусах. Эта версия 8B, настроенная на инструкции, была оптимизирована для использования в высококачественных…

18 апр. 2024 г.8K context

Mancer: Weaver (alpha)

Попытка воссоздать многословие в стиле Клода, но не ожидайте такого же уровня связности или памяти. Предназначен для использования в ролевых/повествовательных ситуациях.

2 авг. 2023 г.8K context

ReMM SLERP 13B

Пробная версия оригинального MythoMax-L2-B13, но с обновленными моделями. #слияние

22 июл. 2023 г.6K context

MythoMax 13B

Одна из самых эффективных и популярных доработок Llama 2 13B с богатыми описаниями и ролевыми играми. #слияние

2 июл. 2023 г.4K context