Каталог моделей

Z.ai: GLM 5.2

GLM 5.2 — это крупномасштабная модель рассуждения от Z.ai. Он поддерживает ввод и вывод текста с помощью контекстного окна с токеном 1M и подходит для долгосрочных рабочих процессо…

16 июн. 2026 г.1.0M context

MoonshotAI: Kimi K2.7 Code

MoonshotAI: Kimi K2.7 Code — это ориентированная на кодирование модель семейства Kimi K2 от Moonshot AI, созданная для надежного выполнения сквозных задач программирования в длител…

12 июн. 2026 г.262K context

NVIDIA: Nemotron 3 Ultra

NVIDIA Nemotron 3 Ultra — это открытая модель рассуждений и оркестрации от NVIDIA с 55B активных параметров из общего числа 550B (MoE). Построенный на гибридной архитектуре, состоя…

4 июн. 2026 г.1M context

MiniMax: MiniMax M3

MiniMax-M3 – мультимодальная модель фундамента от MiniMax. Он поддерживает ввод текста, изображений и видео с выводом текста, контекстное окно с токеном 1M и подходит для долгосроч…

31 мая 2026 г.1.0M context

StepFun: Step 3.7 Flash

Step 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture of Experts от StepFun. Он сочетает в себе языковую основу с 196B параметрами и видеокодер для естеств…

28 мая 2026 г.256K context

inclusionAI: Ring-2.6-1T

Ring-2.6-1T — это модель мышления в масштабе 1Т с 63Б активных параметров, созданная для реальных рабочих процессов агентов, требующих как мощных возможностей, так и операционной э…

8 мая 2026 г.262K context

IBM: Granite 4.1 8B

Granite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров, состоящая только из декодера, от IBM, входящая в семейство Granite 4.1. Он поддерживает контекстное окно ра…

30 апр. 2026 г.131K context

MoonshotAI Kimi Latest

Эта модель всегда перенаправляет на последнюю модель семейства MoonshotAI Kimi.

27 апр. 2026 г.262K context

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это мультимодальная модель с открытым весом от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на каждый токен. Он использует…

27 апр. 2026 г.262K context

Qwen: Qwen3.6 27B

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальны…

27 апр. 2026 г.262K context

DeepSeek: DeepSeek V4 Pro

DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общими параметрами 1,6T и активированными параметрами 49B, поддерживающая контекстное окно объемом 1M…

24 апр. 2026 г.1.0M context

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством 284 миллиардов параметров и 13 миллиардами активированных параме…

24 апр. 2026 г.1.0M context

inclusionAI: Ling-2.6-1T

Ling-2.6-1T — это модель мгновенного выполнения (инструктирования) от InclusionAI и флагмана компании с триллионом параметров, предназначенная для реальных агентов, которым требует…

23 апр. 2026 г.262K context

Xiaomi: MiMo-V2.5-Pro

MiMo-V2.5-Pro — это флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентских возможностях, сложной разработке программного обеспечения и долгосрочны…

22 апр. 2026 г.1.0M context

inclusionAI: Ling-2.6-flash

Ling-2.6-flash — это модель мгновенного реагирования (инструктирования) от InclusionAI с общим числом параметров 104 млрд и активными параметрами 7,4 млрд, предназначенная для реал…

21 апр. 2026 г.262K context

MoonshotAI: Kimi K2.6

Kimi K2.6 — это мультимодальная модель следующего поколения Moonshot AI, предназначенная для долгосрочного кодирования, генерации UI/UX на основе кодирования и многоагентной оркест…

20 апр. 2026 г.262K context

Z.ai: GLM 5.1

GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, особенно значительные преимущества в решении долгосрочных задач. В отличие от предыдущих моделей, построенных н…

7 апр. 2026 г.203K context

Google: Gemma 4 26B A4B

Gemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…

3 апр. 2026 г.262K context

Google: Gemma 4 26B A4B (free)

Gemma 4 26B A4B IT — это настроенная на основе инструкций модель Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на общее количество параметров в 25,2 млрд, во время вывода н…

3 апр. 2026 г.262K contextБесплатно

Google: Gemma 4 31B

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind 30,7B, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно на 256 тысяч токе…

2 апр. 2026 г.262K context

Kwaipilot: KAT-Coder-Pro V2

KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для разработки сложного программного обеспечения корпоративного уровня и инт…

27 мар. 2026 г.256K context

MiniMax: MiniMax M2.7

MiniMax-M2.7 — это модель большого языка нового поколения, предназначенная для автономной, реальной производительности и постоянного совершенствования. Созданный для активного учас…

18 мар. 2026 г.205K context

Z.ai: GLM 5 Turbo

GLM-5 Turbo — это новая модель от Z.ai, предназначенная для быстрого вывода и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Он глубоко опт…

15 мар. 2026 г.262K context

NVIDIA: Nemotron 3 Super

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 битами параметров, активирующая всего 12 миллиардов параметров для максимальной эффективности и точности вычислен…

11 мар. 2026 г.1M context

Qwen: Qwen3.5-9B

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, предназначенная для обеспечения четкого рассуждения, кодирования и визуального понимания в эффективной 9B-пара…

10 мар. 2026 г.262K context

Qwen: Qwen3.5-35B-A3B

Qwen3.5 Series 35B-A3B — это собственная модель языка видения, разработанная с использованием гибридной архитектуры, которая объединяет механизмы линейного внимания и модель с разр…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-27B

Модель Dense на языке видения Qwen3.5 27B включает в себя механизм линейного внимания, обеспечивающий быстрое время отклика и одновременно балансирующий скорость вывода и производи…

25 февр. 2026 г.262K context

Qwen: Qwen3.5-122B-A10B

Модель собственного языка видения Qwen3.5 122B-A10B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью разреженной смеси экспертов, что об…

25 февр. 2026 г.262K context

LiquidAI: LFM2-24B-A2B

LFM2-24B-A2B — самая крупная модель в семействе гибридных архитектур LFM2, предназначенная для эффективного развертывания на устройстве. Построенная в виде модели Mixture-of-Expert…

25 февр. 2026 г.128K context

Qwen: Qwen3.5 397B A17B

Модель собственного языка видения серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с моделью с разреженной смесью эксперто…

16 февр. 2026 г.256K context

MiniMax: MiniMax M2.5

MiniMax-M2.5 — это большая языковая модель SOTA, предназначенная для реальной производительности. Обученный в различных сложных реальных цифровых рабочих средах, M2.5 опирается на…

12 февр. 2026 г.205K context

Z.ai: GLM 5

GLM-5 — это флагманская базовая модель Z.ai с открытым исходным кодом, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданный для опытн…

11 февр. 2026 г.203K context

Qwen: Qwen3 Coder Next

Qwen3-Coder-Next — это причинно-следственная языковая модель с открытым весом, оптимизированная для агентов кодирования и рабочих процессов локальной разработки. Он использует разр…

4 февр. 2026 г.262K context

StepFun: Step 3.5 Flash

Step 3.5 Flash — это наиболее эффективная базовая модель StepFun с открытым исходным кодом. Построенный на разреженной архитектуре Mixture of Experts (MoE), он выборочно активирует…

29 янв. 2026 г.262K context

MoonshotAI: Kimi K2.5

Kimi K2.5 — это собственная мультимодальная модель Moonshot AI, обеспечивающая современные возможности визуального кодирования и парадигму самостоятельного роя агентов. Созданный н…

27 янв. 2026 г.262K context

Z.ai: GLM 4.7 Flash

Модель GLM-4.7-Flash, являющаяся моделью SOTA класса 30B, предлагает новую опцию, которая сочетает в себе производительность и эффективность. Он дополнительно оптимизирован для сце…

19 янв. 2026 г.203K context

MiniMax: MiniMax M2.1

MiniMax-M2.1 — это легкая, современная модель большого языка, оптимизированная для кодирования, агентных рабочих процессов и разработки современных приложений. Имея всего 10 миллиа…

23 дек. 2025 г.205K context

Z.ai: GLM 4.7

GLM-4.7 — новейшая флагманская модель Z.ai, в которой реализованы обновления в двух ключевых областях: расширенные возможности программирования и более стабильное многоэтапное расс…

22 дек. 2025 г.203K context

NVIDIA: Nemotron 3 Nano 30B A3B

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, позволяющая разработчикам создавать специализированные аг…

14 дек. 2025 г.262K context

Z.ai: GLM 4.6V

GLM-4.6V — это большая мультимодальная модель, предназначенная для высококачественного визуального понимания и долгоконтекстного анализа изображений, документов и смешанных медиа.…

8 дек. 2025 г.131K context

Mistral: Ministral 3 14B 2512

Самая крупная модель семейства Ministral 3, Ministral 3 14B, предлагает непревзойденные возможности и производительность, сравнимые со своим более крупным аналогом Mistral Small 3.…

2 дек. 2025 г.262K context

Mistral: Ministral 3 8B 2512

Ministral 3 8B, сбалансированная модель семейства Ministral 3, представляет собой мощную и эффективную миниатюрную языковую модель с возможностями машинного зрения.

2 дек. 2025 г.262K context

Mistral: Ministral 3 3B 2512

Ministral 3 3B — самая маленькая модель в семействе Ministral 3. Это мощная и эффективная миниатюрная языковая модель с возможностями машинного зрения.

2 дек. 2025 г.131K context

DeepSeek: DeepSeek V3.2

DeepSeek-V3.2 — это большая языковая модель, предназначенная для сочетания высокой вычислительной эффективности с сильными рассуждениями и производительностью использования агентск…

1 дек. 2025 г.131K context

AllenAI: Olmo 3 32B Think

Olmo 3.1 32B Think — это крупномасштабная модель с 32 миллиардами параметров, предназначенная для глубоких рассуждений, сложной многошаговой логики и выполнения сложных инструкций.…

21 нояб. 2025 г.66K context

Deep Cogito: Cogito v2.1 671B

Cogito v2.1 671B MoE представляет собой одну из самых мощных открытых моделей в мире, сравнимую по производительности с передовыми закрытыми и открытыми моделями. Эта модель обучае…

13 нояб. 2025 г.128K context

MoonshotAI: Kimi K2 Thinking

Kimi K2 Thinking — это самая продвинутая на сегодняшний день модель открытого рассуждения Moonshot AI, расширяющая серию K2 до агентного долгосрочного рассуждения. Построенный на а…

6 нояб. 2025 г.262K context

MiniMax: MiniMax M2

MiniMax-M2 — это компактная, высокоэффективная модель большого языка, оптимизированная для сквозного кодирования и агентных рабочих процессов. Благодаря 10 миллиардам активированны…

23 окт. 2025 г.205K context

IBM: Granite 4.0 Micro

Гранит-4.0-Н-Микро — параметр 3В из семейства моделей Гранит 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они точно настроены для длинного контекстного вызова…

20 окт. 2025 г.131K context

Microsoft: Phi 4 Mini Instruct

Phi-4-mini-instruct — это легкая открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах, с упором на высококачественные и аргументированные…

17 окт. 2025 г.131K context

Qwen: Qwen3 VL 8B Instruct

Qwen3-VL-8B-Instruct — это мультимодальная модель языка видения из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения текста, изображений и видео. Он обеспечивает…

14 окт. 2025 г.256K context

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

Llama-3.3-Nemotron-Super-49B-v1.5 — это англоориентированная модель рассуждений/чата с 49 параметрами, созданная на основе Llama-3.3-70B-Instruct компании Meta с контекстом 128 КБ.…

10 окт. 2025 г.131K context

Qwen: Qwen3 VL 30B A3B Thinking

Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант мышления улучшает мышлен…

6 окт. 2025 г.131K context

Qwen: Qwen3 VL 30B A3B Instruct

Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Его вариант Instruct оптимизирует сл…

6 окт. 2025 г.262K context

Z.ai: GLM 4.6

По сравнению с GLM-4.5 это поколение содержит несколько ключевых улучшений: Более длинное контекстное окно: контекстное окно было расширено со 128 000 до 200 000 токенов, что позв…

30 сент. 2025 г.203K context

DeepSeek: DeepSeek V3.2 Exp

DeepSeek-V3.2-Exp — это экспериментальная модель большого языка, выпущенная DeepSeek как промежуточный этап между V3.1 и будущими архитектурами. Он представляет DeepSeek Sparse Att…

29 сент. 2025 г.164K context

TheDrummer: Cydonia 24B V4.1

Модель творческого письма без цензуры на основе Mistral Small 3.2 24B с хорошей запоминаемостью, быстрым соблюдением правил и интеллектом.

27 сент. 2025 г.131K context

Qwen: Qwen3 VL 235B A22B Thinking

Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель мышления оптимизирована для…

23 сент. 2025 г.131K context

Qwen: Qwen3 VL 235B A22B Instruct

Qwen3-VL-235B-A22B Instruct — это мультимодальная модель с открытым весом, которая объединяет четкое создание текста с визуальным пониманием изображений и видео. Модель Instruct ор…

23 сент. 2025 г.262K context

DeepSeek: DeepSeek V3.1 Terminus

DeepSeek-V3.1 Terminus — это обновление DeepSeek V3.1, которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщают пользователи, включая согла…

22 сент. 2025 г.164K context

Qwen: Qwen3 Next 80B A3B Thinking

Qwen3-Next-80B-A3B-Thinking — это модель чата, основанная на рассуждениях, в линейке Qwen3-Next, которая по умолчанию выводит структурированные следы «мышления». Он предназначен дл…

11 сент. 2025 г.262K context

Qwen: Qwen3 Next 80B A3B Instruct

Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции модель чата из серии Qwen3-Next, оптимизированная для быстрых и стабильных ответов без следов «думания». Он предназначен…

11 сент. 2025 г.262K context

MoonshotAI: Kimi K2 0905

Kimi K2 0905 — это сентябрьское обновление Kimi K2 0711. Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством 1 триллион па…

4 сент. 2025 г.262K context

Qwen: Qwen3 30B A3B Thinking 2507

Qwen3-30B-A3B-Thinking-2507 — это модель рассуждения «Смесь экспертов» с 30 параметрами, оптимизированная для сложных задач, требующих расширенного многоэтапного мышления. Модель р…

28 авг. 2025 г.131K context

Nous: Hermes 4 70B

Гермес 4 70B — это гибридная модель мышления от Nous Research, созданная на основе Мета-Лламы-3.1-70B. В нем представлен тот же гибридный режим, что и в более крупной версии 405B,…

26 авг. 2025 г.131K context

Nous: Hermes 4 405B

Гермес 4 — это крупномасштабная модель рассуждения, созданная на основе Мета-Лламы-3.1-405B и выпущенная Nous Research. Он вводит гибридный режим рассуждения, в котором модель може…

26 авг. 2025 г.131K context

DeepSeek: DeepSeek V3.1

DeepSeek-V3.1 — это большая гибридная модель рассуждения (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и режимы без мышления с помощью шаблонов под…

21 авг. 2025 г.164K context

Z.ai: GLM 4.5V

GLM-4.5V — это базовая модель языка видения для приложений мультимодальных агентов. Построенный на архитектуре Mixture-of-Experts (MoE) с 106B параметров и 12B активированных парам…

11 авг. 2025 г.66K context

OpenAI: gpt-oss-120b

gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) со 117B параметрами от OpenAI, предназначенная для сценариев использования в производственных целях, требующих…

5 авг. 2025 г.131K context

OpenAI: gpt-oss-20b

gpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…

5 авг. 2025 г.131K context

OpenAI: gpt-oss-20b (free)

gpt-oss-20b — это модель параметров с открытым весом 21B, выпущенная OpenAI под лицензией Apache 2.0. Он использует архитектуру Mixture-of-Experts (MoE) с 3,6 млрд активных парамет…

5 авг. 2025 г.131K contextБесплатно

Qwen: Qwen3 Coder 30B A3B Instruct

Qwen3-Coder-30B-A3B-Instruct — это модель Mixture of Experts (MoE) с 30,5 млрд параметров со 128 экспертами (8 активных на каждый прямой проход), предназначенная для расширенной ге…

31 июл. 2025 г.160K context

Qwen: Qwen3 30B A3B Instruct 2507

Qwen3-30B-A3B-Instruct-2507 — это языковая модель смешанного типа экспертов от Qwen с 30,5 млрд параметров и 3,3 млрд активных параметров на вывод. Он работает в режиме «без мышлен…

29 июл. 2025 г.131K context

Qwen: Qwen3 235B A22B Thinking 2507

Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель с открытой массой экспертов (MoE), оптимизированная для сложных задач рассуждения. Он активирует 22B из 2…

25 июл. 2025 г.262K context

Qwen: Qwen3 Coder 480B A35B

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода с участием экспертов (MoE), разработанная командой Qwen. Он оптимизирован для задач агентного кодирования, таких как вызо…

23 июл. 2025 г.1.0M context

Qwen: Qwen3 235B A22B Instruct 2507

Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на команды языковая модель смешанного уровня экспертов, основанная на архитектуре Qwen3-235B, с 22B активных параметро…

21 июл. 2025 г.262K context

Mistral: Mistral Small 3.2 24B

Mistral-Small-3.2-24B-Instruct-2506 — это обновленная модель параметров 24B от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшенного вызова функ…

20 июн. 2025 г.128K context

DeepSeek: R1 0528

28 мая обновление исходной версии DeepSeek R1 Performance, аналогичной OpenAI o1, но с открытым исходным кодом и с полностью открытыми токенами рассуждений. Его размер составляет 6…

28 мая 2025 г.164K context

Google: Gemma 3n 4B

Gemma 3n E4B — оптимизирован для эффективной работы на мобильных и малоресурсных устройствах, таких как телефоны, ноутбуки и планшеты. Он поддерживает мультимодальный ввод, включая…

20 мая 2025 г.33K context

Meta: Llama Guard 4 12B

Llama Guard 4 — это мультимодальная предварительно обученная модель на основе Llama 4 Scout, настроенная для классификации безопасности контента. Подобно предыдущим версиям, его мо…

30 апр. 2025 г.164K context

Qwen: Qwen3 30B A3B

Qwen3, последнее поколение в серии больших языковых моделей Qwen, имеет как плотную архитектуру, так и архитектуру со смешанным участием экспертов (MoE), позволяющую добиться прево…

28 апр. 2025 г.131K context

Qwen: Qwen3 8B

Qwen3-8B — это плотная причинно-языковая модель с 8,2 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает п…

28 апр. 2025 г.131K context

Qwen: Qwen3 14B

Qwen3-14B — это плотная причинно-языковая модель с 14,8 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и для эффективного диалога. Он поддерживает…

28 апр. 2025 г.132K context

Qwen: Qwen3 32B

Qwen3-32B — это плотная причинно-языковая модель с 32,8 млрд параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Он поддерживае…

28 апр. 2025 г.131K context

Meta: Llama 4 Maverick

Llama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре смешанных экспертов (MoE) со 128 экспертами и…

5 апр. 2025 г.1.0M context

Meta: Llama 4 Scout

Llama 4 Scout 17B Instruct (16E) — это языковая модель смешанных экспертов (MoE), разработанная Meta, которая активирует 17 миллиардов параметров из 109B. Он поддерживает собственн…

5 апр. 2025 г.10M context

DeepSeek: DeepSeek V3 0324

DeepSeek V3, модель, состоящая из нескольких экспертов, с параметрами 685B, является последней версией флагманского семейства моделей чата от команды DeepSeek. Он является преемни…

24 мар. 2025 г.164K context

Google: Gemma 3 4B

Gemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…

13 мар. 2025 г.131K context

Google: Gemma 3 12B

Gemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…

13 мар. 2025 г.131K context

Google: Gemma 3 27B

Gemma 3 представляет мультимодальность, поддерживая ввод и текстовый вывод на языке видения. Он обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и пред…

12 мар. 2025 г.131K context

TheDrummer: Skyfall 36B V2

Skyfall 36B v2 — это улучшенная версия Mistral Small 2501, специально настроенная для улучшения творческих способностей, детального письма, ролевой игры и связного повествования.

10 мар. 2025 г.33K context

Qwen: Qwen2.5 VL 72B Instruct

Qwen2.5-VL умеет распознавать обычные объекты, такие как цветы, птицы, рыбы и насекомые. Он также способен анализировать тексты, диаграммы, значки, графику и макеты изображений.

1 февр. 2025 г.131K context

Mistral: Mistral Small 3

Mistral Small 3 — это языковая модель с 24 битами параметров, оптимизированная для обеспечения производительности с малой задержкой при выполнении распространенных задач искусствен…

30 янв. 2025 г.33K context

DeepSeek: R1

DeepSeek R1 уже здесь: производительность на уровне OpenAI o1, но с открытым исходным кодом и полностью открытыми токенами рассуждений. Его размер составляет 671 байт параметров, и…

20 янв. 2025 г.164K context

Microsoft: Phi 4

Microsoft Research Phi-4 хорошо справляется со сложными логическими задачами и может эффективно работать в ситуациях с ограниченной памятью или когда необходимы быстрые реакции. П…

10 янв. 2025 г.16K context

DeepSeek: DeepSeek V3

DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на следовании инструкциям и возможностях кодирования предыдущих версий. Опубликованные оценки показывают, что моде…

26 дек. 2024 г.131K context

Sao10K: Llama 3.3 Euryale 70B

Euryale L3.3 70B — модель, ориентированная на творческую ролевую игру от Sao10k(открывается в новой вкладке). Это преемник Euryale L3 70B v2.2.

18 дек. 2024 г.131K context

Meta: Llama 3.3 70B Instruct

Многоязычная модель большого языка (LLM) Meta Llama 3.3 представляет собой предварительно обученную и настроенную генеративную модель в 70B (ввод/вывод текста). Модель Llama 3.3, н…

6 дек. 2024 г.131K context

TheDrummer: UnslopNemo 12B

UnslopNemo v4.1 — это последнее дополнение от создателя Rocinante, предназначенное для написания приключенческих сценариев и ролевых игр.

8 нояб. 2024 г.33K context

Magnum v4 72B

Это серия моделей, призванных воспроизвести прозаическое качество моделей Claude 3, в частности Sonnet (https://openrouter.ai/anthropic/claude-3.5-sonnet (открывается в новой вклад…

22 окт. 2024 г.33K context

Qwen: Qwen2.5 7B Instruct

Qwen2.5 7B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области код…

16 окт. 2024 г.131K context

Meta: Llama 3.2 11B Vision Instruct

Llama 3.2 11B Vision — мультимодальная модель с 11 миллиардами параметров, предназначенная для решения задач, объединяющих визуальные и текстовые данные. Он превосходно справляется…

25 сент. 2024 г.131K context

Qwen2.5 72B Instruct

Qwen2.5 72B — новейшая серия моделей Qwen с большим языком. Qwen2.5 вносит следующие улучшения в Qwen2: Значительно больше знаний и значительно улучшенные возможности в области ко…

19 сент. 2024 г.131K context

Sao10K: Llama 3.1 Euryale 70B v2.2

Euryale L3.1 70B v2.2 — модель, ориентированная на творческую ролевую игру от Sao10k(откроется в новой вкладке). Это преемник Euryale L3 70B v2.1.

28 авг. 2024 г.131K context

Nous: Hermes 3 70B Instruct

Hermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…

18 авг. 2024 г.131K context

Nous: Hermes 3 405B Instruct

Hermes 3 — это универсальная языковая модель со многими улучшениями по сравнению с Hermes 2, включая расширенные агентские возможности, гораздо лучшую ролевую игру, рассуждение, мн…

16 авг. 2024 г.131K context

Sao10K: Llama 3 8B Lunaris

Lunaris 8B — это универсальная и ролевая модель, основанная на Llama 3. Это стратегическое объединение нескольких моделей, призванное сбалансировать творческий подход с улучшенной…

13 авг. 2024 г.8K context

Meta: Llama 3.1 70B Instruct

Последний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 70B, настроенная на инструкции, оптимизирована для использования в диалогах высокого…

23 июл. 2024 г.131K context

Meta: Llama 3.1 8B Instruct

Последний класс моделей Meta (Llama 3.1) представлен в различных размерах и вкусах. Эта версия 8B, настроенная по инструкциям, быстрая и эффективная. Он продемонстрировал высокие…

23 июл. 2024 г.131K context

Mistral: Mistral Nemo

Модель с параметрами 12B и длиной контекста токена 128 тыс., созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна и поддерживает английский, французский, немецкий, испа…

19 июл. 2024 г.131K context

Google: Gemma 2 27B

Gemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, которые использовались при создании моделей Gemini. Модели Gemma хорошо подходят…

13 июл. 2024 г.8K context

Meta: Llama 3 8B Instruct

Модель последнего класса Meta (Llama 3) выпущена в различных размерах и вкусах. Эта версия 8B, настроенная на инструкции, была оптимизирована для использования в высококачественных…

18 апр. 2024 г.8K context

WizardLM-2 8x22B

WizardLM-2 8x22B — самая совершенная модель Wizard от Microsoft AI. Он демонстрирует высокую конкурентоспособность по сравнению с ведущими проприетарными моделями и неизменно прево…

16 апр. 2024 г.66K context

Mancer: Weaver (alpha)

Попытка воссоздать многословие в стиле Клода, но не ожидайте такого же уровня связности или памяти. Предназначен для использования в ролевых/повествовательных ситуациях.

2 авг. 2023 г.8K context

ReMM SLERP 13B

Пробная версия оригинального MythoMax-L2-B13, но с обновленными моделями. #слияние

22 июл. 2023 г.6K context

MythoMax 13B

Одна из самых эффективных и популярных доработок Llama 2 13B с богатыми описаниями и ролевыми играми. #слияние

2 июл. 2023 г.4K context