Qwen3-Next-80B

Qwen3-Next-80B to zaawansowany model językowy z rodziny Qwen3, który posiada 80 miliardów parametrów, ale dzięki architekturze Mixture-of-Experts (MoE) aktywuje tylko 3 miliardy z nich podczas generowania odpowiedzi. Wykorzystuje innowacyjny hybrydowy mechanizm uwagi, łączący Gated DeltaNet i Gated Attention, co pozwala na błyskawiczne i efektywne przetwarzanie bardzo długich tekstów o długości przekraczającej 256 tysięcy tokenów. Model charakteryzuje się wysoką wydajnością w zadaniach związanych z programowaniem, rozumowaniem oraz obsługą agentów AI, oferując znacznie wyższą przepustowość niż tradycyjne modele o podobnej skali.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry