DeepSeek-V3.1 to hybrydowy model językowy o architekturze Mixture-of-Experts (MoE), wprowadzający tryb reasoning (rozumowania) z rozszerzonym procesem wnioskowania oraz standardowy tryb generacji tekstu. Model charakteryzuje się oknem kontekstowym 128 tysięcy tokenów, jest dostępny jako otwarty model (open weights) i oferowany przez DeepSeek AI. Według analiz z 2025 roku osiąga średnią wydajność w zakresie inteligencji (skorzystanie 28/87 na Artificial Analysis Intelligence Index), przy wyższych kosztach niż niektóre konkurencyjne modele otwarte. Wersja ta została zastąpiona przez nowszą iterację DeepSeek-V3.1 Terminus, jednak nadal jest dostępna w niektórych implementacjach API.
DeepSeek-V3.1
Źródło: huggingface.co




