Voxtral Small (24B) to zaawansowany model audio-językowy o 24 miliardach parametrów, stworzony przez Mistral AI na bazie architektury Mistral Small 3. System ten łączy możliwości przetwarzania tekstu z natywnym rozumieniem dźwięku, oferując wysoką precyzję w transkrypcji, tłumaczeniu mowy oraz wywoływaniu funkcji bezpośrednio z poleceń głosowych. Dzięki oknu kontekstowemu wynoszącemu 32 000 tokenów, model potrafi efektywnie analizować nagrania audio trwające od 30 do 40 minut w wielu językach.
📖 Dowiedz się więcej w kontekście:
Reklama





