Voxtral to rodzina modeli sztucznej inteligencji od Mistral AI, która integruje przetwarzanie tekstu i dźwięku w ramach jednej architektury, umożliwiając natywne zrozumienie mowy, transkrypcję oraz syntezę głosu. Modele te charakteryzują się niskimi opóźnieniami i wysoką wydajnością, wspierając zaawansowane funkcje, takie jak klonowanie głosu, automatyczne wykrywanie języka oraz wywoływanie funkcji bezpośrednio z poleceń głosowych. Dzięki udostępnieniu wag w modelu open-weights, systemy te mogą być uruchamiane lokalnie na komputerach i urządzeniach mobilnych, zapewniając prywatność danych i elastyczność w zastosowaniach biznesowych.
Voxtral
Reklama





