Voxtral to rodzina open-source modeli sztucznej inteligencji od Mistral AI, specjalizujących się w przetwarzaniu mowy i tekstu w jednorodnej architekturze. Obejmuje dwa warianty: Voxtral (24B) przeznaczony do aplikacji produkcyjnych oraz Voxtral Mini (3B) optymalizowany dla lokalnych i edge deployments. Modele te zapewniają zaawansowane funkcje, takie jak transkrypcja, rozumienie mowy, synteza głosu, klonowanie głosu, automatyczne wykrywanie języka oraz wykonanie akcji na podstawie poleceń głosowych. Dostępne są pod licencją Apache 2.0, co umożliwia ich lokalne uruchamianie i elastyczne wykorzystanie w zastosowaniach biznesowych.
Voxtral
Źródło: medium.com




