Voxtral

Voxtral to rodzina open-source modeli sztucznej inteligencji od Mistral AI, specjalizujących się w przetwarzaniu mowy i tekstu w jednorodnej architekturze. Obejmuje dwa warianty: Voxtral (24B) przeznaczony do aplikacji produkcyjnych oraz Voxtral Mini (3B) optymalizowany dla lokalnych i edge deployments. Modele te zapewniają zaawansowane funkcje, takie jak transkrypcja, rozumienie mowy, synteza głosu, klonowanie głosu, automatyczne wykrywanie języka oraz wykonanie akcji na podstawie poleceń głosowych. Dostępne są pod licencją Apache 2.0, co umożliwia ich lokalne uruchamianie i elastyczne wykorzystanie w zastosowaniach biznesowych.

Źródło: medium.com

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry