Voxtral Mini (3B) to multimodalny model językowy o otwartym kodzie źródłowym opracowany przez Mistral AI, zawierający około 3 miliardów parametrów. Jest zoptymalizowany pod kątem przetwarzania multimodalnego, w tym rozumienia i generowania tekstu oraz obrazów, z możliwością dalszego rozwoju w kierunku obsługi dźwięku. Model jest przeznaczony do wdrożeń lokalnych i brzegowych (edge computing), oferując efektywność obliczeniową przy zachowaniu wysokiej jakości generowanych treści.




