Whisper to opracowany przez OpenAI zaawansowany model sztucznej inteligencji służący do automatycznego rozpoznawania mowy i zamiany dźwięku na tekst. Został wytrenowany na ogromnym zbiorze danych audio, dzięki czemu potrafi precyzyjnie transkrybować mowę w wielu językach, tłumaczyć nagrania na język angielski oraz skutecznie radzić sobie z akcentami i szumem tła.
Źródło: en.wikipedia.org




