Od modelu do algorytmu: jak naprawdę działa uczenie maszynowe 23 czerwca, 2026
Kimi K2.7 Code – nowy otwarty model do programowania od Moonshot AI 15 czerwca, 2026
AI Act dla MŚP – specjalny przewodnik dla małych firm: co musisz zrobić, gdy masz 5 pracowników 12 czerwca, 2026
DiffusionGemma: otwarty model Google z 4x szybszą generacją tekstu 11 czerwca, 2026

MoonViT (Encoder Wizyjny) (MoonViT)

MoonViT (Native-resolution Vision Encoder) to otwartoźródłowy encoder wizyjny o architekturze Vision Transformer (ViT), opracowany przez firmę Moonshot AI i posiadający około 400 milionów parametrów. Charakteryzuje się zdolnością do bezpośredniego przetwarzania obrazów o różnych, natywnych rozdzielczościach i proporcjach, co eliminuje potrzebę skomplikowanego dzielenia czy zniekształcania danych wejściowych. W celu optymalizacji obliczeniowej globalna warstwa self-attention została w nim zastąpiona przez mechanizm attention oparty na mniejszych, stałych oknach. Technologia ta, wykorzystująca również zaawansowane kodowanie pozycyjne 2D RoPE, stanowi kluczowy komponent wizualny modeli z serii Kimi, pozwalając na precyzyjne rozumienie detali przy zachowaniu niskich kosztów operacyjnych.

📖 Dowiedz się więcej w kontekście:

Kimi K2.7 Code – nowy otwarty model do programowania od Moonshot AI

Autor

Artur Kowynia

Strona internetowa 167 postów

Zobacz wszystkie posty

Powrót do góry

📖 Dowiedz się więcej w kontekście:

Artur Kowynia

Powiązane posty