T2V-1.3B to wariant modelu sztucznej inteligencji Wan2.1 o rozmiarze 1,3 miliarda parametrów, wyspecjalizowany w generowaniu wideo na podstawie opisów tekstowych. Został zoptymalizowany pod kątem wydajności na konsumenckich kartach graficznych, wymagając jedynie około 8,2 GB pamięci VRAM do tworzenia wysokiej jakości animacji w rozdzielczości 480P. Model ten wykorzystuje architekturę Diffusion Transformer i wspiera wielojęzyczność, w tym generowanie napisów w języku angielskim i chińskim.
📖 Dowiedz się więcej w kontekście:
Reklama





