Tensor Processing Unit (TPU) to wyspecjalizowany układ scalony typu ASIC, zaprojektowany przez Google w celu przyspieszenia obliczeń związanych z uczeniem maszynowym i sieciami neuronowymi. W przeciwieństwie do procesorów ogólnego przeznaczenia, TPU optymalizuje operacje na tensorach i mnożenie macierzy, co pozwala na znacznie szybsze trenowanie oraz inferencję dużych modeli AI. Architektura ta charakteryzuje się wysoką wydajnością przy jednoczesnym niskim zużyciu energii, co czyni ją kluczowym elementem infrastruktury Google Cloud. Rozwiązanie to jest obecnie powszechnie wykorzystywane do obsługi zaawansowanych systemów, takich jak modele językowe Gemini czy Mapy Google.




