OpenJarvis to otwartoźródłowy framework rozwijany na Stanfordzie, który pozwala budować personalnych agentów AI działających domyślnie na lokalnym sprzęcie. Zamiast wysyłać każde zapytanie do chmury, system wykonuje inferencję bezpośrednio na komputerze użytkownika, traktując efektywność energetyczną i opóźnienie jako równorzędne ograniczenia obok dokładności modelu.
Kontekst i motywacja

Badania przeprowadzone w ramach inicjatywy Intelligence Per Watt wykazały, że lokalne modele językowe są w stanie obsłużyć 88,7% zapytań typu chat i reasoning w czasie interaktywnym, przy czym efektywność inteligencji poprawiła się 5,3-krotnie w latach 2023–2025. Mimo to większość obecnych rozwiązań klasy „personal AI” nadze przekierowuje ruch do zewnętrznych API, co oznacza wysyłanie prywatnych danych na serwery podmiotów trzecich. OpenJarvis powstał, by zamknąć tę lukę infrastrukturalną i udostępnić stos oprogramowania, w którym chmura jest opcją, a nie domyślnym środowiskiem wykonawczym.
Pięć komponowalnych prymitywów
Architektura frameworku opiera się na pięciu warstwach, które można zastępować i optymalizować niezależnie lub analizować jako całość:
- Intelligence — warstwa modeli językowych działających lokalnie. OpenJarvis udostępnia ujednolicony katalog modeli, który pozwala użytkownikowi określić wymaganą zdolność, a framework dobiera model realistyczny dla dostępnego sprzętu. Obsługuje rodziny takie jak Qwen, GPT-OSS, Gemma, Granite, GLM czy Kimi.
- Engine — warstwa inferencji. Framework abstrahuje fragmentację lokalnych backendów (Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models i inne) i automatycznie dobiera konfigurację pod dostępny sprzęt. Komendy
jarvis initijarvis doctorsłużą odpowiednio do detekcji oraz weryfikacji środowiska. - Agents — warstwa zachowań i wzorców rozumowania. Oprócz klasycznego ReAct, OpenJarvis wprowadza role takie jak Orchestrator (planowanie i delegowanie podzadań) oraz Operative (lekki agent wykonawczy dla powtarzalnych workflowów). Całość projektowana jest pod ograniczenia pamięci i kontekstu na urządzeniach końcowych.
- Tools & Memory — warstwa integracji ze światem zewnętrznym. System wspiera MCP (Model Context Protocol) do ustandaryzowanego użycia narzędzi, Google A2A do komunikacji między agentami, indeksowanie semantyczne dokumentów lokalnych oraz integracje z kanałami komunikacyjnymi (iMessage, Telegram, WhatsApp, webchat, webhooki). Domyślnie dane pozostają na urządzeniu użytkownika.
- Learning — warstwa adaptacji. Framework zamyk pętlę uczenia się z lokalnych logów interakcji, wykorzystując techniki takie jak SFT, LoRA, GRPO czy optymalizację promptów (np. DSPy) do poprawy jakości odpowiedzi bez konieczności wysyłania danych do chmury.
Efektywność jako pierwszorzędne ograniczenie
W przeciwieństwie do większości frameworków AI, które optymalizują wyłącznie dokładność zadania, OpenJarvis traktuje energię, koszt, FLOPy i opóźnienie jako pełnoprawne wymagania projektowe. System zawiera sprzętowo-agnostyczny moduł telemetrii poboru energii ( próbkowanie co 50 ms dla GPU NVIDII, AMD oraz Apple Silicon przez powermetrics). Komenda jarvis bench przeprowadza standaryzowane benchmarki opóźnienia, przepustowości i energii na zapytanie, a wbudowany dashboard wizualizuje oszczędności kosztów w czasie rzeczywistym.
Instalacja i środowiska uruchomieniowe
Framework dostarcza instalator jednoliniowy dla macOS, Linux i WSL2, który w ciągu około 3 minut pobiera menedżera pakietów uv, środowisko Python 3.11, Ollamę oraz starterowy model. Dla Windows dostępny jest skrypt PowerShell i natywna aplikacja desktopowa oparta na Tauri. OpenJarvis udostępnia również interfejs przeglądarkowy i pakiet Python SDK, co pozwala na integrację z istniejącymi projektami.
Starterowe presety konfiguracyjne pozwalają szybko uruchomić gotowe scenariusze:
| Preset | Typ zadania |
|---|---|
| morning-digest | Głosowe podsumowanie dnia na podstawie e-maili, kalendarza i wiadomości |
| deep-research | Wielokrokowe researchowanie po zaindeksowanych dokumentach z cytowaniem źródeł |
| code-assistant | Agent z dostępem do powłoki, generowania i wykonywania kodu Python |
| scheduled-monitor | Stateful agent działający wg harmonogramu cron z pamięcią między sesjami |
| chat-simple | Lekki, jednoturowy chat bez narzędzi |
System skilli i rozszerzalność
Framework traktuje skille jako narzędzia, które agenci odkrywają z katalogu i wywołują na żądanie. Użytkownik może instalować skille z publicznych repozytoriów (np. Hermes Agent, OpenClaw) za pomocą komend jarvis skill install i jarvis skill sync, a następnie optymalizować ich wykorzystanie na podstawie historii interakcji. Standard skilli opiera się na agentskills.io, co pozwala na wymianę komponentów między projektami.
Agenci wbudowani i tryby wykonania
OpenJarvis dostarcza ośmiu wbudowanych agentów podzielonych na trzy tryby pracy:
- On-demand — deep_research, orchestrator, native_react, native_openhands (CodeAct), simple.
- Scheduled — morning_digest generujący codzienne briefnigi z TTS.
- Continuous — monitor_operative i operative utrzymujący długoterminowy stan z kompresją i retrieval.
Każdy agent może korzystać z tej samej warstwy modelu i narzędzi, co ułatwia porównywanie wzorców rozumowania w ramach jednego środowiska.
Praktyczne zastosowania
W kontekście prywatnych projektów i małych zespołów OpenJarvis sprawdza się w kilku konkretnych scenariuszach:
- Automatyzacja workflowów osobistych — sortowanie poczty, codzienne podsumowania, przypomnienia oparte o lokalny kalendarz i pliki.
- Lokalna baza wiedzy — indeksowanie folderu z publikacjami czy notatkami i zadawanie pytań w języku naturalnym bez wysyłania treści do zewnętrznych API.
- Asystent kodowania offline — generowanie i wykonywanie skryptów w izolowanym środowisku, bez konieczności połączenia z internetem.
- Badanie efektywności lokalnej AI — framework zawiera zestaw 30+ benchmarków i publiczną tablicę wyników, co czyni go użyteczną platformą do eksperymentów naukowych nad efektywnością energetyczną inferencji.
Aspekty techniczne warte uwagi
Projekt wykorzystuje Python (82,4% kodu), Rust (8,8%) i TypeScript (7,4%). Rust odpowiada za rozszerzenia wydajnościowe, m.in. obsługę pamięci i niskopoziomowe operacje. Repozytorium udostępnia konfigurację pre-commit, testy pytest oraz wsparcie dla Docker deploymentu i chmurowych silników inferencji (gdy lokalne zasoby są niewystarczające). Licencja Apache 2.0 umożliwia komercyjne wykorzystanie i modyfikacje.
Źródła
- OpenJarvis — Personal AI, On Personal Devices (GitHub)
- OpenJarvis: Personal AI, On Personal Devices (Stanford Scaling Intelligence)
- OpenJarvis: a local-first personal AI is now available to run with Ollama
- OpenJarvis Documentation





