AI node’s w n8n

PORADNIK

Węzły AI stanowią kluczowy element każdej inteligentnej automatyzacji w n8n – są bramą do świata sztucznej inteligencji, która pozwala przetwarzać dane, generować treści i podejmować decyzje w sposób niedostępny dla standardowych operacji. Bez węzła AI integracja z zaawansowanymi modelami językowymi czy generatywnymi byłaby skomplikowana, dlatego zrozumienie jego funkcjonowania jest niezbędne do tworzenia nowoczesnych i wydajnych przepływów pracy.

Węzeł AI to komponent oznaczony charakterystyczną ikoną symbolizującą sieć neuronową, która sygnalizuje jego rolę jako centrum przetwarzania poznawczego. n8n oferuje poprzez niego dostęp do szerokiej gamy modeli od wiodących dostawców, od generowania tekstu i obrazów po zaawansowaną analizę danych i konwersacyjne chatboty.

Rodzaje node’ów

AI Agent

AI Agent to centralny węzeł w ekosystemie n8n do budowania agentów AI. Jest to autonomiczny przepływ pracy napędzany sztuczną inteligencją, który może podejmować decyzje, wchodzić w interakcję z różnymi aplikacjami i wykonywać zadania bez ciągłej ingerencji człowieka. Agent korzysta z modelu językowego (LLM), pamięci konwersacyjnej oraz narzędzi (tools), które pozwalają mu na dostęp do zewnętrznych danych i wykonywanie akcji.

Kluczowe cechy:

  • Może korzystać z różnych modeli AI (OpenAI, Claude, Gemini, Mistral)
  • Obsługuje pamięć kontekstową rozmów
  • Umożliwia podłączenie narzędzi do wykonywania konkretnych zadań
  • Autonomicznie podejmuje decyzje, które narzędzie użyć w danym momencie

Zastosowanie: Budowanie inteligentnych chatbotów, asystentów wirtualnych, agentów badawczych, automatyzacja złożonych procesów wymagających wieloetapowego rozumowania.

Anthropic

Węzeł Anthropic integruje modele Claude (Claude 3.5, Claude 3 Opus, itp.) w przepływy pracy n8n. Claude wyróżnia się szczególnie w obsłudze długich dokumentów i zapewnia bardziej “bezpieczny” i wyważony ton odpowiedzi.​​

Operacje węzła:

  • Analiza dokumentów i odpowiadanie na pytania o nie
  • Analiza obrazów
  • Przesyłanie, pobieranie i usuwanie plików
  • Generowanie, poprawianie i templatowanie promptów
  • Komunikacja z modelami Claude

Zastosowanie: Asystent AI do Notion, zarządzanie e-mailami w Gmail, generowanie treści dla działów obsługi klienta.

Google Gemini

Google Gemini to multimodalny model AI Google’a zdolny do przetwarzania tekstu, obrazów, audio i wideo. Węzeł ten zapewnia dostęp do najnowszych modeli: Gemini 1.5, Gemini 2.0 Flash, Gemini 2.5 Flash i Gemini 2.5 Pro.​​

Dostępne operacje:

  • Analiza audio i transkrypcja nagrań
  • Analiza dokumentów i obrazów
  • Generowanie obrazów i wideo
  • Przesyłanie plików
  • Komunikacja z modelami tekstowymi​​

Zastosowanie: Automatyzacja zadań AI z wykorzystaniem możliwości multimodalnych – od generowania treści, przez tłumaczenia, po zaawansowane analizy danych wizualnych i dźwiękowych.​

OpenAI

Węzeł OpenAI umożliwia integrację z modelami GPT (GPT-3.5, GPT-4, GPT-4o, GPT-4o-mini) oraz innymi usługami OpenAI jak DALL-E czy Whisper.

Główne operacje:

  • Text: Komunikacja z modelami (Message a Model)
  • Image: Generowanie, edycja i analiza obrazów
  • Audio: Generowanie audio, transkrypcja i tłumaczenie nagrań
  • File: Zarządzanie plikami
  • Video: Generowanie wideo
  • Conversation: Zarządzanie konwersacjami

Zastosowanie: Chatboty WhatsApp, podsumowywanie stron internetowych z AI, asystenci do pisania, automatyzacja obsługi klienta.

Basic LLM Chain

Basic LLM Chain to najprostszy blok budulcowy do pracy z modelami językowymi. Jest to podstawowy łańcuch, który łączy dane wejściowe z LLM i zwraca odpowiedź modelu.​​

Jak działa:

  • Przyjmuje prompt (zapytanie użytkownika)
  • Wysyła go do podłączonego modelu LLM
  • Zwraca wygenerowaną odpowiedź tekstową​

Parametry:

  • Prompt: Można zdefiniować własny lub automatycznie pobrać z poprzedniego węzła
  • Require Specific Output Format: Opcja wymuszenia określonego formatu odpowiedzi

Zastosowanie: Generowanie treści, automatyczne odpowiedzi na pytania, tworzenie e-maili, proste zadania przetwarzania języka naturalnego.​​

Information Extractor

Information Extractor automatycznie wydobywa strukturalne informacje z nieustrukturyzowanego tekstu. Skanuje treść (e-maile, PDF-y, wiadomości) i identyfikuje kluczowe elementy jak imiona, daty, adresy, numery telefonów.​

Konfiguracja schematu:

  • From Attribute Descriptions: Definiujesz listę atrybutów z opisami
  • Generate From JSON Example: Automatyczne generowanie schematu z przykładowego JSON
  • Define using JSON Schema: Ręczne wprowadzenie schematu JSON

Zastosowanie: Przetwarzanie faktur, automatyczne wydobywanie danych kontaktowych z e-maili, organizacja danych klientów, analiza formularzy.​​

Question and Answer Chain

Question and Answer Chain wykorzystuje vector store jako retriever do odpowiadania na pytania na podstawie dokumentów. To węzeł RAG (Retrieval-Augmented Generation), który łączy wyszukiwanie w bazie wiedzy z generowaniem odpowiedzi przez LLM.​

Zastosowanie:

  • Chatboty z pamięcią
  • Zadawanie pytań o PDF-y i dokumenty
  • Automatyzacja analizy akcji z wykorzystaniem Q&A
  • Systemy wsparcia technicznego z bazą wiedzy​

Sentiment Analysis

Sentiment Analysis analizuje ton emocjonalny tekstu i klasyfikuje go według zdefiniowanych kategorii sentymentu (domyślnie: Positive, Neutral, Negative).

Parametry:

  • Text to Analyze: Tekst wejściowy (np. z e-maili, recenzji)
  • Sentiment Categories: Dostosowywane kategorie (np. Very Positive, Positive, Neutral, Negative, Very Negative)
  • Include Detailed Results: Opcja dodania siły sentymentu i wskaźnika pewności

Zastosowanie: Routing leadów sprzedażowych, analiza feedbacku klientów, monitoring mediów społecznościowych, analiza recenzji hoteli, klasyfikacja e-maili według priorytetu.​​

Summarization Chain

Summarization Chain podsumowuje długie dokumenty poprzez podział tekstu na mniejsze fragmenty, podsumowanie każdego z nich, a następnie połączenie w finalną syntezę.

Metody podsumowania:

  • Map Reduce (zalecana): Dzieli dokument, podsumowuje każdą część, następnie łączy podsumowania
  • Refine: Iteracyjne rafinowanie podsumowania
  • Stuff: Bezpośrednie przetwarzanie całego tekstu (dla krótszych dokumentów)

Zastosowanie: Podsumowanie transkrypcji Zoom, raportów, artykułów, feedbacku klientów, 100-stronicowych dokumentów.​

Text Classifier

Text Classifier kategoryzuje przychodzące dane tekstowe według zdefiniowanych kategorii. Każdy element jest przekazywany do modelu, który określa jego przynależność do jednej lub wielu kategorii.

Konfiguracja:

  • Input Prompt: Tekst do klasyfikacji
  • Categories: Definiowane kategorie z nazwami i opisami
  • Allow Multiple Classes: Możliwość przypisania wielu kategorii jednocześnie
  • When No Clear Match: Co zrobić, gdy nie ma dopasowania (odrzuć lub przekieruj na branch “Other”)

Zastosowanie: Automatyczne etykietowanie e-maili (Meeting Request, Leave Request, Customer Support), routing wiadomości, klasyfikacja zgłoszeń, organizacja treści.​

Zastosowanie w praktyce

Teoria dostarcza solidnych fundamentów, ale prawdziwa magia sztucznej inteligencji w n8n zaczyna się wtedy, gdy przekładamy ją na konkretne działania. Zamiast opisywać kolejne możliwości, przejdźmy od razu do praktyki i zobaczmy, jak łatwo można wykorzystać potencjał AI w rzeczywistych scenariuszach.

W tej części artykułu, krok po kroku, zbudujemy kilka prostych, ale niezwykle użytecznych automatyzacji. Pokażemy, jak skonfigurować węzły AI bezpośrednio w interfejsie n8n, aby rozwiązywać realne problemy – od automatycznego tworzenia treści, przez analizę danych, po inteligentne zarządzanie komunikacją. Czas więc otworzyć edytor n8n i przekonać się, jak kilka kliknięć może odmienić Twoje codzienne przepływy pracy.
Zacznijmy od wybrania node AI AGENT.

Klikając na Chat Model pokaże nam się wybór modelu oraz ustawienia.

image

Jak skonfigurować połączenie z modelem lokalnym jak i zdalnym np. gemini to zerknij tutaj.

Następnym krokiem jest wybranie pamięci, jest to obszar w którym agent AI pamięta konwersacje, na początek wystarczy Simple Memory.

image

Ostatnim elementem jest Tool i w nim można co najważniejsze wybierać wiele elementów i podpinać pod Tool.
W tym miejscu zamiast sztywno podążać za instrukcjami, agent AI potrafi samodzielnie analizować dane i decydować, jakiego narzędzia (Tool) użyć, aby osiągnąć określony cel. Dlatego istotne jest zrobienie założeń co ma robić dany agent, jakie dane będzie przetwarzał.
Dla przykładu skorzystajmy z narzędzia wikipedia.
Gdy go podepniemy oraz uruchomimy czat i go zapytamy to na załączonym poniżej zrzucie możemy prześledzić całe jego działanie.
Użytkownik zadał pytanie a następnie Agent użył wikipedii by wyszukać pojęcia a na jej podstawie udzielił odpowiedzi.
W zadanym pytaniu nie widać by było wspomniane by użył tego narzędzia.

image

Innym przykładem może być podpięcie mu HTTP Request, dla przykład niech będzie obecna strona.
Zadając mu pytanie o ostatni artykuł i streszczenie go zostaje wysłane zapytanie pod zdefiniowany http request by pobrało stronę i odpowiedziało na jej podstawie.
Dodatkowy http request jest podłączony jakby się podało niestandardową stronę, by sobie na niej wyszukało.

image

W takich przypadkach używanie takiego narzędzia nie jest zbyt optymalne, można zauważyć że pobierana jest cała strona i przekazywana do modelu jest też cała strona co też może wydłużyć proces przetwarzania i w przypadku gdy korzysta się z zewnętrznych API może narazić na większe koszty.
Dlatego jest tutaj możliwość wywoływania innych utworzonych workflow które bez użycia AI mogą precyzyjnie pobierać dane i je dostarczać agentowi przy użyciu node Call n8n Workflow Tool.

image

Najpopularniejsze tools

  1. HTTP Request
    • Umożliwia integrację z niemal dowolnym API zewnętrznym.
    • Bardzo elastyczne i uniwersalne narzędzie do automatyzacji.
  2. Code (JavaScript/Python)
    • Pozwala pisać własny, niestandardowy kod dla skomplikowanych operacji.
    • Duża kontrola nad logiką workflow.
  3. Airtable
    • Łatwa praca z bazami danych i tabelami w formie arkusza.
    • Idealne do szybkiego prototypowania i zarządzania danymi.
  4. Google Sheets
    • Popularne narzędzie do przechowywania i organizacji danych.
    • Szeroka integracja z usługami Google i n8n.
  5. Slack
    • Umożliwia komunikację i powiadomienia w zespołach.
    • Popularne narzędzie do współpracy.
  6. Gmail
    • Automatyzacja wysyłki i odbioru maili.
    • Niezbędne do zarządzania komunikacją.
  7. Twilio
    • Wysyłanie SMS-ów i połączenia głosowe.
    • Sprawdzony kanał komunikacji biznesowej.
  8. Notion
    • Wszechstronne narzędzie do zarządzania wiedzą i dokumentacją.
    • Coraz popularniejsze w automatyzacjach.
  9. Salesforce
    • Rozbudowane narzędzie CRM do zarządzania relacjami z klientami.
    • Niezbędne w dużych firmach i sprzedaży.
  10. Dropbox
    • Przechowywanie i zarządzanie plikami w chmurze.
    • Łatwa integracja i zasoby do przechowywania dokumentów.

Podsumowanie

Węzły AI stanowią fundament nowoczesnej automatyzacji w n8n, otwierając drzwi do możliwości oferowanych przez zaawansowane modele językowe. W tym artykule dokonaliśmy przeglądu kluczowych węzłów AI, począwszy od bezpośrednich integracji z wiodącymi dostawcami, takimi jak OpenAI, Google Gemini i Anthropic ale i też po wyspecjalizowane narzędzia do konkretnych zadań.

Omówiliśmy węzły funkcyjne, takie jak Information Extractor do wyciągania danych, Sentiment Analysis do analizy tonu, Summarization Chain do skracania długich tekstów oraz Text Classifier do automatycznej kategoryzacji. Centralnym punktem analizy był jednak AI Agent – potężny i autonomiczny komponent zdolny do samodzielnego podejmowania decyzji i korzystania z zewnętrznych narzędzi (Tools).

W części praktycznej pokazaliśmy, jak skonfigurować AI Agenta i jak dynamicznie dobiera on narzędzia (np. Wikipedia czy HTTP Request), aby precyzyjnie wykonać powierzone mu zadanie. Zrozumienie i umiejętne łączenie tych elementów pozwala na budowanie skomplikowanych i prawdziwie inteligentnych przepływów pracy.

Źródła

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry
Hej. Nie zapomnij podzielić się opinią oraz udostępnić dalej.