memory poisoning (zatrucie pamięci)

Zatrucie pamięci (memory poisoning) to trwały atak na systemy agentowe AI, polegający na wstrzykiwaniu złośliwych lub fałszywych informacji do pamięci długoterminowej lub bazy wiedzy agenta. W przeciwieństwie do jednorazowych ataków typu prompt injection, skażone dane pozostają w systemie i wpływają na przyszłe decyzje oraz zachowania AI w wielu kolejnych sesjach, często bez widocznych oznak naruszenia bezpieczeństwa. Metoda ta wykorzystuje mechanizmy uczenia się i zapamiętywania kontekstu, przekształcając zaufane źródła prawdy agenta w kanał kontroli dla napastnika.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry