Zatrucie pamięci (memory poisoning) to trwały atak na systemy agentowe AI, polegający na wstrzykiwaniu złośliwych lub fałszywych informacji do pamięci długoterminowej lub bazy wiedzy agenta. W przeciwieństwie do jednorazowych ataków typu prompt injection, skażone dane pozostają w systemie i wpływają na przyszłe decyzje oraz zachowania AI w wielu kolejnych sesjach, często bez widocznych oznak naruszenia bezpieczeństwa. Metoda ta wykorzystuje mechanizmy uczenia się i zapamiętywania kontekstu, przekształcając zaufane źródła prawdy agenta w kanał kontroli dla napastnika.
memory poisoning (zatrucie pamięci)
Reklama




