prompt injection attacks

Ataki typu prompt injection to technika manipulacji modelami językowymi polegająca na wprowadzaniu złośliwych instrukcji, które zmuszają sztuczną inteligencję do zignorowania pierwotnych wytycznych programisty. Dzięki odpowiednio sformułowanym zapytaniom napastnik może przejąć kontrolę nad zachowaniem systemu, co prowadzi do wycieku poufnych danych, szerzenia dezinformacji lub wykonywania nieautoryzowanych działań.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry