Token optimization attacks (ataki optymalizacji tokenów) to zaawansowana kategoria cyberataków, które polegają na manipulowaniu surowymi sekwencjami tokenów w celu wymuszenia na modelu AI niepożądanych zachowań, takich jak obejście zabezpieczeń (jailbreaking) lub wyciek danych treningowych. W przeciwieństwie do tradycyjnych metod opartych na semantyce, ataki te traktują proces generowania odpowiedzi jako problem optymalizacji matematycznej w przestrzeni dyskretnej, co pozwala na znajdowanie nieludzkich i nieczytelnych wzorców o bardzo wysokiej skuteczności. Metody te, takie jak GCG czy TOMPA, są szczególnie groźne, ponieważ często omijają standardowe filtry bezpieczeństwa operujące na poziomie zrozumiałego dla człowieka tekstu.
token optimization attacks
Reklama





