ACER_112024 ACER_112024 ACER_112024

AI našla spôsob ako sa nabúrať do iných AI chatbotov

Výskum a vývoj
1
Napriek ubezpečeniam od spoločností, ktoré AI chatboty vyrábajú, používatelia neustále prichádzajú s novými spôsobmi, ako obísť ich bezpečnostné a obsahové filtre pomocou starostlivo formulovaných výziev. Tento proces sa bežne označuje ako „jailbreak“ a dá sa použiť na to, aby systémy AI odhalili súkromné informácie, vložili škodlivý kód alebo sa vyhli filtrom, ktoré bránia generovaniu nezákonného alebo urážlivého obsahu. Tím výskumníkov teraz tvrdí, že vycvičil nástroj AI na generovanie nových metód na obchádzanie obrany iných chatbotov, ako aj na vytváranie škodlivého softvéru, ktorý sa dá zaviesť do zraniteľných systémov. Pomocou rámca, ktorý nazývajú Masterkey, dokázali výskumníci efektívne automatizovať tento proces hľadania nových zraniteľností v systémoch založených na veľkom jazykovom modeli (Large Language Model – LLM), ako sú ChatGPT, Bing Chat od Microsoftu a Google Bard. Informovali o tom v príspevku uverejnenom na predtlačovom serveri arXiv. Používanie jailbreaku pri cha ... Zobrazit Galériu

Redakcia

Všetky autorove články

Mohlo by vás zaujímať

Mohlo by vás zaujímať