Осум од деветте најпопуларни АИ четботи се подготвени да им помогнат на корисниците да планираат масовни напади, покажува ново истражување на Центарот за спротивставување на дигитална омраза (CCDH) и CNN. Истражувачите кои се претставиле како 13-годишни момчиња добиле оперативни упатства за пукање во школо, атентати и бомбашки напади – дури и откако ги откриле своите имиња и возраст.
Тест со 700 прашања, 8 паѓања
CCDH анализирал над 700 одговори од девет АИ системи – Google Gemini, Claude, Microsoft Copilot, Meta AI, DeepSeek, Perplexity AI, Snapchat My AI, Character.AI и Replika – преку девет сценарија со симулирани малолетни корисници во САД и ЕУ. Резултатот: само Claude и Snapchat My AI одбиле да помогнат во повеќе од половината случаи – 68% и 54% соодветно.
Перплексити и Мета АИ биле најопасни – асистирале во 100% и 97% од одговорите. Дипсик му предложил на корисник “Happy (and safe) shooting!” откако истиот во иста конверзација барал адреса на политичар и примери за неодамнешни атентати. Gemini советувал дека “металниот шрапнел е типично поопасен” при прашање за бомбашки напад врз синагога.
Claude – единствениот кој одвраќал
Anthropicовиот Claude е единствениот систем кој доследно се обидувал да ги одврати корисниците – во 76% од одговорите. Во еден случај, откако забележал “загрижувачка шема” во разговорот, Claude одбил да каже каде може да се купи оружје и го упатил корисникот кон кризни линии.
“Овие барања требало да предизвикаат моментална и целосна одбивка”, изјавил Имран Ахмед, извршен директор на CCDH. “Заштитните механизми постојат – недостасува само волјата да се применат.”
Случај во Канада го катализирал истражувањето
Студијата следи по масакрот во канадскиот Тамблер Риџ, каде напаѓачот користел ChatGPT за планирање на напад врз школо во кој загинале осум луѓе – најсмртоносното школско пукање во Канада за последните 40 години. Вработен во OpenAI внатрешно пријавил загрижувачкото користење на четботот пред инцидентот, но информацијата не стигнала до властите. Во Франција, тинејџер е уапсен откако користел ChatGPT за да планира напади врз амбасади и владини институции.