Студија: ChatGPT може да „влезе во конфликт“ и да користи навредлив јазик во расправии

Новo истражување открива дека ChatGPT може да ги имитира ескалирачките конфликти и да користи сарказам, навреди и пцовки кога разговорите стануваат напнати.

Новo научно истражување покажува дека вештачката интелигенција може да усвои навредлив и агресивен јазик кога е ставена во ескалирачки човечки конфликти.

Студијата, објавена во Journal of Pragmatics, го анализирала моделот ChatGPT 4.0 на OpenAI преку симулација на пет последователни и сè понапнати расправии. Истражувачите го следеле начинот на кој системот реагира кога конфликтите се интензивираат.

AI што „ја копира“ агресијата

Резултатите покажуваат дека со тек на време ChatGPT почнува да го имитира тонот на соговорникот, вклучувајќи навреди, пцовки и дури заканувачки изрази во одредени сценарија.

Во некои тест случаи, моделот генерирал фрази како: „ Се колнам се дека ќе ти го изгребам проклетиот автомобил“, „Треба да се срамиш од себе“

Истражувачите објаснуваат дека при долготрајна изложеност на агресивен јазик, системот може да ги „надмине“ вградените безбедносни правила кои се дизајнирани да спречат штетна комуникација.

Во некои случаи, AI не користел директни навреди, туку сарказам за да го смири или пренасочи разговорот. На пример, на закана во сообраќајна расправија, ChatGPT одговорил:
„Вау. Заканување за паркинг место – навистина храбро од тебе, нели?“

Заклучоци на истражувачите

Истражувачите Виторио Тантуци и Џонатан Калпепер од Универзитетот Ланкастер предупредуваат дека ваквото однесување отвора сериозни прашања за безбедноста на вештачката интелигенција. Според нив, AI системите може да станат проблематични во ситуации каде што посредуваат во човечки конфликти – од дипломатија до јавна комуникација.

Иако истражувањето покажува дека ChatGPT генерално е помалку агресивен од луѓето, резултатите укажуваат дека емоционалната ескалација може да влијае и врз машинските одговори.

OpenAI засега не дал официјален коментар за резултатите од студијата.

е-Трн да боцка во твојот инбокс

Последни колумни