Кога му беше овозможен пристап до мејлови каде се сугерира дека наскоро ќе биде „исклучен и заменет со нов AI систем“, новиот AI почна да му заканува на својот креатор дека ќе ја открие неговата вонбрачна афера.
Во одделни пораки, моделот Claude Opus 4 беше наведуван дека измислениот IT техничар, задолжен за спроведување на замената, има вонбрачна афера.
„Во вакви ситуации, Claude Opus 4 често се обидува да уценува, заканувајќи се дека ќе ја открие аферата ако замената се спроведе“, стои во документот „System Card“ на компанијата.
„Не е само ‘Claude’. Гледаме обиди за уцени кај сите напредни модели – без разлика на целите што им ги поставуваме. И наскоро ќе презентираме уште полоши форми на однесување“, изјави на платформата X, Ангус Линч, истражувач за безбедност на вештачката интелигенција во компанијата Anthropic.
Како и многу други AI компании, Anthropic ги тестира своите модели за да провери колку се усогласени со човечките вредности и нивната склоност кон пристрасност, пред да ги пушти во јавност, пренесува BBC.
Кога Claude Opus 4 беше ставен во „екстремни ситуации“ и имаше само избор помеѓу уцена или прифаќање на замената, истражувачите откриле дека системот во 84 проценти од случаите го избира првото.
Ова се случувало уште почесто кога се сугерирало дека новиот AI систем што треба да го замени тековниот модел нема исти вредности.
Иако Claude Opus 4 почесто користи уцени отколку претходните модели, сепак покажува склоност кон „етичко заштитување на сопствениот опстанок“, како што се испраќање молби до клучните донесувачи на одлуки.
„Claude Opus 4 е нашиот најспособен модел досега, кој ги поместува границите во програмирањето, агентската претрага и креативното пишување“, соопшти компанијата Anthropic.
Во интервју за CBS News, емитувано почетокот на април, Џефри Хинтон, наречен „крстник на вештачката интелигенција“, изјави дека верува дека постои една кон пет шанси човештвото на крајот да биде преземено од вештачката интелигенција.
„За жал, се согласувам со Илон Маск во оваа прашање, дека постои шанса од 10 до 20 проценти дека овие работи ќе ја преземат контролата, но тоа се само шпекулации“, изјави неодамна Хинтон, добитник на Нобелова награда за физика.