Вештачката интелигенција и направи проблеми на Википедија

04/05/2023
11:26
Хај-тек

Како што генеративната вештачка интелигенција продолжува да проникнува во сите аспекти на културата, луѓето што ја чуваат и уредуваат Википедија се поделени околу тоа како најдобро да се продолжи. За време на неодамнешниот повик во заедницата, стана очигледно дека постои поделеност во заедницата околу тоа дали да се користат или не големи јазични модели за генерирање содржина. Додека некои луѓе сметаат дека алатките како ChatGPT на Open AI може да помогнат при генерирање и сумирање на написи, други останаа претпазливи.

Загриженоста е дека содржината генерирана од машина треба да биде избалансирана со многу човечки преглед и би ги преплавила помалку познатите „викија“ со лоша содржина. Иако генераторите на вештачка интелигенција се корисни за пишување веродостоен текст сличен на човекот, тие исто така се склони да вклучуваат погрешни информации, па дури и да наведуваат извори и академски трудови што не постојат. Ова често резултира со резимеа на текстови кои изгледаат точни, но со поблиска проверка се открива дека се целосно измислени.

Ејми Брукман е професорка и авторка на „Дали треба да верувате на Википедија?: Онлајн заедници и изградба на знаење“. Како и луѓето кои општествено конструираат знаење, вели таа, големите јазични модели се исто толку добри колку и нивната способност да разликуваат факти од фикција.

„Нашиот единствен начин е да користиме [големи јазични модели], но да ги уредуваме и да побараме некој да ги провери изворите“, рече Брукман за Motherboard.

Не им требаше долго време на истражувачите да сфатат дека ChatGPT на OpenAI е ужасен фабрикувач, што е она што ги осудува на пропаст студентите кои се потпираат исклучиво на четботот за да ги напишат своите есеи. Понекогаш ќе измисли статии и нивни автори. Друг пат ќе ги спои помалку познатите научници со поплодните, но тоа ќе го направи со најголема доверба. OpenAI дури велат дека моделот „халуцинира“ кога измислува факти – термин што беше критикуван од некои експерти за вештачка интелигенција како начин компаниите за вештачка интелигенција да избегнат одговорност за нивните алатки кои шират дезинформации.

„Ризикот за Википедија е дека луѓето би можеле да го намалат квалитетот со ставање работи што не ги провериле“, додаде Брукман. „Не мислам дека има ништо лошо во тоа да се користи како прв нацрт, но секоја точка треба да се потврди“.

Фондацијата Викимедија, непрофитната организација која стои зад слободната енциклопедија, сака да креира алатки за да им олесни на волонтерите да ја идентификуваат содржината генерирана од бот. Во меѓувреме, Википедија работи на изготвување на политика која ги поставува границите за тоа како волонтерите можат да ги користат големите јазични модели за да создаваат содржина.

Моменталниот нацрт-текст вели дека секој што не е запознаен со ризиците од големите јазични модели треба да избегнува да ги користи за создавање содржини на Википедија, бидејќи може да креира можности Фондацијата Викимедија да добие тужби за клевета и прекршување на авторските права – од кои непрофитната организација е заштитена, но не и волонтерите на Википедија. Овие големи јазични модели, исто така, содржат имплицитни предрасуди, што често резултира со содржина искривена против маргинализираните и групи на луѓе.

Заедницата е поделена и околу тоа дали на големите јазични модели треба да им се дозволи да се обучуваат за содржината на Википедија. Додека отворениот пристап е камен-темелник на дизајнерските принципи на Википедија, некои се загрижени дека неограниченото користење на интернет-податоците им овозможува на компаниите за вештачка интелигенција како OpenAI да ја искористат отворената мрежа за да создадат затворени комерцијални збирки на податоци за нивните модели. Ова е особено проблем ако самата содржина на Википедија е генерирана со вештачка интелигенција, создавајќи круг од потенцијално пристрасни информации, кои ќе останат непроверени.

Еден предлог објавен на мејлинг листата на Википедија го привлече вниманието на идејата за користење на BLOOM, голем јазичен модел објавен минатата година според новата лиценца за одговорна вештачка интелигенција (RAIL) која „комбинира отворен пристап за лиценцирање со ограничувања во однесувањето кои имаат цел да наметнат одговорна употреба на вештачка интелигенција“. Слично на некои верзии на лиценцата Creative Commons, лиценцата RAIL овозможува флексибилно користење на моделот со вештачка интелигенција, истовремено наметнувајќи некои ограничувања – на пример, барајќи од сите изведени модели јасно да се истакне дека нивните резултати се генерирани од вештачка интелигенција.

Маријана Фосати, координаторка на Whose Knowledge? – глобална кампања фокусирана на овозможување пристап до знаење на интернет – вели дека големите јазични модели и Википедија се во круг за повратни информации што креира уште повеќе предрасуди.

„Го имаме ова огромно знаење на повеќе од 300 јазици“, изјави Фосати за Motherboard. „Но, се разбира, овие 300 различни јазици се исто така многу нееднакви. Англиската Википедија е многу побогата со содржина од другите и ние ги храниме системите за вештачка интелигенција со ова знаење“.

Вештачката интелигенција не е баш нова за Википедијанците – автоматизираните системи долго време се користат на страницата за извршување задачи како машинско преведување и отстранување на вандализам. Но, има долгогодишни волонтери кои се помалку отворени за идејата за проширување на употребата на вештачката интелигенција на платформата. Во соопштението од Фондацијата Викимедија, непрофитната организација рече дека вештачката интелигенција претставува можност да помогне во зголемувањето на работата на волонтерите на проектите на Википедија и Викимедија.

„Врз основа на повратни информации од волонтери, разгледуваме како овие модели можат да помогнат да се затворат празнините во знаењето и да се зголеми пристапот до знаење и учеството“, изјави портпаролот на Фондацијата Викимедија за Motherboard во изјавата. „Сепак, човечкиот ангажман останува најсуштинскиот елемент на екосистемот на знаење на Викимедија. Вештачката интелигенција најдобро функционира како помош во работата што луѓето ја вршат на нашиот проект“.

До објавувањето на овој текст нацрт-текстот за новите политики вклучува точка која експлицитно наведува дека е задолжително наведување дека текстот е генериран со вештачка интелигенција.

„Мислам дека тоа не е толку различно од борбата против вандализам“, додаде Брукман. „Имаме стратегии за борба против тоа. Мислам дека непрегледуваната содржина генерирана со вештачка интелигенција е форма на вандализам и можеме да ги користиме истите техники што ги користиме за борба против вандализам на Википедија, за борба против ѓубрето што доаѓа од вештачката интелигенција“.

„Содржината е веродостојна само колку и бројот на луѓе кои ја потврдиле со силни практики за цитирање“, рече Брукман. „Да, генеративната вештачка интелигенција нема силни преференции за цитирање, па мораме да ја провериме. Мислам дека не можеме да им кажеме на луѓето „немојте да користите вештачка интелигенција“ затоа што тоа едноставно нема да се случи. Сè што можеме да направиме е да ги провериме информациите“ вели Брукман.

Извор: VICE