Google го прикажа своето двегодишно тестирање на роботи управувани од вештачка интелигенција кои сортираат рециклирачки и отпад со висок степен на ефикасност, веројатно најавувајќи го обликот на работите што доаѓаат.
Студијата покажува дека системите за засилено учење (RL) можат да им овозможат на роботите да го сортираат отпадот преку интеракција со нивната околина, да добиваат повратни информации преку награди или казни и да ги оптимизираат нивните активности за да ја максимизираат вкупната награда. Преку примената на RL, мобилните роботи, со системи за вид и функционална рака, можат да се справат со задачи од реалниот свет во работните средини, со комбинација на офлајн и онлајн податоци што им овозможуваат да се прилагодат на широката варијабилност на ситуациите во секојдневието.
Студијата ги програмираше роботите да шетаат и да бараат „ситуации со отпад“ – корпи за рециклирање, компост и ѓубре. Потоа тие добија задача да ги сортираат предметите меѓу кантите така што сите рециклирачки материи (лименки, шишиња) се ставаат во корпата за рециклирање, предметите што може да се компостираат (картонски контејнери, хартиени чаши) се ставаат во корпата за компост, а сè друго се става во корпата за отпад. Роботите се изработени да функционираат со сет на вештини.
Разговарајќи за мотивацијата за студијата, истражувачкиот тим рече дека со оглед на тоа што реалниот свет е сложен, разновиден и се менува со текот на времето, роботите со RL се борат да се прилагодат и затоа тие сè уште не се користат во секојдневните активности.
„Роботските училници“ обезбедуваат голем дел од искуството на роботите. Тимот рече дека иако деловните згради во реалниот свет можат да обезбедат најрепрезентативно искуство, пропусната моќ во однос на собирањето податоци е ограничена – некои денови ќе има многу ѓубре за сортирање, а некои денови не толку.
По две години, тимот собра 540.000 испитувања во училниците и 32.500 испитувања од распоредувањето. Откри дека севкупните перформанси на системот се подобруваат како што се собираат повеќе податоци. Конечниот систем беше евалуиран во училниците за контролирани споредби со сценарија врз основа на она што роботите го видоа за време на распоредувањето.
Покрај прецизноста од 84 проценти на финалниот систем, тестирањето во реалниот свет покажа дека системот може да ја намали контаминацијата помеѓу 40 и 50 проценти по тежина. Ова беше утврдено врз основа на статистика од три распоредувања во реалниот свет помеѓу 2021 и 2022 година.
Тимот забележува дека конечните политики за RL не успеваат секој пат, а ќе бидат потребни поголеми и помоќни модели за да се подобрат перформансите и да се прошират на поголем опсег на задачи. Истражувачите дополниле дека дури и онлајн видеа може да послужат за дополнително надоградување на искуството кај роботите.
Извор: newscientist.com