OpenAI-овиот модел o3 постигна 85% на тестот ARC-AGI, што е значително над претходниот најдобар резултат на вештачка интелигенција од 55% и на исто ниво со просечниот човечки резултат.
Новиот модел на вештачка интелигенција (AI) покажа способности на ниво на човек на тест дизајниран за мерење на „општата интелигенција“. Дополнително, моделот постигна висок резултат на исклучително тежок тест по математика.
Генерализација и интелигенција
За да се разбере значењето на резултатите на o3 системот, потребно е да се разбере суштината на ARC-AGI тестот. Технички, овој тест ја мери „ефикасноста на примерокот“ на AI системите во прилагодување на нови ситуации – односно, колку примери од нова ситуација му се потребни на системот за да разбере како таа функционира.
AI системи како ChatGPT (GPT-4) обично не се толку ефикасни кога станува збор за учење од мал број примери. Тие се „тренирани“ на милиони примери од човечки текст, создавајќи веројатносни „правила“ за најверојатните комбинации на зборови.
Иако се многу добри за вообичаени задачи, овие системи се помалку успешни кај невообичаени задачи поради недостаток на податоци за такви ситуации. Додека AI не развие способност за учење од мал број примери и прилагодување со поголема ефикасност, неговата примена ќе остане ограничена на повторливи задачи каде што неуспесите се прифатливи.
Способноста за точно решавање на претходно непознати проблеми со ограничен број примери се смета за основен елемент на интелигенцијата. OpenAI тврди дека со o3 моделот е еден чекор поблиску до развивање на вештачка општа интелигенција (AGI) – но дали тоа е доволно за вистински пробив?