Мета објави два модели на Llama 4 AI

Мета ја објави Llama 4, својата најнова колекција на модели со вештачка интелигенција која сега го напојува асистентот за Meta AI на веб и во WhatsApp, Messenger и Instagram.

Двата нови модели, исто така достапни за преземање од Meta или Hugging Face, се Llama 4 Scout – мал модел способен „да се вклопи во еден Nvidia H100 GPU“ – и Llama 4 Maverick, кој е повеќе сличен на GPT-4o и Gemini 2.0 Flash. Мета вели дека сè уште е во процес на обука на Llama 4 Behemoth, за кој извршниот директор на Мета, Марк Закерберг вели дека е „основниот модел со највисоки перформанси во светот“.

Според Мета, Llama 4 Scout има контекстуален прозорец од 10 милиони токени – работна меморија на модел со вештачка интелигенција – и ги надминува моделите на Google Gemma 3 и Gemini 2.0 Flash-Lite, како и Mistral 3.1. Мета прави слични тврдења за перформансите на својот поголем модел Maverick наспроти GPT-4o на OpenAI и Gemini 2.0 Flash на Google, и вели дека неговите резултати се споредливи со DeepSeek-V3 во задачите за кодирање и расудување користејќи „помалку од половина од активните параметри“.

Во меѓувреме, Llama 4 Behemoth има 288 милијарди активни параметри со вкупно 2 билиони параметри. Иако сè уште не е објавен, Мета вели дека Behemoth може да ги надмине своите конкуренти (во овој случај GPT-4.5 и Claude Sonnet 3.7) „на неколку STEM одредници“.

За Llama 4, Мета вели дека се префрлил на архитектура „мешавина од експерти“, пристап кој ги зачувува ресурсите користејќи ги само деловите од моделот што се потребни за дадена задача. Компанијата планира да разговара за идните планови за модели и производи со вештачка интелигенција на својата конференција LlamaCon, која ќе се одржи на 29-ти април.

Како и со своите минати модели, Мета ја нарекува колекцијата Llama 4 „со отворен код“, иако Llama беше критикувана за ограничувањата на лиценцата. На пример, лиценцата Llama 4 бара од комерцијалните субјекти со повеќе од 700 милиони месечни активни корисници да побараат дозвола од Мета пред да ги користат нејзините модели, за што Иницијативата со отворен код напиша во 2023 година го вади од категоријата „Отворен код“.

е-Трн да боцка во твојот инбокс

Последни колумни