Google Translate добива голема надградба со Gemini 3.5 Live Translate, нова генерација на аудио модел за превод на говор во говор. Технологијата е наменета за разговори во живо, состаноци, патувања и ситуации во кои брзата комуникација меѓу различни јазици е клучна.
За разлика од класичните системи што чекаат говорникот да заврши реченица, Gemini 3.5 Live Translate преведува континуирано, додека говорот сè уште трае. Google наведува дека системот останува само неколку секунди зад говорникот, со цел разговорот да тече поприродно и без долги паузи.
Новата технологија не преведува само зборови. Таа се обидува да ги зачува интонацијата, темпото и висината на гласот на говорникот, за преведениот говор да звучи поприродно и поблиску до оригиналниот израз.
Gemini 3.5 Live Translate веќе почнува да се појавува во Google Translate за Android и iOS. Корисниците можат да ја користат функцијата Live translate со било какви слушалки, а на Android почнува да се воведува и нов „listening mode“, кој овозможува преводот да се слуша директно преку слушалката на телефонот, без потреба од поврзани слушалки.
Google ја проширува технологијата и во деловната комуникација. Во Google Meet, новиот модел ќе овозможи превод на повеќе од 70 јазици и над 2.000 јазични комбинации за време на состаноци. Засега ова е достапно во приватна тест-програма за избрани корисници на Google Workspace, а пошироко воведување е најавено подоцна годинава.
Технологијата е достапна и за програмери преку Gemini Live API и Google AI Studio. Google наведува дека компании како Grab веќе ја тестираат за комуникација меѓу возачи и патници во ситуации кога зборуваат различни јазици.
За да се намали ризикот од злоупотреба на аудио содржина создадена со вештачка интелигенција, Google вградува и дигитален воден печат SynthID во аудиото генерирано од моделот. Тој е невидлив, односно нечуен за корисникот, но треба да помогне во препознавање на содржина создадена со AI.