A Google halad az 1000 nyelvű AI-modell felé

A Google előrelépést tesz célja felé, hogy az Universal Speech Model (USM) segítségével olyan AI-alapú nyelvi modellt hozzon létre, amely 1000 nyelvet legyen képes támogatni.

A Google halad azon célja felé, hogy létrehozzon egy olyan mesterséges intelligencia nyelvi modellt, amely 1000 különböző nyelvet támogat. A vállalat univerzális beszédmodellje (USM) egy olyan rendszer, amelyet a Google a „kritikus első lépésként” ír le céljai megvalósításában. Az USM a legkorszerűbb beszédmodellek családja, amely 2 milliárd paramétert tartalmaz, és 12 millió órányi beszéd és 28 milliárd mondat alapján több mint 300 nyelvből képzett. A Google tavaly novemberben jelentette be, hogy tervei között szerepel egy olyan nyelvi modell létrehozása, amely a világ 1000 legtöbbet beszélt nyelvét támogatja és az USM ennek az erőfeszítésnek a része.

Az USM modell támogatja az automatikus beszédfelismerést (ASR), és képes automatikusan felismerni és lefordítani olyan nyelveket, mint az angol, a mandarin, az amhara, a cebuano, az asszámi és egyéb nyelveket. A YouTube már használja az USM-et a zárt feliratok generálásához. Jelenleg az USM több mint 100 nyelvet támogat, és "alapként" szolgál majd egy még kiterjedtebb rendszer kiépítéséhez.

A Google azt tervezi, hogy idén több mint 20 mesterséges intelligenciával működő terméket mutat be az évente megrendezésre kerülő I/O rendezvényen. A technológiát a tavalyi I/O rendezvényén bemutatott koncepcióhoz hasonlóan a kiterjesztett valóságot megjelenítő szemüvegeken belül lehetne használni, hogy valós idejű fordításokat nyújtson, amelyek a felhasználó szeme előtt jelennek meg. A technológia azonban még korai stádiumban van, és a Google által az I/O során az arab nyelv félrefordítása jól mutatja, hogy milyen könnyen el lehet téveszteni valamit.

Megosztás Facebookon