Ez az új AI áttörés olvassa a gondolatokat és szöveggé alakítja azokat
2023.12.13. VipAIR
A Sydney-i Műszaki Egyetem legújabb AI áttörése az EEG agyi jeleket szavakká alakítja, ami új reményt ad a beszéd nélküli kommunikációnak és az ember-gép interakciónak.
A Sydney-i Műszaki Egyetem kutatói kifejlesztettek egy AI-t, a DeWave-et, amely az EEG agyi jeleket szöveggé fordítja.
Ez a non-invazív technológia új kommunikációs módszereket kínál a beszédhibás egyének számára és javítja az ember-gép interakciót.
Az AI ígéretesnek mutatkozik a pontosság és a gyakorlatiasság terén és célja, hogy a hagyományos nyelvi fordítóeszközökhöz hasonló fordítási teljesítményt érjen el.
A Sydney-i Műszaki Egyetem kutatói bemutattak egy forradalmi mesterséges intelligencia rendszert, a DeWave-et, amely képes a néma gondolatokat szöveggé fordítani. A CT Lin professzor által vezetett áttörés egy non-invazív sapkát használ az agyi aktivitás EEG-n keresztüli rögzítésére. A mesterséges intelligencia ezután feldolgozza ezeket az adatokat, és összefüggő szavakká és mondatokká alakítja őket. Ez az innováció jelentős ugrást jelent a gondolatokból szöveggé fordítás terén, mivel úttörő módon integrálja a kódolási technikákat és a nagy nyelvi modelleket.
A technológia praktikusságát növeli hordozhatósága és non-invazív jellege, ami megkülönbözteti a korábbi módszerektől, amelyekhez invazív agyi implantátumokra vagy nehézkes MRI-készülékekre volt szükség. A szószintű szegmentálást olyan kiegészítő segédeszközök nélkül éri el, mint a szemkövetés, ami felhasználóbarátabbá teszi a mindennapi alkalmazások számára. Ez az előrelépés nem csak a stroke miatt beszédkárosodott egyének számára jelent áldást, hanem új utakat nyit a zökkenőmentes ember-gép interakció előtt is, ami segíthet olyan eszközök működtetésében, mint a bionikus karok vagy robotok.
Néhány kihívás ellenére – például az igék párosításának előnyben részesítése a főnevekkel szemben és a jelenlegi 40%-os fordítási pontosság a BLEU-1 skálán – a csapat optimista. Céljuk, hogy ezt a pontszámot a hagyományos nyelvi fordítási vagy beszédfelismerő programokhoz hasonló szintre emeljék, amelyek közel 90%-os pontosságot érnek el. Ez a technológia a korábbi agy-számítógép interfész fejlesztésekre épül és jelentős előrelépést jelent egy olyan jövő felé, ahol a gondolatok zökkenőmentesen lefordíthatók írott nyelvre, forradalmasítva a kommunikációt a beszédhibákkal küzdők számára.