Az AI által generált hangok azonosítása vízjelekkel

A Resemble AI vízjellel kívánja leküzdeni a meggyőző hanghamisítás egyre növekvő problémáját.

A mesterséges intelligencia által generált beszédet számos legitim célra használják, a képernyőolvasóktól kezdve a szinkronszínészek helyettesítéséig. Azonban rosszindulatúan is felhasználható, politikusok vagy hírességek hamis idézeteit előállítva. Ennek a problémának a megoldására a Resemble AI egy vízjeles technikát javasolt a hang eredetének azonosítására.

A vízjelezés egy olyan folyamat, amelynek során egy képet vagy hangot azonosítható mintával látnak el, hogy megmutassák annak eredetét. A hangba egy finom vízjelet lehet kódolni időnként halk hangokkal, amelyek egy hétköznapi hallgató számára nem észrevehetőek. Ezek a finom vízjelek azonban már a hanganyag kisebb módosításával is eltűnnek.

A Resemble AI egy új start-up cég, amely finoman hangolt beszédmodelleket használ olyan média előállítására, amelyet általában emberi hangok hoznak létre. A PR-katasztrófák és felelősségek elkerülése érdekében a Resemble AI a PerTh-et, egy olyan vízjeggyel való ellátási folyamatot javasolt, amely gépi tanulási modelleket használ az adatok beszédtartalomba való beágyazására. Az adatok szorosan kapcsolódnak a beszédinformációhoz és egyrészt nehezen eltávolíthatóak, másrészt lehetővé teszik annak ellenőrzését, hogy egy klip a Resemble által lett-e generálva. Az eljárás emellett tolerálja a különböző hangmanipulációkat, például a gyorsítást, a lassítást és a tömörített formátumba, például MP3-ba való konvertálást.

Megosztás Facebookon