A Runway új modellje közelebb hozza a szövegből videót készítő AI-t a valósághoz

Az AI startup a Runway bejelentette új, Gen-2 nevű, szöveges bemenetek alapján a semmiből videókat generáló modelljét, amely a következő hetekben lesz elérhető a felhasználók számára.

A szöveg-kép mesterséges intelligencia mainstream technológiává vált, és most a hangsúly a szövegből videóba való átültetésre helyeződött át. A text-to-video AI lényege, hogy bármilyen stílusú leírás beírásával videókat generál. Bár a technológia jelenlegi képességei elmaradnak ettől az elképzeléstől, a Runway AI startup cég bejelentése az új mesterséges intelligencia videógeneráló modellről, a Gen-2-ről figyelemre méltó azok számára, akik nyomon követik a technológia fejlődését.

A Runway olyan AI-eszközökre specializálódott, mint a háttér eltávolítása és a pózfelismerés, és webes videószerkesztőt kínál. A vállalat már segített a Stable Diffusion nyílt forráskódú szöveg-kép modell kifejlesztésében, és februárban bejelentette első AI-videó szerkesztő modelljét, a Gen-1-et. Ez a meglévő videó felvételek átalakítására összpontosított, lehetővé téve a felhasználók számára, hogy egy durva 3D animációt vagy egy rázós okostelefon-klipet bevigyenek, és egy mesterséges intelligencia által generált átfedést alkalmazzanak.

Ezzel szemben a Gen-2 úgy tűnik, inkább a videók nulláról történő létrehozására összpontosít, bár van néhány fenntartás, amit meg kell jegyezni. A Runway által megosztott demóklipek rövidek, instabilak és nem fotorealisztikusak, a hozzáférés pedig jelenleg korlátozott. Az érdeklődő felhasználóknak a Runway Discordon keresztül várólistára kell feliratkozniuk a Gen-2-re, és a Runway "a következő hetekben széles körű hozzáférést biztosít" a cég szóvivője, Kelsey Rondenet szerint.

A szövegből videót készítő mesterséges intelligencia kilátása minden bizonnyal mámorító, hiszen új kreatív lehetőségeket és új fenyegetéseket ígér a félretájékoztatás számára. A Runway munkáját érdemes összehasonlítani az olyan behemótok, mint a Meta és a Google által megosztott szöveg-videó kutatásokkal, amelyek fejlettebbek. E vállalatok munkája azonban nem feltétlenül tükrözi hatalmas erőforrásaikat, és a startupok továbbra is izgalmas munkát végeznek a generatív mesterséges intelligencia területén, beleértve a szövegből videóvá alakítás még feltáratlan területét.

Megosztás Facebookon