OpenAI belép a mesterséges intelligencia videóversenybe – közeleg a Sora 2?

Egyre élesedik a verseny a generatív videómodellek piacán: miután a Google Veo 3 lenyűgöző képességekkel mutatkozott be, most az OpenAI is készül a válasszal. A cég állítólag egy teljesen új, saját fejlesztésű AI-videómodellen dolgozik, amely akár Sora 2 néven is érkezhet.

A PCW értesülései szerint az OpenAI új projektje nem a meglévő Sora továbbfejlesztése, hanem egy nulláról fejlesztett rendszer, amely az eddiginél pontosabban képes értelmezni és vizuálisan leképezni a szöveges utasításokat. A cél egy olyan modell létrehozása, amely:

  • nagy felbontású, akár 1080p minőségű videókat generál,
  • egyszerre képes kezelni mozgást, kameramozgást és részletgazdag vizualitást,
  • és valós idejű kreatív munkafolyamatokba is integrálható.
Ha többet akarsz tudni, kövess minket Facebookon!
Egyelőre nem tudni, hogy az új rendszer alapját a GPT-5-ös nyelvi modell vagy egy teljesen más architektúra adja, de a fejlesztés fókuszában egyértelműen a multimodális (szöveg–kép–videó) integráció áll.

Nem sokkal korábban a Google mutatta be a Veo 3 nevű modelljét, amely példátlan mozgáskoherenciával és vizuális stílussal generál rövidfilmeket. A modellek közötti verseny fókuszában már nem csupán az áll, hogy "milyen valósághű" a videó, hanem hogy mennyire pontosan érti meg a felhasználó szándékát, és képes-e azt hitelesen visszaadni egy komplex vizuális narratíván keresztül.

Az OpenAI projektje állítólag már belső tesztelés alatt áll, és a Sora 2 elnevezés egyelőre csak munkacím – a végleges márkanév akár egy teljesen új termékcsalád nyitányát is jelentheti.

Szoros a verseny – és sok a kérdőjel

A generatív videótechnológiák versenye nem csupán technológiai presztízskérdés: a modellek jövője alapjaiban formálhatja át a kreatív iparágakat, a reklámoktól a filmgyártásig. Az OpenAI lépése ezért is jelentős, mert azt mutatja: a cég nem csupán a nyelvi modellek fejlesztésében kíván vezető szerepet betölteni, hanem a vizuális kreativitás új korszakában is ott akar lenni az élvonalban.

Egyelőre nem tudni, mikor érkezik a hivatalos bejelentés – de az biztos, hogy a generatív AI-videózás forró nyara előtt állunk, és egyre közelebb kerülünk ahhoz a ponthoz, amikor néhány mondattal egész jeleneteket, reklámokat vagy akár kisfilmeket generálhatunk majd valós időben.

Azt, hogy végül melyik modell kerül szélesebb körben használatba, nemcsak a technológiai különbségek, hanem a hozzáférhetőség is jelentősen befolyásolja majd. A Google Veo 3 jelenlegi árazása – 250 dolláros havi előfizetés – szűkebb célcsoportot céloz, inkább a professzionális felhasználókat. Ezzel szemben az OpenAI könnyen versenyelőnybe kerülhet, ha az új videómodelljét a ChatGPT Plus vagy Pro előfizetésekhez kapcsolva, jóval kedvezőbb feltételekkel teszi elérhetővé. Ez nemcsak a kreatív közösségeket vonzhatja be, hanem a hétköznapi felhasználókat is, akik elsőként szeretnék kipróbálni a mozgóképes mesterséges intelligencia jövőjét.