OpenAI belép a mesterséges intelligencia videóversenybe – közeleg a Sora 2?

2025.07.25. 14:27 Horváth Péter

Egyre élesedik a verseny a generatív videómodellek piacán: miután a Google Veo 3 lenyűgöző képességekkel mutatkozott be, most az OpenAI is készül a válasszal. A cég állítólag egy teljesen új, saját fejlesztésű AI-videómodellen dolgozik, amely akár Sora 2 néven is érkezhet.

A PCW értesülései szerint az OpenAI új projektje nem a meglévő Sora továbbfejlesztése, hanem egy nulláról fejlesztett rendszer, amely az eddiginél pontosabban képes értelmezni és vizuálisan leképezni a szöveges utasításokat. A cél egy olyan modell létrehozása, amely:

nagy felbontású, akár 1080p minőségű videókat generál,
egyszerre képes kezelni mozgást, kameramozgást és részletgazdag vizualitást,
és valós idejű kreatív munkafolyamatokba is integrálható.

Ha többet akarsz tudni, kövess minket Facebookon!

Egyelőre nem tudni, hogy az új rendszer alapját a GPT-5-ös nyelvi modell vagy egy teljesen más architektúra adja, de a fejlesztés fókuszában egyértelműen a multimodális (szöveg–kép–videó) integráció áll.

Nem sokkal korábban a Google mutatta be a Veo 3 nevű modelljét, amely példátlan mozgáskoherenciával és vizuális stílussal generál rövidfilmeket. A modellek közötti verseny fókuszában már nem csupán az áll, hogy "milyen valósághű" a videó, hanem hogy mennyire pontosan érti meg a felhasználó szándékát, és képes-e azt hitelesen visszaadni egy komplex vizuális narratíván keresztül.

Az OpenAI projektje állítólag már belső tesztelés alatt áll, és a Sora 2 elnevezés egyelőre csak munkacím – a végleges márkanév akár egy teljesen új termékcsalád nyitányát is jelentheti.

Szoros a verseny – és sok a kérdőjel

A generatív videótechnológiák versenye nem csupán technológiai presztízskérdés: a modellek jövője alapjaiban formálhatja át a kreatív iparágakat, a reklámoktól a filmgyártásig. Az OpenAI lépése ezért is jelentős, mert azt mutatja: a cég nem csupán a nyelvi modellek fejlesztésében kíván vezető szerepet betölteni, hanem a vizuális kreativitás új korszakában is ott akar lenni az élvonalban.

Egyelőre nem tudni, mikor érkezik a hivatalos bejelentés – de az biztos, hogy a generatív AI-videózás forró nyara előtt állunk, és egyre közelebb kerülünk ahhoz a ponthoz, amikor néhány mondattal egész jeleneteket, reklámokat vagy akár kisfilmeket generálhatunk majd valós időben.

Azt, hogy végül melyik modell kerül szélesebb körben használatba, nemcsak a technológiai különbségek, hanem a hozzáférhetőség is jelentősen befolyásolja majd. A Google Veo 3 jelenlegi árazása – 250 dolláros havi előfizetés – szűkebb célcsoportot céloz, inkább a professzionális felhasználókat. Ezzel szemben az OpenAI könnyen versenyelőnybe kerülhet, ha az új videómodelljét a ChatGPT Plus vagy Pro előfizetésekhez kapcsolva, jóval kedvezőbb feltételekkel teszi elérhetővé. Ez nemcsak a kreatív közösségeket vonzhatja be, hanem a hétköznapi felhasználókat is, akik elsőként szeretnék kipróbálni a mozgóképes mesterséges intelligencia jövőjét.