Új utakra lépve, a Stability AI bemutatta legújabb videógeneráló innovációját

2023.11.22. 11:19 VipAIR

Merész lépéssel a Stability AI bemutatta a Stable Video Diffusiont, ami egy úttörő AI modell, amely dinamikus videók létrehozásával életet lehel az állóképekbe.

Új utakra lépve, a Stability AI bemutatta legújabb videógeneráló innovációját

A Stability AI bejelentette a Stable Video Diffusiont, az állóképekből videókat generáló, nyílt forráskódú AI-modellt.
A modell, amely kutatási előnézeti fázisban van, két változatban, SVD és SVD-XT formában érhető el és még különleges felhasználási feltételek vonatkoznak rá.
Ha többet akarsz tudni, kövess minket Facebookon!
Az esetleges jogi és etikai kihívások ellenére a Stability AI célja, hogy modelljét különböző területeken kereskedelmi célú alkalmazásokra is kiterjessze.

A Stability AI a Stable Video Diffusion bejelentésével jelentős ugrást tett a mesterséges intelligencia területén. Ez az innovatív AI-modell a meglévő képek animálásával hoz létre videókat, ami új mérföldkövet jelent a videógyártási technológiában. A vállalat meglévő, szövegből képet készítő modelljére, a Stable Diffusion alapjain ez az új eszköz a kevés nyílt forráskódú és kereskedelmi forgalomban is elérhető videógeneráló modell egyikeként tűnik ki. Jelenleg azonban „kutatási előnézeti” fázisban van, ami azt jelenti, hogy a hozzáférés korlátozott és meghatározott felhasználási feltételek által szabályozott, a kreatív és oktatási alkalmazásokra összpontosítva.

A Stable Video Diffusion nem egyetlen modell, hanem két változatban is elérhető: SVD és SVD-XT. Az SVD az állóképeket 576×1024 felbontású videókká alakítja át 14 képkocka sebességgel, míg az SVD-XT a képkocka sebességet 24-re növeli. Mindkét modell másodpercenként három és 30 képkocka közötti videókat képes létrehozni. Ezeket a modelleket több millió videóból álló adathalmazon képezték ki, majd egy kisebb halmazon finomhangolták, ami kérdéseket vet fel a videók forrásával és a lehetséges szerzői jogi problémákkal kapcsolatban.

Innovatív megközelítése ellenére a Stable Video Diffusion kihívásokkal és korlátokkal néz szembe. A modellek a Stability AI szerint nem képesek mozgás nélküli videókat generálni, a videókat szöveg alapján vezérelni, vagy a szöveget és az arcokat következetesen és pontosan megjeleníteni. A Stability AI azonban átláthatóan kezeli ezeket a korlátokat és megjegyzi, hogy a modellek bővíthetők, beleértve az olyan alkalmazásokat, mint például a tárgyak 360 fokos nézeteinek generálása.

A Stability AI-nak nagyra törő tervei vannak a Stable Video Diffusionnel kapcsolatban. A vállalat célja olyan modellek kifejlesztése, amelyek az SVD és az SVD-XT képességeire építenek és azokat kiterjesztik, beleértve egy szövegből videót készítő eszközt webes alkalmazásokhoz. A reklám, az oktatás és a szórakoztatás területén való potenciális felhasználási lehetőségekkel a Stability AI a pénzügyi kihívások és a belső irányítási problémák ellenére is nagy hangsúlyt fektet e technológia kereskedelmi forgalomba hozatalára. Az AI-videógenerálás területén tapasztalható növekedés során a Stability AI Stable Video Diffusion kulcsfontosságú szerepet játszhat a videótartalom-alkotás jövőjének alakításában.