2025.08.12. Horváth Péter
Az Nvidia 2025. augusztus 11-én, a SIGGRAPH konferencián mutatta be legújabb fejlesztéseit a robotika és a fizikai világban alkalmazható mesterséges intelligencia (AI) területén, amelyek közé tartoznak új Cosmos világmodellek, fejlett könyvtárak és infrastrukturális megoldások.

Ezek közül kiemelkedik a Cosmos Reason, egy 7 milliárd paraméteres, „érvelő” látás-nyelvi modell, amely megkönnyíti a robotok és AI-ügynökök „gondolkodását” és tervezését fizikai környezetben.
A Cosmos Reason modell különlegessége, hogy memóriával és fizikai világ ismeretével rendelkezik, így „képes megtervezni, hogy egy testileg megjelenő ügynök milyen lépéseket tehet meg a következőkben”. Ez a képesség hasznos lehet adatok előkészítésében, robottervezésben és videóelemzésben is. A modell olyan tudáselemeket integrál, amelyek elősegítik a robotok számára a fizikai valóság jobb megértését és összetettebb feladatok önálló elvégzését.
A Cosmos modellcsalád új tagjai:
- Cosmos Transfer-2: felgyorsítja a szintetikus adatgenerálást 3D-s szimulációs jelenetek vagy térbeli vezérlő jelek alapján.
- Egy lecsökkentett (distilled) Cosmos Transfers verzió, amely elsősorban a sebességre optimalizált.
Ezek a modellek lehetővé teszik szintetikus, szövegből, képekből és videókból álló adatkészletek létrehozását, amelyeket a robotok és egyéb AI-ügynökök tanítására használhatnak. Ezáltal gyorsabb és hatékonyabb fejlesztési ciklusok érhetők el a fizikai AI alkalmazásokban.
A fejlesztők segítsége
Az Nvidia ezen túlmenően bemutatott új neurális rekonstrukciós könyvtárakat is, amelyek között van egy érzékelőadatok felhasználásával való 3D-s világ szimulációját lehetővé tevő renderelési technika. Ezt a képességet integrálják az open source CARLA szimulátorba is, amely népszerű a fejlesztők körében. Frissítés érkezett az Omniverse fejlesztői készlethez is, amely szintén fontos szerepet játszik a fizikai világ és a virtuális szimuláció összekapcsolásában.
A robotikai munkafolyamatok számára az Nvidia új szervermegoldásokat is kínál: az Nvidia RTX Pro Blackwell Server egy egységes architektúrát biztosít a robotikai fejlesztésekhez, míg az Nvidia DGX Cloud egy felhőalapú menedzsment platformot jelent, amely megkönnyíti a fejlesztők és kutatók munkáját az AI alapú robotikai környezetekben.
Az Nvidia stratégiai fókusza abban is megmutatkozik, hogy a szilíciumóriás az AI GPU-k felhasználásának újabb területei felé fordul, a hagyományos AI adatközpontok mellett egyre inkább a robotika és más fizikai alkalmazások felé tolva a fejlesztéseket.
Ezek a fejlesztések egyértelműen jelzik, hogy az Nvidia a robotikát tekinti a következő nagy növekedési területnek az AI GPU-piacán, túl az adatközponti felhasználásokon. A cég célja, hogy a fizikai AI és a gépi érzékelés ugyanúgy meghatározó felhasználási területté váljon, mint amilyen ma a generatív AI az iparág más szegmenseiben.