2023.10.09. VipAIR
A DeepMind a specializált és az általánosított robotfunkciók közötti szakadékot áthidalva egy újszerű AI-rendszert mutatott be, amely forradalmasíthatja a robotok tanulását és működését.
-
A DeepMind 33 kutatóintézettel együttműködve univerzális AI-rendszert fejleszt ki a legkülönfélébb robotokhoz.
-
Az Open-X Embodiment projekt különböző robotok adatait kombinálja egy általánosított modell létrehozásához.
-
Az új AI-modellek felülmúlják a speciális modelleket, ami ígéretesnek tűnik a robotika jövője szempontjából.
A robotika régóta küzdött azzal a fárasztó feladattal, hogy a gépi tanulási modelleket minden egyes robotra, feladatra és környezetre külön-külön képezze ki. A
Google DeepMind 33 globális kutatóintézettel együttműködve ezt a narratívát kívánja megváltoztatni. Legújabb vállalkozásuk, az Open-X Embodiment projekt célja a képzési folyamat egyszerűsítése és felgyorsítása egy univerzális mesterséges intelligencia rendszer bevezetésével, amely számtalan robottal kompatibilis.
A kihívás lényege mindig is az volt, hogy a robotok, bár kiváló specialisták, általánosan gyengék. Ez azt jelenti, hogy a feladat vagy a környezet apró változtatásai esetén is elölről kell kezdeni a betanítási folyamatot. Az Open-X Embodiment projekt megoldása kettős: egy átfogó, több robottípust felölelő adathalmaz és egy olyan modellkészlet, amely alkalmas a készségek különböző feladatok közötti átvitelére. Ezek a modellek, amikor különböző laboratóriumokban és különböző robotokon tesztelték őket, következetesen felülmúlták a hagyományos módszereket.
A projekt kutatói a nagy nyelvi modellekből (LLM) merítve ihletet, azt feltételezték, hogy a robotok széles köréből származó adatok felhasználásával felépített általánosított modelljei felülmúlhatja a speciális modelleket. Ennek igazolása érdekében 20 intézmény 22 különböző robot adatait gyűjtöttek össze, aminek eredményeként egy több mint 500 készséget és 150 000 feladatot bemutató adathalmaz jött létre. A Transformer architektúrában gyökerező kísérőmodellek bizonyították rátermettségüket azzal, hogy a feladatokban 50%-kal magasabb sikerességi arányt értek el a specializált modellekhez képest. Ez azt jelzi, hogy egy változatos példákon képzett modell a legtöbb forgatókönyvben valóban képes háttérbe szorítani a speciális modelleket.
A jövőre nézve a DeepMind csapata vizsgálja a lehetőségeket, hogy az általuk elért eredményeket más innovációkkal, például a RoboCat modellel egyesítse. Az Open X-Embodiment adathalmaz és az RT-1-X modell egy változatának nyílt forráskóddal való ellátásával az eredményeik demokratizálásában is előrelépést tettek. Ahogy Pannag Sanketi, a Google Robotics munkatársa találóan fogalmaz: „A robotika jövője azon múlik, hogy a robotok képesek lesznek-e tanulni egymástól és ami döntő fontosságú, hogy a kutatók tanulhassanak egymástól”.