2023.07.15. VipAIR
A CM3leon-nal a Meta új mércét állít fel az AI-alapú képgenerálás terén, amely kiemelkedő hatékonysággal és teljesítménnyel büszkélkedhet.
-
A Meta bemutatta a CM3leon-t, az AI-képgenerálás multimodális alapmodelljét, amely szöveg-kép és kép-szöveg létrehozási lehetőségeket is kínál.
-
A meglévő diffúziós modellekkel ellentétben a CM3leon egy token-alapú autoregresszív modellt használ, amely a Meta állítása szerint hatékonyabb.
-
A modellt a Shutterstock-tól származó, licencelt képekkel képezték ki, elkerülve a képek tulajdonjogával és a tulajdonjoggal kapcsolatos etikai és jogi aggályokat.
A
Meta legújabb modelljével, a CM3leon-nal a mesterséges intelligencia képgenerálás határait feszegeti. Ezt a multimodális alapmodellt mind szövegből képbe, mind képből szövegbe történő létrehozásra tervezték, így sokoldalú eszközzé válik az AI-képgenerálás területén. Bár az AI-által generált képek nem új koncepció, a Meta megközelítése a CM3leon létrehozásában és az általa nyújtott teljesítmény valóban újszerű.
A CM3leon eltér a mesterséges intelligencia képgenerálásban használt hagyományos diffúziós modellektől, és helyette egy token-alapú autoregresszív modellt választ. A Meta kutatói bebizonyították, hogy ez a modell hatékonyabb lehet, mint a diffúziós modellen alapuló megközelítés. Valójában a CM3leon a legmodernebb teljesítményt érte el a szövegből képgenerálásban, annak ellenére, hogy a korábbi transzformátor-alapú módszereknél ötször kevesebb számítással képezték ki.
Az adatbeszerzés tekintetében a Meta más utat választott, hogy elkerülje a nyilvánosan elérhető képek internetről való lekaparásával kapcsolatos etikai és jogi kihívásokat. Ehelyett a vállalat a CM3leon képzéséhez kizárólag a
Shutterstock-tól licencelt képeket használ. Ez a megközelítés nem csak a képek tulajdonjogával és a tulajdonjoggal kapcsolatos aggályokat küszöböli ki, hanem nagy teljesítményt is biztosít.
A CM3leon jelenleg kutatási céllal működik és nem világos, hogy a Meta mikor teszi nyilvánosan elérhetővé ezt a technológiát. Tekintettel azonban a lenyűgöző teljesítményre és hatékonyságra, nagyon valószínűnek tűnik, hogy a CM3leon és a generatív AI megközelítése előbb-utóbb túllép a kutatáson.