Az OpenAI titkos multimodális modellje felrázza az AI-t

Az OpenAI a pletykák szerint egy úttörő modellt fejleszt „Arrakis” kódnéven, amely jelentős lépést jelenthet a mesterséges általános intelligencia (AGI) megvalósítása felé.

  • Az OpenAI állítólag egy új, „Arrakis” kódnevű modellt fejleszt, amely állítólag túlszárnyalja a GPT-4-et és közelebb kerül az AGI-hoz.

  • Az „Arrakis” a leírás szerint egy „minden-mindent-modell”, amely képes szöveg, videó, hang és kép kezelésére.

  • A felhajtás ellenére az OpenAI továbbra is szűkszavú marad, Sam Altman vezérigazgató a Reddit-en lazán foglalkozott a pletykákkal.

A Microsoft technológiai óriás által támogatott OpenAI állítólag egy „Arrakis” kódnevű modellt fejleszt. Ez a modell várhatóan vetekszik a Google közelgő Gemini modelljével, amely egy multimodális alapmodellel. A legérdekesebb, hogy az „Arrakis” a leírás szerint egy „minden-mindent-modell”, amely képes szöveg, kép, hang és videó kombinációjának feldolgozására és generálására. Ez a sokoldalúság sokakat arra engedett következtetni, hogy ez lehet a következő nagy dobás, amely még a GPT-4 képességeit is felülmúlja.

Az AGI, vagyis a mesterséges általános intelligencia kifejezés arra utal, hogy egy mesterséges intelligencia rendszer képes az emberhez hasonló általános kognitív feladatok elvégzésére, nem pedig csak konkrét, szűk feladatokat. A pletyka, miszerint az „Arrakis” egyre közelebb kerül az AGI-hez, nagy port kavarva ezzel a technológiai közösségben. A spekulációkat tovább táplálta, hogy egy népszerű kiszivárogtató fiókját hirtelen lekapcsolták, miután megosztotta az „Arrakis”-ra vonatkozó információkat.

Míg az OpenAI hallgatott ezekről a találgatásokról, Sam Altman vezérigazgató a Reddit-en könnyedén fogalmazott. Kezdetben azzal ugratott, hogy az AGI-t belsőleg sikerült elérni, de később tisztázta, hogy ez „csak mém”. Hangsúlyozta, hogy egy ilyen monumentális bejelentést nem tennének meg lazán egy olyan platformon, mint a Reddit. Az „Arrakis” nevet Frank Herbert „Dűne” című regényének sivatagi bolygója ihlette.

Az „Arrakis” felépítésével kapcsolatban is vannak találgatások. Egyesek úgy vélik, hogy talán nem egy egyedi, masszív modellről van szó, hanem kisebb rendszerek kombinációjáról, a Mixture of Experts (MoE) architektúrát kihasználva. Ez a megközelítés lehetővé tenné a modularitást és a skálázhatóságot, ami elengedhetetlen az „Arrakis” hatalmas paramétereinek és funkcióinak kezeléséhez.

Megosztás Facebookon