2023.07.25. VipAIR
A Stability AI egy merész lépéssel két új nyelvi modellt, a FreeWilly1-et és a FreeWilly2-t mutatta be, amelyeket egy egyedi, kisebb adathalmazon képeztek ki, hogy forradalmasítsa az AI nyelvfeldolgozást.
-
A Stability AI két új nyelvi modellt, a FreeWilly1 és FreeWilly2 modelleket mutatott be, amelyeket egy kisebb, szintetikus adathalmazon képeztek ki.
-
A modelleket 600 000 adatponttal képezték, ami az eredeti Orca-adatkészlet méretének mindössze 10%-a, így költséghatékonyabbak és környezetbarátabbak.
-
Ezek a modellek az összetett érvelésben és a bonyolult kérdések megválaszolásában jeleskednek, és céljuk a kutatás előmozdítása és a nyílt hozzáférés elősegítése az AI közösségben.
A
Stability AI, a
Stable Diffusion képgeneráló mesterséges intelligencia mögött álló vállalat nemrégiben két új nyelvi modellt mutatott be, a FreeWilly1 és a FreeWilly2 modelleket. Ezek a modellek a
Meta LLaMA és LLaMA 2 nyílt forráskódú modelljeinek változatain alapulnak, de egy új, kisebb, szintetikus adatokat tartalmazó adathalmazon vannak betanítva. A modelleket úgy tervezték, hogy kiemelkedjenek a bonyolult érvelésben, a nyelvi finomságokban, valamint az olyan speciális területeken felmerülő összetett kérdések megválaszolásában, mint a jog és a matematika.
A FreeWilly modelleket a Stability leányvállalata, a
CarperAI adta ki nem kereskedelmi licenc alatt, ami azt jelenti, hogy a kutatás előmozdítását és a nyílt hozzáférés elősegítését célozzák a mesterséges intelligencia közösségében. A modellek neve játékosan utal a
Microsoft kutatói által kifejlesztett "Orca" AI-képzési módszertanára, amely lehetővé teszi, hogy a kisebb modellek elérjék a nagyobb modellek teljesítményét, ha nagyobb adathalmazoknak vannak kitéve.
A FreeWilly1 és FreeWilly2 modelleket 600 000 adatponttal képezték ki, ami az eredeti Orca-adatkészlet méretének mindössze 10%-a. Ez a megközelítés kevésbé költséges és környezetbaráttá tette a képzési folyamatot, csökkentve az energiafelhasználást és a szénlábnyomot. A kisebb adatkészlet ellenére a FreeWilly modellek kiemelkedő teljesítményt mutattak, amely az
OpenAI ChatGPT-jéhez hasonlítható, és néhány esetben meg is haladja azt.
A Stability AI úgy véli, hogy ezek a modellek új mércét állítanak fel a nyílt hozzáférésű nyelvi modellek területén, javítva a természetes nyelvi megértést és lehetővé téve az összetett feladatok elvégzését. A vállalat izgatottan várja, hogy ezek a modellek milyen végtelen lehetőségeket kínálnak majd a mesterséges intelligencia közösség számára, és milyen új alkalmazásokat inspirálnak majd.