A Meta kutatási felhasználásra kiadja az új LLaMA AI-nyelvi modellt

A Facebook anyavállalata, a Meta egy új AI nyelvi generátort indított LLaMA néven, amely nem chatbot, hanem egy kutatási eszköz az AI nyelvi modellek problémáinak megoldására.

Míg az olyan technológiai óriások, mint a Google, az OpenAI és a Microsoft a nyelvi modelljeik miatt kaptak figyelmet, a Meta a színfalak mögött saját eszközén, a LLaMA-n dolgozik. Más nyelvi modellekkel ellentétben, amelyeket bárki használhat, a LLaMA egy olyan kutatási eszköz, amelyet arra terveztek, hogy segítsen a szakértőknek azonosítani és megoldani az olyan problémákat, mint az elfogultság, a toxicitás és a hamis információk generálására való hajlam.

A LLaMA négy különböző méretű modellből áll, és a Meta nem kereskedelmi licenc alatt adja ki kutatási felhasználási célokra. A vállalat reményei szerint az egyetemek, a nem kormányzati szervezetek és az ipari laboratóriumok hozzáférhetnek a LLaMA-hoz, hogy elősegítsék munkájukat ezen a gyorsan változó területen.

A Meta kutatási dokumentuma szerint a LLaMA második legkisebb változata, a LLaMA-13B a legtöbb benchmarkon jobban teljesít, mint az OpenAI népszerű GPT-3 modellje, míg a legnagyobb modell, a LLaMA-65B versenyképes a legjobb modellekkel, például a DeepMind Chinchilla70B és a Google PaLM 540B modelljével.

Mark Zuckerberg vezérigazgató egy Facebook-bejegyzésben azt mondta, hogy a LLaMA "a legmodernebb mesterséges intelligencia nagy nyelvi modellje, amelyet arra terveztek, hogy segítse a kutatókat munkájuk előrehaladásában". A Meta elkötelezett amellett, hogy a LLaMA-t elérhetővé tegye az AI-kutatói közösség számára, és reméli, hogy az eredményt felhasználják majd a felelős AI-irányelvek kidolgozásához.

Megosztás Facebookon