2023.02.26. VipAIR
A Facebook anyavállalata, a Meta egy új AI nyelvi generátort indított LLaMA néven, amely nem chatbot, hanem egy kutatási eszköz az AI nyelvi modellek problémáinak megoldására.

Míg az olyan technológiai óriások, mint a
Google, az
OpenAI és a
Microsoft a nyelvi modelljeik miatt kaptak figyelmet, a
Meta a színfalak mögött saját eszközén, a LLaMA-n dolgozik. Más nyelvi modellekkel ellentétben, amelyeket bárki használhat, a LLaMA egy olyan kutatási eszköz, amelyet arra terveztek, hogy segítsen a szakértőknek azonosítani és megoldani az olyan problémákat, mint az elfogultság, a toxicitás és a hamis információk generálására való hajlam.
A LLaMA négy különböző méretű modellből áll, és a Meta nem kereskedelmi licenc alatt adja ki kutatási felhasználási célokra. A vállalat reményei szerint az egyetemek, a nem kormányzati szervezetek és az ipari laboratóriumok hozzáférhetnek a LLaMA-hoz, hogy elősegítsék munkájukat ezen a gyorsan változó területen.
A Meta kutatási dokumentuma szerint a LLaMA második legkisebb változata, a LLaMA-13B a legtöbb benchmarkon jobban teljesít, mint az OpenAI népszerű GPT-3 modellje, míg a legnagyobb modell, a LLaMA-65B versenyképes a legjobb modellekkel, például a
DeepMind Chinchilla70B és a Google PaLM 540B modelljével.
Mark Zuckerberg vezérigazgató egy Facebook-bejegyzésben azt mondta, hogy a LLaMA "a legmodernebb mesterséges intelligencia nagy nyelvi modellje, amelyet arra terveztek, hogy segítse a kutatókat munkájuk előrehaladásában". A Meta elkötelezett amellett, hogy a LLaMA-t elérhetővé tegye az AI-kutatói közösség számára, és reméli, hogy az eredményt felhasználják majd a felelős AI-irányelvek kidolgozásához.