Ismerje meg a Gorillát: Az AI modellt, amely legyőzi a GPT-4-et az API-interakcióban

Az UC Berkeley kutatói kifejlesztettek egy új AI-modellt, a Gorillát, amely az API-kkal való hatékonyabb és gyorsabb interakcióban felülmúlja az OpenAI GPT-4-esét.

A UC Berkeley kutatócsoportja az összes API számára univerzális platform létrehozására törekedve elindította a Gorilla nevű mesterséges intelligencia modellt, amely az API-kommunikációban felülmúlja az OpenAI GPT-4-esét. A Gorilla egy finomhangolt Meta LLaMA modell, amely javítja az API-kkal való interakció képességét – külső eszközökkel való interakciót kiegészítő kódolás nélkül. A modellt úgy tervezték, hogy egy szélesebb ökoszisztémában működjön, és rugalmas integrációt kínáljon különböző eszközökkel.

A Gorilla kialakításának célja, hogy leküzdje a GPT-4-hez hasonló modellek API-interakciókkal kapcsolatos kihívásait, például azt, hogy nem képesek pontos bemeneti bizonyításokat generálni és hajlamosak hibás API-interakciók használatára. A Gorilla jelentősen csökkenti ezeket a pontatlanságokat, lehetővé téve a rugalmas felhasználói frissítéseket és verziómódosításokat. Például a GPT-4-gyel ellentétben, amely nem létező modellt javasolhat, a Gorilla pontosan meghatározza a feladatot és teljes mértékben minősített API-interakciót javasol.

A kutatási dokumentum alapján a Gorilla kiváló API-funkciós pontosságot és alacsonyabb hibaarányt mutat a GPT-4-hez és az Anthropic Claude-hoz képest. A Gorilla fejlesztőinek célja, hogy nyílt forráskódú platformot hozzanak létre minden API számára a nagy nyelvi modellekkel való interakcióhoz és biztosítják, hogy a projekt nyílt forráskódú marad. Figyelemre méltó, hogy nem a Gorilla az egyetlen olyan modell, amely interfésszel rendelkezik API-kkal – a Meta, a Facebook anyavállalata nemrég indította el a Toolformer-t, amely több API-interakciót kezel a természetes nyelvi feldolgozó alkalmazások számára.

A kutatók bemutatták az APIBench-et is, egy adathalmazt a Gorilla képességeinek értékelésére. Ez az adatkészlet olyan adattárplatformok API-jait egyesíti, mint a HuggingFace, a TorchHub és a TensorHub és tartalmazza ezek minden API-interakciót, valamint a HuggingFace minden feladatkategóriájából a 20 legtöbbet letöltött modellt. A generált API funkcionális helyességének értékeléséhez egy közös AST alfa-illesztési technikát használtak, majd a Gorillát dokumentumkereséssel finomhangolták ezen adathalmaz felhasználásával. A Gorilla modell és kódja elérhető a GitHub-on.

Megosztás Facebookon