Az Inflection, egy virágzó AI startup bemutatta saját nagy nyelvi modelljét, az Inflection-1-et, ezzel új versenytársat hozva a jelenleg a Google és az OpenAI által uralt AI-fejlesztések színterére.
Az Inflection, amelynek célja a "mindenki számára elérhető mesterséges intelligencia" létrehozása, bemutatta saját nagy nyelvi modelljét, az Inflection-1-et, amely a Pi társalgási ügynökét hajtja. E modellek hatékonyságának megítélése kihívást jelenthet a teljesítménymutatók szubjektív jellege miatt, ugyanakkor egy versenytárs megjelenése ösztönözheti az innovációt. Az új modell, az Inflection-1 méretét és képességeit tekintve összehasonlítható a GPT-3.5-höz (ChatGPT), ami a képzéshez használt számítási teljesítményen alapul. A vállalat szerint modelljük ugyanolyan hatékony, sőt jobb, mint az ebben a kategóriában található többi modell, amit egy technikai feljegyzés is alátámaszt, amely részletezi a több modellen elvégzett referenciaértékeket, beleértve az Inflection-1, GPT-3.5, LLaMA és PaLM-540B modelleket. A teljesítménymérések azt mutatják, hogy az Inflection-1 lenyűgözően teljesít az olyan feladatokban, mint a középiskolai szintű vizsgafeladatok és a józan ész mércéi. Gyengébb teljesítménye a kódolási feladatokban mutatkozik, ahol a GPT-3.5 és különösen a GPT-4 jobb teljesítményt nyújt. Az Inflection azonban jelezte, hogy tervezi egy nagyobb, a GPT-4-hez és a PaLM-2(L)-hez hasonló modell kiadását, amint az eredmények nyilvános használatra készek lesznek. Így az Inflection-2 vagy az Inflection-1-XL érkezése küszöbön áll, de még nem alakult ki teljesen. A mesterséges intelligencia világában nyilvánvaló, hogy a AI-modellek hatékonysága és alkalmazása méretenként eltérő, hasonlóan a különböző súlycsoportok erősségeinek és gyengeségeinek eltéréseihez az ökölvívásban. A terület, bár még mindig csak kialakulóban van, még nem áll készen arra, hogy ezeket az AI-modelleket méret és hatékonyság alapján külön csoportokba sorolja. Jelen állás szerint e modellek széles körű használata és független értékelése lenne a végső bizonyíték a hatékonyságukról, és addig is az Inflection benchmark eredményeit némi szkepticizmussal kell kezelni.