Az OpenAI bejelentette, hogy megjelent a GPT-4, az AI-nyelvmodellek sorának legújabb tagja, amely továbbfejlesztett képességgel rendelkezik összetett problémák megoldására, és szöveges és képi bemenetet egyaránt képes kezelni.
Az OpenAI piacra dobta a GPT-4-et, a mesterséges intelligencia nyelvi modelljeinek legújabb tagját, amely képes szöveges és képi bemenetet is fogadni, és az OpenAI állítása szerint nagyobb pontossággal képes megoldani bonyolult problémákat. A vállalat szerint az új modell "kreatívabb és együttműködőbb, mint valaha", de a korábbi nyelvi modellekhez hasonló problémákkal küzd, például hajlamos erőszakos és ártalmas szövegeket generálni, vagy kitalálni információkat, amit "hallucinálásnak" neveznek. Az OpenAI több céggel is partnerségre lépett, hogy a GPT-4-et integrálják termékeikbe, köztük a Duolingo, a Stripe és a Khan Academy. Az új modell a nagyközönség számára a ChatGPT Plus, az OpenAI havi 20 dolláros ChatGPT előfizetésén keresztül érhető el, és a Microsoft Bing chatbotját is ez hajtja. Emellett a GPT-4 API-ként is elérhető lesz a fejlesztők számára. Az OpenAI azt állítja, hogy már megkezdte a felhasználók felvételét a várólistáról. A GPT-4 teljesítményét mutatja, hogy a rendszer több vizsgán, köztük az egységes ügyvédi vizsgán, az LSAT-on, az SAT Math-on és az SAT Evidence-Based Reading & Writing-on elérte a 88 százalékot vagy annál is magasabbat. A vállalat bejelentése arra utal, hogy a GPT-4 fejlesztései inkább ismétlődőek, mint forradalmiak, ahogy arra korábban figyelmeztettek. Az OpenAI vezérigazgatója, Sam Altman twitteren azt írta, hogy a GPT-4 "még mindig hibás, még mindig korlátozott", de "első használatra még mindig lenyűgözőbbnek tűnik, mint miután több időt töltesz vele". A vállalat azt állítja, hogy a modell egyszerre képes elemezni a szöveges és képi bemeneteket, lehetővé téve az összetettebb értelmezést. A GPT-4 multimodális, de néhány az előrejelzettnél kevesebb, szöveg- és képbevitelt fogad, de csak szöveges kimenetet bocsát ki. A minták azt mutatják, hogy a rendszer elmagyarázza a mémeket és a szokatlan képeket. Az OpenAI az évek során lassan lendületet vett: a GPT-t leíró eredeti kutatási dokumentum 2018-ban jelent meg, majd 2019-ben a GPT-2, 2020-ban pedig a GPT-3 következett. Ezeket a modelleket az internetről lemásolt hatalmas szöveges adathalmazokon képezték ki, hogy megjósolják, melyik szó követi a másikat. A vállalat kezdetben a rosszindulatú felhasználástól való félelem miatt elhalasztotta a GPT-modellek kiadását, de 2022-ben elindította a ChatGPT-t, a GPT-3.5-re épülő társalgási chatbotot, amely őrületet váltott ki a technológiai világban. Az mesterséges intelligencia nyelvi modellek szélesebb körű elérhetősége olyan kihívásokat teremtett, mint például az oktatási rendszer alkalmazkodása a tekintélyes egyetemi esszéket író szoftverek létezéséhez, a Stack Overflow és a Clarkesworld sci-fi magazin kénytelen volt lezárni a beadványokat a mesterséges intelligencia által generált tartalmak beáramlása miatt. Egyes szakértők azonban azzal érveltek, hogy a káros hatások még mindig kisebbek a vártnál.