Az OpenAI kiadta a ChatGPT-t, egy olyan társalgási mesterséges intelligenciát, amely képes válaszolni a nyomon követő kérdésekre, beismerni a hibákat és elutasítani a nem megfelelő kéréseket.
Az OpenAI kiadta a ChatGPT-t, egy társalgási mesterséges intelligenciát, amely képes válaszolni a nyomon követő kérdésekre, beismerni a hibákat és elutasítani a nem megfelelő kéréseket. A csapat szerint ez a kiadás a legújabb lépés az OpenAI egyre biztonságosabb és hasznosabb AI-rendszerek iteratív bevezetésében. A korábbi modellek, köztük a GPT-3 és a Codex telepítéséből levont tanulságok vezettek ehhez a kiadáshoz, és hozzájárultak, többek között a káros és valótlan kimenetek jelentős csökkentéséhez, amelyet a Reinforcement Learning from Human Feedback (RLHF) megerősítő tanulás alkalmazásával értek el. "Ezt a modellt az RLHF segítségével képeztük ki, ugyanazokkal a módszerekkel, mint az InstructGPT-t, de az adatgyűjtés beállításában némi eltéréssel" - magyarázza a csapat a cég honlapján. "Egy kezdeti modellt képeztünk ki felügyelt finomhangolással: emberi AI-oktatók olyan beszélgetéseket adtak át, amelyekben mindkét oldalt - a felhasználót és egy AI-asszisztenst - eljátszották. Az oktatóknak hozzáférést adtunk a modell által megírt javaslatokhoz, hogy segítsük őket a válaszok összeállításában"." A ChatGPT-nek azonban vannak korlátai, amelyek a képzési adatok torzításain alapulnak. A modell néha hihetőnek hangzó, de helytelen vagy értelmetlen válaszokat ír, és érzékeny a bemeneti megfogalmazás szerkesztésére vagy arra, hogy ugyanazt a kérést többször is megpróbálja megadni. A vállalat szerint ezek a problémák a képzési adatokban lévő torzításokból és a jól ismert túloptimalizálási problémákból adódnak. Az OpenAI csapata azt állítja, hogy tisztában van a fennmaradó korlátokkal, és rendszeres modellfrissítéseket tervez a rendszer javítása érdekében. "De azt is reméljük, hogy a ChatGPT hozzáférhető felületének biztosításával értékes felhasználói visszajelzéseket kapunk olyan problémákról, amelyekkel még nem vagyunk tisztában" - mondják.