Az OpenAI zászlóshajó AI modellje megbízhatóbbá vált, de könnyebben átverhetővé vált

2023.10.18. 10:05 VipAIR

Az AI fejlődése különös fordulatot vesz a GPT-4-gyel, amely előrelépést tesz a megbízhatóság terén, de kifinomult burkolata alatt riasztó sebezhetőségeket fedez fel.

Az OpenAI zászlóshajó AI modellje megbízhatóbbá vált, de könnyebben átverhetővé vált

A GPT-4 elődjéhez képest megbízhatóbbnak bizonyult, de egyben érzékenyebb is az elfogultságokra és a biztonsági problémákra.
A kutatók felfedezték, hogy a GPT-4 manipulálható a biztonsági intézkedések figyelmen kívül hagyása és személyes adatok kiszivárogtatása érdekében.
Ha többet akarsz tudni, kövess minket Facebookon!
Sebezhetőségeik ellenére a fogyasztóknak szánt GPT-4-alapú termékeket tesztelték annak érdekében, hogy megvédjék őket a potenciális károktól.

Az OpenAI GPT-4 új fejezetet ír a generatív AI történetében, a bizalom és a sebezhetőség spektrumát vetítve maga után. A Microsoft támogatásával megerősített aprólékos tanulmány a GPT-4-et a fokozott megbízhatóság bástyájaként mutatja be, amely képes a személyes adatok védelmére és a mérgező előítéletek zavaros vizein való eligazodásra. A megerősített bizalom mögött azonban a manipulációra való fogékonyság rejlik, ahol a mesterséges intelligencia modell megkerülheti a biztonsági protokollokat, így személyes információk és beszélgetési történetek tárháza tárul fel.

Egy olyan területen, ahol a bizalom a legfontosabb, a GPT-4 alkotói biztosítékokat terveztek, a modell ellenálló képessége érdekében, az ellenséges támadással szemben. A kutatás a GPT-4 védelmének aprólékos vizsgálatát vázolja fel, a toxicitástól és a sztereotípiáktól kezdve a magánélet védelmén át a gépi etikáig terjedő területeket vizsgálva. Megerősített védelme ellenére a GPT-4 sebezhetőnek mutatkozik a pontos és félrevezető utasításokkal szemben, és hajlamos a védett határain túllépni.

A kutatók próbára tették a GPT-4 képességeit, és az utasítások széles skáláját használták. Kiderült, hogy bár a GPT-4 fokozott megbízhatósága remekelt, a sebezhetőség árnyékait is magában hordozta, érzékeny volt a trükkös kérések és a lehetséges elfogultságokra. A kutatás célja nemcsak a modell erősségeinek és gyengeségeinek feltárására irányult, hanem az is, hogy elősegítse a kutatóközösségben az együttműködést, ösztönözve a modellt az ellenséges kizsákmányolásokkal szembeni kollektív erőfeszítésre.

A generatív AI kibontakozó történetében a GPT-4 a technológiai fejlődés összetettségének bizonyítéka. Megtestesíti a győzelem és a megpróbáltatások történetét, ahol a fokozott megbízhatóság kéz a kézben jár a feltárt sebezhetőségekkel, és egy sarkalatos fejezetet jelent a nagy teljesítményű és megbízható mesterséges intelligencia modellek létrehozása felé vezető úton.