Hogyan ismerjük fel a AI-val generált szöveget?

2023.03.02. 10:07 VipAIR

Mivel az AI által generált tartalom egyre népszerűbbé válik, számos iparágat foglalkoztat a kérdés, hogyan lehet felismerni az olyan szöveget, amelyet nem emberek, hanem gépek hoztak létre.

Az OpenAI generatív előképzett transzformátora (ChatGPT) 2022. novemberi indulása óta a címlapokra került: mindössze négy nap alatt több mint egymillió felhasználója volt, és mindössze két hónap alatt több mint 100 millió aktív felhasználója. Az a képessége, hogy megérti a szöveges bemenetek jelentését és kontextusát, és szinte emberhez hasonló válaszokat generálni, aggodalmat keltett különböző ágazatokban, ahol az ember által generált tartalmakat nagyra értékelik, beleértve az oktatást, a tartalommarketinget, a kiadói tevékenységet, az újságírást és a jogot. A legjelentősebb felmerülő kérdések közé tartozik, hogyan lehet különbséget tenni az AI és az ember által írt szöveg között, és hogyan lehet azonosítani az AI által generált tartalmakat.

Ha többet akarsz tudni, kövess minket Facebookon!

A ChatGPT egy transzformátornak nevezett mély tanulási algoritmust alkalmaz, amely különösen hatékony a természetes nyelvfeldolgozási (NLP) feladatokban. A mesterséges intelligenciával rendelkező chatbotot az internetről származó szöveges adatok - köztük könyvek, cikkek és weboldalak - hatalmas korpuszán képezték ki, hogy megtanulja a szavak és kifejezések közötti mintákat és kapcsolatokat. Amikor a felhasználó beír egy kérdést vagy kijelentést, a ChatGPT feldolgozza a szöveget, és a képzési adatok, valamint a kontextus és a bemenet jelentésének megértése alapján választ generál. Ennek eredményeképpen az NLP-feladatok széles skáláját képes elvégezni, beleértve a szövegkiegészítést, a kérdésekre adott válaszokat, a nyelvi fordítást és még a szöveggenerálást is.

A mesterséges intelligencia által generált tartalmak kézzel történő felismeréséhez az egyik megközelítés a minta öt fő jellemzőjének vizsgálata: konzisztencia, koherencia, eredetiség, hibák és kontextus. A mesterséges intelligencia által generált szöveg jellemzően következetes a stílus, a hangnem és a szókincs tekintetében, míg az ember által írt szöveg több variációt és árnyalatot mutathat. Ezzel szemben a tartalomból hiányozhat a koherencia, különösen akkor, ha összetett vagy árnyalt kérésekre válaszol. A mesterséges intelligencia által generált szöveg tartalmazhat ismétlődő vagy sablonos mondatokat vagy mintákat, míg az ember által írt szöveg nagyobb valószínűséggel eredeti és kreatív. A mesterséges intelligencia által generált tartalom hajlamosabb a hibázásra, mint az ember által írt szöveg, különösen azokon a területeken, ahol a modell nem részesült alapos képzésben. Végül a platform néha nehezen érti meg az adott kérés kontextusát, ami nem megfelelő vagy irreleváns válaszokhoz vezet, míg az ember által írt szöveg nagyobb valószínűséggel igazodik az adott kontextushoz és célközönséghez.

Bár lehetetlen minden mesterséges intelligenciával írt szöveget felismerni, az OpenAI elindított egy hitelesítési eszközt, amely megkülönbözteti az emberek által készített és a különböző mesterséges intelligencia rendszerek által generált szöveget. Az új osztályozó képes azonosítani a mesterséges intelligencia létrehozására utaló jeleket, de még nem teljesen megbízható. A kutatók úgy vélik, hogy a jó osztályozók képesek felismerni az AI által generált tartalmakat, és az eszköz hasznos lehet az tudományos tisztességtelenség esetén, illetve akkor, ha az AI chatbotok embernek adják ki magukat. Az eszköz az AI által írt angol nyelvű szövegek 26%-át helyesen azonosította, de 9%-ban tévesen azonosította az ember által írt szöveget, amelyet valószínűleg AI-eszközök generáltak. Az eszköz megbízhatatlan az 1000 karakternél rövidebb szövegek esetében, és tévesen azonosíthat néhány ember által írt szöveget mesterséges intelligencia által generáltként.