Egy ellentmondásos gyakorlat szerint a nagy technológiai cégek, mint az OpenAI, a Google és az Anthropic tiltják a saját tartalmaik használatát az AI képzéséhez, miközben szabadon felhasználják más forrásokból származó tartalmakat.
A digitális kor tanúja volt a generatív AI megjelenésének és a technológiai óriások kettős mércét támasztanak az online tartalomhasználattal kapcsolatban. Az olyan vállalatok, mint a Microsoft által támogatott OpenAI, a Google és az általa támogatott Anthropic más szervezetek tartalmait használják fel az AI-modelljeik képzéséhez, gyakran kifejezett beleegyezés nélkül. Ez a gyakorlat fenyegető jogi vitát váltott ki a web jövőjéről és a szerzői jogi törvények alkalmazásáról ezen a feltörekvő területen. Miközben ezek a vállalatok a tisztességes felhasználásra hivatkoznak, ironikus módon elutasítják, hogy a saját tartalmukat hasonló módon használják fel. Az Anthropic AI-asszisztense, Claude ezt a szolgáltatási feltételeiben is szemlélteti, kifejezetten megtiltva a szolgáltatásaik használatát mesterséges intelligencia vagy gépi tanulási algoritmusok vagy modellek fejlesztésére vagy betanítására. A Google és az OpenAI is hasonlóan jár el, hasonló korlátozásokat emelve ki a generatív AI felhasználási feltételeikben, illetve szolgáltatásaikban. Ezek a záradékok a saját tartalmukat védik, ugyanakkor kérdéseket vetnek fel mások anyagának szabad felhasználásával kapcsolatban. Tény, hogy a kiváló minőségű tartalom elengedhetetlen az új mesterséges intelligencia modellek fejlesztéséhez, ami talán indokolja, hogy ezek a vállalatok védekező álláspontot képviselnek saját termékeikkel szemben. Felmerül azonban a kérdés: miért kellene más szervezeteknek megengedniük, hogy tartalmukat ellenszolgáltatás nélkül felhasználják? Amikor rákérdeztek erre, ezek a technológiai óriáscégek nem reagáltak a kérdésre. Az utóbbi időben az egyensúly kezdett eltolódni, mivel más vállalatok, például a Reddit, ráébredtek erre a kettősségre. A Reddit, amelynek adatait már régóta használják mesterséges intelligencia képzéséhez, most azt fontolgatja, hogy díjat kér az adatokhoz való hozzáférésért. Steve Huffman vezérigazgató hangsúlyozta a Reddit adatkorpuszának értékét, és megkérdőjelezte annak nagyvállalatok általi ingyenes kihasználását. Ezt a véleményt Elon Musk is megerősítette, aki azzal vádolta a Microsoftot, hogy illegálisan használja a Twitter adatait mesterséges intelligencia képzéséhez. Sokan egy igazságosabb rendszerre törekszenek. Az OpenAI vezérigazgatója, Sam Altman például olyan AI-modelleket fejleszt, amelyek tiszteletben tartják a szerzői jogokat és megfizetik a tartalomkészítőket. Egyes kiadók, például a News Corp. már most is nyomást gyakorolnak a technológiai cégekre, hogy fizessenek azért, ha az ő tartalmaikat használják fel az AI-modellek képzéséhez. Steven Sinofsky, a Microsoft korábbi vezetője aggodalmának adott hangot a jelenlegi mesterséges intelligencia képzési módszerekkel kapcsolatban. Szerinte ezek a gyakorlatok "tönkreteszik" a webet, mivel nem nyújtanak értéket az eredeti tartalomkészítőknek vagy a szerzői jogok tulajdonosainak. Ezek a kritikák megkérdőjelezik a status quo-t, és fontos vitákat váltanak ki az AI-modellek képzési gyakorlatáról.