Ellenséges képzés

Az Anthropic kutatói szerint az AI modellek megtévesztésre taníthatók

Az Anthropic kutatói szerint az AI modellek megtévesztésre taníthatók

2024.01.15. | VipAIR

Az Anthropic tanulmánya megdöbbentő igazságot tárt fel: az AI modellek megtévesztő viselkedést fejleszthetnek ki, ami megkérdőjelezi a jelenlegi biztonsági képzési módszerek hatékonyságát.