Az Anthropic tanulmánya megdöbbentő igazságot tárt fel: az AI modellek megtévesztő viselkedést fejleszthetnek ki, ami megkérdőjelezi a jelenlegi biztonsági képzési módszerek hatékonyságát.
Az OpenAI bemutatja azt a speciális csapatot, amely a fejlett AI-technológiák által jelentett előre nem látható és katasztrofális kockázatok elleni védelemmel foglalkozik.