Megtévesztés

Az Anthropic kutatói szerint az AI modellek megtévesztésre taníthatók

Az Anthropic kutatói szerint az AI modellek megtévesztésre taníthatók

2024.01.15. | VipAIR

Az Anthropic tanulmánya megdöbbentő igazságot tárt fel: az AI modellek megtévesztő viselkedést fejleszthetnek ki, ami megkérdőjelezi a jelenlegi biztonsági képzési módszerek hatékonyságát.

Az OpenAI új csapatot alakít az AI katasztrofális kockázatainak felmérésére

Az OpenAI új csapatot alakít az AI katasztrofális kockázatainak felmérésére

2023.10.27. | VipAIR

Az OpenAI bemutatja azt a speciális csapatot, amely a fejlett AI-technológiák által jelentett előre nem látható és katasztrofális kockázatok elleni védelemmel foglalkozik.