reinforcement learning

Microsoft új AI-keretrendszere okosabban tanítja a modelleket, lényegesen olcsóbban

2025.09.14. 10:08 | Horváth Péter

A Microsoft Research bemutatta a rStar2-Agent nevű új keretrendszerét, amely gyökeresen átalakíthatja a nagyméretű nyelvi modellek tréningjét. Az innováció lényege, hogy a komplex érvelési feladatokra képes modellek tanítását jóval kisebb számítási költséggel és adatigénnyel teszi lehetővé, miközben felülmúlja a sokszor nagyságrendekkel nagyobb riválisokat is.