Új szintre emelheti a mesterséges intelligencia érvelési képességét a Reinforcement Learning Pre-training (RLP).