Tag Archives: apprentissage par renforcement

Comment l’IA apprend et se développe (I)  : l’apprentissage par renforcement prolongé

Présentation de M. Liu et al., ProRL : Prolonged Reinforcement Learning Expands Reasoning Boudaries in Large Language Models. L’apprentissage par renforcement prolongé semble permettre de débloquer de nouvelles capacités de raisonnement que le pré entraînement seul n’atteint pas. Lire la suite

Publié dans intelligence artificielle | Tagué , , , , , , | Laisser un commentaire