NVIDIA dévoile la méthode de formation des agents d'IA à l'aide de données synthétiques et de données GRPO
La nouvelle approche de NVIDIA combine la production de données synthétiques et l'apprentissage du renforcement pour former des agents CLI sur un seul GPU, réduisant le temps d'entraînement de mois à jours. (En savoir plus)





