NVIDIA enthüllt AI Agent Training Methode mit synthetischen Daten und GRPO
Der neue Ansatz von NVIDIA kombiniert synthetische Datenerzeugung mit Verstärkungslernen, um CLI-Agenten auf einer einzigen GPU zu trainieren und die Trainingszeit von Monaten bis Tagen zu reduzieren. (Weiterlesen)





