NVIDIA presenta métodos de formación de agentes de inteligencia artificial utilizando datos sintéticos y GRPO
El nuevo enfoque de NVIDIA combina la generación de datos sintéticos con el aprendizaje de refuerzo para formar agentes CLI en una sola GPU, cortando el tiempo de entrenamiento de meses a días. (Leer más)





