NVIDIA представила метод обучения ИИ-агентов с использованием синтетических данных и GRPO
Новый подход NVIDIA сочетает в себе синтетическую генерацию данных с обучением с подкреплением для обучения агентов CLI на одном графическом процессоре, сокращая время обучения от месяцев до дней. (Читать далее)





