Curriculum-RLAIF: Curriculum Alignment with Reinforcement Learning from AI Feedback

Mengdi Li*, Jiaye Lin*, Xufeng Zhao, Wenhao Lu, Peilin Zhao, Stefan Wermter, Di Wang

June 2025

Go to Project Site