PersRM-R1: Enhance Personalized Reward Modeling with Reinforcement Learning

Mengdi Li*, Guanqiao Chen*, Xufeng Zhao, Haochen Wen, Shu Yang, Di Wang

August 2025

Go to Project Site

RL LLMs RM Personalization