today local_bar

Yihui Chen

MS student, Beijing University of Aeronautics and Astronautics

1 paper at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Progress Reward Model for Reinforcement Learning via Large Language Models

#412 · Xiuhui Zhang, Ning Gao, Xingyu Jiang, Yihui Chen, Yuheng Pan, Mohan Zhang, Yue Deng

We construct a Progress Reward Model with convergence guarantee for Reinforcement Learning via Large Language Models.