today local_bar

Xiuhui Zhang

PhD student, Beijing University of Aeronautics and Astronautics

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

RF-Agent: Automated Reward Function Design via Language Agent Tree Search

#416 Spotlight · Ning Gao, Xiuhui Zhang, Xingyu Jiang, Mukang You, Mohan Zhang, Yue Deng

We propose RF-Agent, an automated RL reward function design framework via language agent tree search.

Progress Reward Model for Reinforcement Learning via Large Language Models

#412 · Xiuhui Zhang, Ning Gao, Xingyu Jiang, Yihui Chen, Yuheng Pan, Mohan Zhang, Yue Deng

We construct a Progress Reward Model with convergence guarantee for Reinforcement Learning via Large Language Models.