Reward Design

3 papers across 2 sessions

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

ToolRL: Reward is All Tool Learning Needs

#511 · Cheng Qian, Emre Can Acikgoz, Qi He, Hongru WANG, Xiusi Chen, Dilek Hakkani-Tur, Gokhan Tur, Heng Ji

The paper proposes a principled reward design framework for training LLMs on tool use via reinforcement learning, leading to significant gains over SFT and baseline models in generalization and performance.

Poster Session 3

2 papers

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

RF-Agent: Automated Reward Function Design via Language Agent Tree Search

#416 Spotlight · Ning Gao, Xiuhui Zhang, Xingyu Jiang, Mukang You, Mohan Zhang, Yue Deng

We propose RF-Agent, an automated RL reward function design framework via language agent tree search.

Progress Reward Model for Reinforcement Learning via Large Language Models

#412 · Xiuhui Zhang, Ning Gao, Xingyu Jiang, Yihui Chen, Yuheng Pan, Mohan Zhang, Yue Deng

We construct a Progress Reward Model with convergence guarantee for Reinforcement Learning via Large Language Models.