Reward Learning

1 paper across 1 session

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Information-Theoretic Reward Decomposition for Generalizable RLHF

#311 · Liyuan Mao, Haoran Xu, Amy Zhang, Weinan Zhang, Chenjia Bai

In this paper, we decompose the reward value into prompt-free reward and prompt-related reward from a information-theoretic perspective, and use the former to guide reward training.