value-based reinforcement learning - NeurIPS 2025

today local_bar

value-based reinforcement learning

1 paper across 1 session

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Trajectory Bellman Residual Minimization: A Simple Value-Based Method for LLM Reasoning

#215 · Yurun Yuan, Fan Chen, Zeyu Jia, Alexander Rakhlin, Tengyang Xie