Q-learning - NeurIPS 2025

today local_bar

Q-learning

5 papers across 3 sessions

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Risk-Averse Total-Reward Reinforcement Learning

#209 · Xihong Su, Jia Lin Hau, Gersi Doko, Kishan Panaganti, Marek Petrik

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

ShiQ: Bringing back Bellman to LLMs

#5405 · Pierre Clavier, Nathan Grinsztajn, Raphaël Avalos, Yannis Flet-Berliac, Irem Ergun, Omar Darwiche Domingues, Olivier Pietquin, Pierre Richemond, Florian Strub, Matthieu Geist

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Planning and Learning in Average Risk-aware MDPs

#3102 · Weikai Wang, Erick Delage

This work presents planning and learning algorithms for average-cost MDPs with dynamic risk measures.

Actor-Free Continuous Control via Structurally Maximizable Q-Functions

#307 · Yigit Korkmaz, Urvi Bhuwania, Ayush Jain, Erdem Bıyık

Actor-free Q-learning in Continuous Action Spaces by Learning a "Wire-fitted Q-function"

Compute-Optimal Scaling for Value-Based Deep RL

#216 · Preston Fu, Oleh Rybkin, Zhiyuan (Paul) Zhou, Michal Nauman, Pieter Abbeel, Sergey Levine, Aviral Kumar