Non-differentiable rewards - NeurIPS 2025

today local_bar

Non-differentiable rewards

1 paper across 1 session

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Fine-Tuning Discrete Diffusion Models with Policy Gradient Methods

#3705 · Oussama Zekri, Nicolas Boulle

We propose a policy gradient algorithm for fine-tuning discrete diffusion models over non-differentiable rewards.