Institute of Psychology, CAS

🏛 Institute of Psychology, CAS

1 paper across 1 session

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

MRO: Enhancing Reasoning in Diffusion Language Models via Multi-Reward Optimization

#3617 · Chenglong Wang, Yang Gan, Hang Zhou, Chi Hu, Yongyu Mu, Kai Song, MuRun Yang, Bei Li, Chunliang Zhang, Tongran Liu, JingBo Zhu, Zhengtao Yu, Tong Xiao

We propose the Multi-Reward Optimization (MRO) approach, which enhances token correlation during the denoising process in diffusion language models, improving reasoning performance and sampling efficiency.