Zhejiang Univeristy - NeurIPS 2025

🏛 Zhejiang Univeristy

1 paper across 1 session

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Reinforcing the Diffusion Chain of Lateral Thought with Diffusion Language Models

#308 · Zemin Huang, Zhiyang Chen, Zijun Wang, Tiancheng Li, Guo-Jun Qi

We propose DCoLT, a method to enhance diffusion language models by treating each reverse diffusion step as a latent "thinking" using reinforcement learning. Achieves promising results on several math and code metrics with SEDD and LLaDA.