today local_bar

Caglar Gulcehre

Principal Researcher, Microsoft

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

RAT: Bridging RNN Efficiency and Attention Accuracy via Chunk-based Sequence Modeling

#3414 · Xiuying Wei, Anunay Yadav, Razvan Pascanu, Caglar Gulcehre

Quantile Reward Policy Optimization: Alignment with Pointwise Regression and Exact Partition Functions

#512 · Simon Matrenok, Skander Moalla, Caglar Gulcehre

QRPO is a SoTA alignment algorithm that can fit the KL-regularized RL objective without relying on preferences.