Discriminative Learning

1 paper across 1 session

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization

#3700 · Gang Li, Ming Lin, Tomer Galanti, Zhengzhong Tu, Tianbao Yang

We proposed a framework for reinforcing large reasoning models with discriminative constrained optimization , grounded in the principle that increasing the scores of positive answers while decreasing those of negative ones.