inference-time compute

4 papers across 2 sessions

Poster Session 2

3 papers

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning

#1900 · Rui Pan, Yinwei Dai, Zhihao Zhang, Gabriele Oliaro, Zhihao Jia, Ravi Netravali

Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search

#3418 Spotlight · Yuichi Inoue, Kou Misaki, Yuki Imajuku, So Kuroki, Taishi Nakamura, Takuya Akiba

Adaptive Branching MCTS, a novel inference-time framework for LLMs, generalizes repeated sampling with multi-turn exploration and exploitation.

Exact Expressive Power of Transformers with Padding

#3906 · Will Merrill, Ashish Sabharwal

We exactly characterize the expressive power of transformers with padding tokens as $\mathsf{TC}^0$, and we also characterize transformers with looping and padding.

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Rethinking Fine-Tuning when Scaling Test-Time Compute: Limiting Confidence Improves Mathematical Reasoning

#3719 · Feng Chen, Allan Raventós, Nan Cheng, Surya Ganguli, Shaul Druckmann

We show that limiting a model's confidence during training can improve test-time scaling in mathematical reasoning.