model-free speculation - NeurIPS 2025

today local_bar

model-free speculation

1 paper across 1 session

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

SuffixDecoding: Extreme Speculative Decoding for Emerging AI Applications

#816 Spotlight · Gabriele Oliaro, Zhihao Jia, Daniel Campos, Aurick Qiao

A model-free speculative decoding method that accelerates agentic AI workloads using suffix trees. Achieves 5.3x speedup on multi-agent tasks.