Together AI - NeurIPS 2025

🏛 Together AI

3 papers across 2 sessions

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Weaver: Shrinking the Generation-Verification Gap by Scaling Compute for Verification

#3714 · Jon Saad-Falcon, Estefany Kelly Buchanan, Mayee Chen, Tzu-Heng (Brian) Huang, Brendan McLaughlin, Tanvir Bhathal, Shang Zhu, Ben Athiwaratkun, Frederic Sala, Scott Linderman, Azalia Mirhoseini, Christopher Ré

We introduce Weaver, a framework that combines multiple weak verifiers to effectively select responses in repeated sampling, achieving frontier model accuracy without supervised fine-tuning, while reducing verification costs by 99.97%.

Poster Session 4

2 papers

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

AutoJudge: Judge Decoding Without Manual Annotation

#2010 · Roman Garipov, Fedor Velikonivtsev, Ivan Ermakov, Ruslan Svirschevski, Vage Egiazarian, Max Ryabinin

Automatically detecting task-specific important tokens to accelerate speculative decoding

Exploring Diffusion Transformer Designs via Grafting

#3601 · Keshigeyan Chandrasegaran, Michael Poli, Dan Fu, Dongjun Kim, Lea M. Hadzic, Manling Li, Agrim Gupta, Stefano Massaroli, Azalia Mirhoseini, Juan Carlos Niebles, Stefano Ermon, Fei-Fei Li

We propose grafting, a simple approach to materialize new architectures by editing pretrained diffusion transformers. It enables architectural exploration under small compute budgets.