LLM Routing

5 papers across 3 sessions

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

RAGRouter: Learning to Route Queries to Multiple Retrieval-Augmented Language Models

#4107 · Jiarui Zhang, Xiangyu Liu, Yong Hu, Chaoyue Niu, Fan Wu, Guihai Chen

Poster Session 4

2 papers

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Let the LLM Stick to Its Strengths: Learning to Route Economical LLM

#5510 · Yi-Kai Zhang, Shiyin Lu, Qingguo Chen, Weihua Luo, De-Chuan Zhan, Han-Jia Ye

Cost-Aware Contrastive Routing for LLMs

#4000 Spotlight · Reza Shirkavand, Shangqian Gao, Peiran Yu, Heng Huang

CSCR embeds both prompts and LLMs into a shared space using fast logit or perplexity fingerprints. A cost‑banded InfoNCE loss trains the space to balance quality against cost. It generalizes to unseen models and out‑of‑distribution prompts.

Poster Session 6

2 papers

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Efficient Training-Free Online Routing for High-Volume Multi-LLM Serving

#3406 · Fangzhou Wu, Sandeep Silwal

We propose the first efficient, training-free online routing algorithm for high-volume LLM serving under token budget constraints, achieving significant improvements in both routing performance and cost efficiency.

Lookahead Routing for Large Language Models

#3603 · Canbin Huang, Tianyuan Shi, Yuhua Zhu, Ruijun Chen, Xiaojun Quan