Cascaded LLMs

1 paper across 1 session

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Cascaded Language Models for Cost-Effective Human–AI Decision-Making

#3501 · Claudio Fanconi, Mihaela van der Schaar

We propose a Cascaded multi-LLM framework with deferral and abstention policies and online learning to balance accuracy, cost, and abstention, delegating tasks across models and humans to improve efficiency in QA tasks.