modularity

2 papers across 2 sessions

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Brain-Like Processing Pathways Form in Models With Heterogeneous Experts

#2011 · Jack Cook, Danyal Akarca, Rui Costa, Jascha Achterberg

Using a heterogeneous Mixture-of-Experts model architecture, we show that brain-like processing pathways form due to inductive biases on processing complexity and expert dropout

Poster Session 4

1 paper

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Universal Cross-Tokenizer Distillation via Approximate Likelihood Matching

#3406 · Benjamin Minixhofer, Ivan Vulić, Edoardo Maria Ponti

We introduce a new method for principled, effective distillation across tokenizers, enabling a number of new applications.