Compositional generalization

6 papers across 3 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Scalable Evaluation and Neural Models for Compositional Generalization

#2607 · Giacomo Camposampiero, Pietro Barbiero, Michael Hersche, Roger Wattenhofer, Abbas Rahimi

We introduce a novel, scalable framework to evaluate compositional generalization, leverage it to evaluate more than 5k models, and propose a family of neural models pushing the Pareto frontier on this task.

Poster Session 3

2 papers

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

A compressive-expressive communication framework for compositional representations

#2704 · Rafael Elberg, Felipe del Río, Mircea Petrache, Denis Parra

We propose CELEBI, a self-supervised communication game that promotes compositionality via three novel mechanisms for modulating expressivity and efficiency.

Role Bias in Diffusion Models: Diagnosing and Mitigating through Intermediate Decomposition

#4516 · Sina Malakouti, Adriana Kovashka

Poster Session 5

3 papers

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Scaling can lead to compositional generalization

#4000 Spotlight · Florian Redhardt, Yassir Akram, Simon Schug

Scaling neural networks leads to compositional generalization if the training distribution sufficiently covers the task space.

When No Paths Lead to Rome: Benchmarking Systematic Neural Relational Reasoning

#5016 · Anirban Das, Muhammad Irtaza Khalid, Rafael Peñaloza, Steven Schockaert

Reasoning models can learn rules from simple examples and be able to solve complex ones using the rules. We identify a broad class of everyday reasoning rules that current models cannot learn and build large datasets requiring such rule learning.

Ineq-Comp: Benchmarking Human-Intuitive Compositional Reasoning in Automated Theorem Proving of Inequalities

#1808 · Haoyu Zhao, Yihan Geng, Shange Tang, Yong Lin, Bohan Lyu, Hongzhou Lin, Chi Jin, Sanjeev Arora

We introduce Ineq-Comp, a benchmark for testing compositional reasoning in formal inequality proving. Simple human-intuitive transformations cause major accuracy drops, showing that current LLM provers lack robust compositional generalization.