NTT Research, Inc. - NeurIPS 2025

🏛 NTT Research, Inc.

2 papers across 2 sessions

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Projecting Assumptions: The Duality Between Sparse Autoencoders and Concept Geometry

#1005 · Sai Sumedh R. Hindupur, Ekdeep S Lubana, Thomas Fel, Demba Ba

We show that Sparse Autoencoders (SAEs) are inherently biased toward detecting only a subset of concepts in model activations shaped by their internal assumptions, highlighting the need for concept geometry-aware design of novel SAE architectures.

Poster Session 5

1 paper

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

In-Context Learning Strategies Emerge Rationally

#1015 · Daniel Wurgaft, Ekdeep S Lubana, Core Francisco Park, Hidenori Tanaka, Gautam Reddy, Noah Goodman